RU2772349C2 - Artificial nucleic acid molecules - Google Patents

Artificial nucleic acid molecules Download PDF

Info

Publication number
RU2772349C2
RU2772349C2 RU2018110872A RU2018110872A RU2772349C2 RU 2772349 C2 RU2772349 C2 RU 2772349C2 RU 2018110872 A RU2018110872 A RU 2018110872A RU 2018110872 A RU2018110872 A RU 2018110872A RU 2772349 C2 RU2772349 C2 RU 2772349C2
Authority
RU
Russia
Prior art keywords
utr
seq
nucleic acid
acid molecule
artificial nucleic
Prior art date
Application number
RU2018110872A
Other languages
Russian (ru)
Other versions
RU2018110872A (en
RU2018110872A3 (en
Inventor
Томас ШЛАКЕ
Штефани ГРУНД
Original Assignee
Куревак Аг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Куревак Аг filed Critical Куревак Аг
Priority claimed from PCT/EP2016/001417 external-priority patent/WO2017036580A1/en
Publication of RU2018110872A publication Critical patent/RU2018110872A/en
Publication of RU2018110872A3 publication Critical patent/RU2018110872A3/ru
Application granted granted Critical
Publication of RU2772349C2 publication Critical patent/RU2772349C2/en

Links

Images

Abstract

'FIELD: biotechnology.
SUBSTANCE: invention relates to biotechnology, namely to an artificial nucleic acid molecule containing at least one open reading frame and at least one 3'-UTR element and optionally at least one 5'-UTR element, where the specified artificial nucleic acid molecule differs in a high translation efficiency compared to a translation efficiency of a reference nucleic acid molecule that is identical to the artificial nucleic acid molecule except for 3'-UTR element. The invention also relates to an expression vector, a cell for the production of polypeptide or peptide, pharmaceutical compositions for the vaccination or gene therapy, their use as a vaccine or gene therapy, a method for the production of an artificial molecule, a method for ensuring an increased translation efficiency, a vaccination kit, a gene therapy kit and the use of 3'-UTR element.
EFFECT: obtaining an artificial nucleic acid molecule.
31 cl, 9 dwg, 8 tbl, 3 ex

Description

Настоящее изобретение относится к искусственным молекулам нуклеиновой кислоты, которые содержат открытую рамку считывания, элемент 3'-нетранслируемой области (3'-UTR-элемент) и/или элемент 5'-нетранслируемой области (5'-UTR-элемент) и необязательно поли(А)-последовательность и/или сигнал полиаденилирования. Изобретение относится также к вектору, содержащему 3'-UTR-элемент и/или 5'-UTR-элемент, к клетке, содержащей искусственную молекулу нуклеиновой кислоты или вектор, к фармацевтической композиции, содержащей искусственную молекулу нуклеиновой кислоты или вектор, и к набору, содержащему искусственную молекулу нуклеиновой кислоты, вектор и/или фармацевтическую композицию, предпочтительно предназначенным для применения в области генной терапии и/или генетической вакцинации.The present invention relates to artificial nucleic acid molecules that contain an open reading frame, a 3'-untranslated region element (3'-UTR element) and/or a 5'-untranslated region element (5'-UTR element) and optionally poly( A) sequence and/or polyadenylation signal. The invention also relates to a vector containing a 3'-UTR element and/or a 5'-UTR element, to a cell containing an artificial nucleic acid molecule or a vector, to a pharmaceutical composition containing an artificial nucleic acid molecule or a vector, and to a kit, containing an artificial nucleic acid molecule, a vector and/or a pharmaceutical composition, preferably intended for use in the field of gene therapy and/or genetic vaccination.

Генная терапия и генетическая вакцинация относятся к наиболее перспективным и быстро развивающимся методам современной медицины. Их можно применять при разработке высокоспецифических и индивидуальных подходов для лечения широкого разнообразия заболеваний. Мишенью для таких подходов к лечению могут являться, прежде всего, врожденные генетические заболевания, а также злокачественные или связанные с опухолью заболевания и также воспалительные заболевания. Подразумевается, что с помощью указанных подходов можно предупреждать раннее начало таких заболеваний.Gene therapy and genetic vaccination are among the most promising and rapidly developing methods of modern medicine. They can be applied in the development of highly specific and individual approaches for the treatment of a wide variety of diseases. Such treatment approaches can primarily target congenital genetic diseases, as well as malignant or tumor-related diseases and also inflammatory diseases. It is understood that these approaches can prevent the early onset of such diseases.

Основная концептуальная идея генной терапии заключается в осуществлении соответствующей модуляции нарушенной генной экспрессии, ассоциированной с патологическими состояниями при конкретных заболеваниях. Патологически измененная генная экспрессия может приводить к недостатку или сверхпроизводству имеющих важное значение генных продуктов, например, сигнальных факторов, таких как гормоны, факторы, обусловленные генами «домашнего хозяйства», метаболические ферменты, структурные белки или т.п. Измененная генная экспрессия может быть обусловлена не только нарушением регуляции транскрипции и/или трансляции, но также и мутациями в ОРС, кодирующей конкретный белок. Патологические мутации могут вызываться, например, хромосомной аберрацией или более специфическими мутациями, такими как точечные мутации или мутации, приводящие к сдвигу рамки считывания, которые все приводят к ограничению функциональности и возможно к полной потере функции генного продукта. Однако нарушение регуляции транскрипции или трансляции может иметь место также в том случае, если мутации воздействуют на гены, кодирующие белки, которые участвуют в механизме транскрипции или трансляции в клетке. Такие мутации могут приводить к патологической повышающей или понижающей регуляции генов, которые сами по себе являются функциональными. Гены, кодирующие генные продукты, которые обладают такими регуляторными функциями, могут представлять собой, например, гены факторов транскрипции, сигнальных рецепторов, белков-мессенджеров или т.п. Однако, потеря функции таких генов, кодирующих регуляторные белки, при определенных обстоятельствах может быть восстановлена путем искусственной интродукции других факторов, функционирующих по ходу транскрипции относительно нарушенного генного продукта. Такие дефекты генов можно компенсировать также с помощью генной терапии посредством замены самого поврежденного гена.The main conceptual idea of gene therapy is the implementation of appropriate modulation of impaired gene expression associated with pathological conditions in specific diseases. Pathologically altered gene expression may result in a deficiency or overproduction of important gene products, for example, signaling factors such as hormones, housekeeping gene factors, metabolic enzymes, structural proteins, or the like. Altered gene expression may be due not only to dysregulation of transcription and/or translation, but also to mutations in the ORF encoding a particular protein. Pathological mutations can be caused, for example, by a chromosomal aberration or by more specific mutations such as point or frameshift mutations, all of which result in limited functionality and possibly complete loss of function of the gene product. However, dysregulation of transcription or translation can also occur if mutations affect genes encoding proteins that are involved in the mechanism of transcription or translation in the cell. Such mutations can lead to abnormal up- or down-regulation of genes that are themselves functional. Genes encoding gene products that have such regulatory functions may be, for example, genes for transcription factors, signaling receptors, messenger proteins, or the like. However, the loss of function of such genes encoding regulatory proteins can, under certain circumstances, be restored by the artificial introduction of other factors functioning downstream of the disrupted gene product. Such gene defects can also be compensated by gene therapy by replacing the damaged gene itself.

Генетическая вакцинация позволяет вызывать требуемый иммунный ответ на выбранные антигены, такие как обладающие определенными характеристиками компоненты бактериальных поверхностей, вирусные частицы, опухолевые антигены или т.п. В целом, вакцинация представляет собой одно из наиболее важных достижений современной медицины. Однако, в настоящее время эффективные вакцины доступны только для ограниченного количества заболеваний. Поэтому инфекции, которые нельзя предупреждать путем вакцинации, все еще поражают каждый год миллионы людей.Genetic vaccination makes it possible to induce the desired immune response to selected antigens, such as characteristic components of bacterial surfaces, viral particles, tumor antigens, or the like. In general, vaccination represents one of the most important achievements of modern medicine. However, effective vaccines are currently only available for a limited number of diseases. Therefore, infections that cannot be prevented by vaccination still affect millions of people every year.

В целом, вакцины можно подразделять на вакцины «первого», «второго» и «третьего» поколения. Вакцины «первого поколения», как правило, представляют собой вакцины, содержащие цельные организмы. Они основаны либо на живых и ослабленных, либо на убитых патогенах, например, вирусах, бактериях или т.п. Основным недостатком живых и ослабленных вакцин является риск реверсии с образованием угрожающих жизни вариантов. Таким образом, указанные патогены, хотя они и являются ослабленными, все еще могут нести присущие им непредсказуемые риски. Убитые патогены могут не являться достаточно эффективными для создания специфического иммунного ответа. Для того чтобы минимизировать указанные риски, были разработаны вакцины «второго поколения». Как правило, они представляют собой субъединичные вакцины, состоящие из компонентов определенных антигенов или рекомбинантных белков, происходящих из патогенов.In general, vaccines can be classified into "first", "second" and "third" generation vaccines. "First generation" vaccines are generally vaccines containing whole organisms. They are based either on live and attenuated or killed pathogens such as viruses, bacteria or the like. The main disadvantage of live and attenuated vaccines is the risk of reversion to form life-threatening variants. Thus, these pathogens, although attenuated, may still carry inherent unpredictable risks. Killed pathogens may not be effective enough to create a specific immune response. In order to minimize these risks, "second generation" vaccines have been developed. As a rule, they are subunit vaccines, consisting of components of certain antigens or recombinant proteins derived from pathogens.

Генетические вакцины, т.е. вакцины для генетической вакцинации, как правило, называют вакцинами «третьего поколения». Они, как правило, состоят из созданных методами генной инженерии молекул нуклеиновой кислоты, которые обеспечивают экспрессию in vivo фрагментов пептида или белка (антигена), характерных для патогена или опухолевого антигена. При введении пациенту экспрессия генетических вакцин происходит после поглощения клетками-мишенями. Экспрессия введенных нуклеиновых кислот приводит к производству кодируемых белков. В том случае, когда эти белки распознаются иммунной системой пациента как чужие, запускается иммунный ответ.Genetic vaccines, i.e. vaccines for genetic vaccination are generally referred to as "third generation" vaccines. They typically consist of genetically engineered nucleic acid molecules that provide in vivo expression of peptide or protein (antigen) fragments characteristic of a pathogen or tumor antigen. When administered to a patient, expression of genetic vaccines occurs after uptake by target cells. Expression of the introduced nucleic acids results in the production of encoded proteins. When these proteins are recognized by the patient's immune system as foreign, an immune response is triggered.

Как следует из вышеизложенного, оба метода, и генная терапия, и генетическая вакцинация, по существу основаны на введении молекул нуклеиновой кислоты пациенту и последующей транскрипции и/или трансляции кодируемой генетической информации. Альтернативно этому, генетическая вакцинация или генная терапия может включать также методы, которые предусматривают выделение специфических клеток из организма пациента, подлежащего лечению, последующую трансфекцию ех vivo указанных клеток и повторное введение обработанных клеток пациенту.As follows from the above, both methods, and gene therapy, and genetic vaccination, essentially based on the introduction of nucleic acid molecules to the patient and subsequent transcription and/or translation of encoded genetic information. Alternatively, genetic vaccination or gene therapy may also include methods that involve isolating specific cells from the body of the patient to be treated, then ex vivo transfecting said cells, and re-introducing the treated cells to the patient.

В контексте генной терапии или генетической вакцинации в качестве молекул нуклеиновой кислоты можно вводить как ДНК, так и РНК. Известно, что ДНК является относительно стабильной и с ней проще манипулировать. Однако применение ДНК сопряжено с риском нежелательного встраивания введенных ДНК-фрагментов в геном пациента, что может приводить к мутагенным действиям, таким как потеря функции нарушенных генов. Другим риском является то, что происходит нежелательное возникновение антител к ДНК. Еще одним недостатком является ограниченный уровень экспрессии кодируемого пептида или белка, достижимый при введении ДНК, поскольку ДНК должна проникнуть в ядро для того, чтобы произошла ее транскрипция перед тем, как могла осуществляться трансляция полученной в результате этого мРНК. Уровень экспрессии введенной ДНК может зависеть, среди прочего, от присутствия специфических факторов транскрипции, которые регулируют транскрипцию ДНК. В случае отсутствия таких факторов транскрипция ДНК не приводит к получению ДНК в достаточных количествах. В результате достигаемый уровень транслированного пептида или белка является ограниченным.In the context of gene therapy or genetic vaccination, both DNA and RNA can be administered as nucleic acid molecules. DNA is known to be relatively stable and easier to manipulate. However, the use of DNA carries the risk of undesirably inserting the introduced DNA fragments into the patient's genome, which can lead to mutagenic effects such as loss of function of the disrupted genes. Another risk is that an undesirable occurrence of antibodies to DNA occurs. Another disadvantage is the limited level of expression of the encoded peptide or protein achievable with the introduction of DNA, since the DNA must enter the nucleus in order for it to be transcribed before the resulting mRNA can be translated. The level of expression of the introduced DNA may depend, inter alia, on the presence of specific transcription factors that regulate DNA transcription. In the absence of such factors, DNA transcription does not result in DNA in sufficient quantities. As a result, the level of translated peptide or protein achievable is limited.

При использовании РНК вместо ДНК для генной терапии или генетической вакцинации риск нежелательной интеграции в геном и образования антител к ДНК сводится к минимуму или устраняется. Однако считается, что РНК являться относительно нестабильной молекулой, которая может легко расщепляться под действием повсеместно присутствующих РНКаз.When using RNA instead of DNA for gene therapy or genetic vaccination, the risk of unwanted integration into the genome and the formation of antibodies to DNA is minimized or eliminated. However, RNA is considered to be a relatively unstable molecule that can be easily cleaved by the ubiquitous RNases.

Расщепление РНК in vivo вносит вклад в регулирование времени полужизни РНК. Этот эффект был изучен, и было установлено, что он строго регулирует экспрессию эукариотических генов (Friedel и др., Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17), 2009, сс. 1-12). Таким образом, каждая встречающаяся в естественных условиях мРНК имеет свое индивидуальное время полужизни, зависящее от гена, из которого происходит мРНК, и от типа клетки, в которой происходит экспрессия. Оно вносит вклад в регуляцию уровня экспрессии рассматриваемого гена. Нестабильные РНК важны для реализации кратковременной генной экспрессии в определенные моменты времени. Однако РНК с продолжительным временем жизни могут ассоциироваться с накоплением различных белков или с непрерывной экспрессией генов. Время полужизни мРНК in vivo может зависеть также от факторов окружающей среды, таких как обработка гормонами, что продемонстрировано, например, для мРНК инсулин-подобного фактора роста I, актина, и альбумина (Johnson и др.. Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates и RNA стабильность insulin-like growth factor I, actin, и albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., т. 88, 1991, сс. 5287-5291).Cleavage of RNA in vivo contributes to the regulation of RNA half-life. This effect has been studied and found to strongly regulate eukaryotic gene expression (Friedel et al., Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17), 2009, pp. 1-12 ). Thus, each naturally occurring mRNA has its own individual half-life, depending on the gene from which the mRNA originates and on the type of cell in which expression occurs. It contributes to the regulation of the level of expression of the gene in question. Unstable RNAs are important for transient gene expression at specific time points. However, long-lived RNAs may be associated with the accumulation of various proteins or with continuous gene expression. The in vivo half-life of mRNAs may also depend on environmental factors such as hormone treatment, as demonstrated for example for mRNAs of insulin-like growth factor I, actin, and albumin (Johnson et al. Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., vol. 88, 1991, pp. 5287-5291).

Для генной терапии и генетической вакцинации, как правило, требуется стабильная РНК. Это обусловлено, с одной стороны, тем фактом, что, как правило, требуется, чтобы in vivo происходило накопление продукта, кодируемого последовательностью РНК. С другой стороны, РНК должна сохранять свою структурную и функциональную целостность при приготовлении пригодной лекарственной формы, в процессе ее хранения и при введении. Поэтому предпринимались усилия для создания стабильных молекул РНК для генной терапии или генетической вакцинации с целью предупреждения их от раннего разложения или расщепления.Gene therapy and genetic vaccination generally require stable RNA. This is due, on the one hand, to the fact that, as a rule, it is required that in vivo accumulation of the product encoded by the RNA sequence takes place. On the other hand, RNA must maintain its structural and functional integrity during the preparation of a suitable dosage form, during its storage and administration. Therefore, efforts have been made to create stable RNA molecules for gene therapy or genetic vaccination in order to prevent them from early degradation or cleavage.

Опубликованы данные о том, что содержание G/C в молекулах нуклеиновой кислоты может оказывать влияние на ее стабильность. Так, нуклеиновые кислоты, содержащие в большем количестве остатки гуанина (G) и/или цитозина (С), могут быть функционально более стабильными, чем нуклеиновые кислоты, содержащие большое количество адениновых (А) и тиминовых (Т) или урациловых (U) нуклеотидов. В этом контексте в WO 02/098443 предложена фармацевтическая композиция, содержащая мРНК, которая стабилизирована посредством модификаций последовательности в кодирующей области. Такая модификация последовательности является возможной благодаря вырожденности генетического кода. В соответствии с этим кодоны, содержащие менее предпочтительную комбинацию нуклеотидов (менее предпочтительную с точки зрения стабильности РНК), могут быть заменены на альтернативные кодоны без изменения кодируемой аминокислотной последовательности. Такой метод стабилизации РНК ограничен тем, что для каждой отдельной молекулы РНК нужно получать конкретную нуклеотидную последовательность, которая не приводит к получению аминокислотной последовательности, отклоняющейся от требуемой. Указанный подход ограничен также тем, что его применяют к кодирующим областям РНК.Data have been published that the content of G/C in nucleic acid molecules can affect its stability. Thus, nucleic acids containing a greater amount of guanine (G) and/or cytosine (C) residues may be functionally more stable than nucleic acids containing a large number of adenine (A) and thymine (T) or uracil (U) nucleotides. . In this context, WO 02/098443 proposes a pharmaceutical composition containing mRNA that is stabilized by sequence modifications in the coding region. Such sequence modification is possible due to the degeneracy of the genetic code. Accordingly, codons containing a less preferred combination of nucleotides (less preferred in terms of RNA stability) can be changed to alternative codons without changing the encoded amino acid sequence. This method of RNA stabilization is limited by the fact that for each individual RNA molecule it is necessary to obtain a specific nucleotide sequence that does not lead to an amino acid sequence that deviates from the required one. This approach is also limited in that it is applied to RNA coding regions.

При поиске альтернативного подхода к стабилизации мРНК было установлено, что встречающиеся в естественных условиях молекулы эукариотической мРНК содержат характерные стабилизирующие элементы. Например, они могут содержать так называемые нетранслируемые области (UTR) на своем 5'-конце (5'-UTR) и/или на своем 3'-конце (3'-UTR), а также другие структурные особенности, такие как 5'-кэп-структура или 3'-поли(А)-хвост. Как 5'-UTR, так и 3'-UTR, как правило, транскрибируются с геномной ДНК и, следовательно, представляют собой элемент незрелой мРНК. Характерные структурные особенности зрелой мРНК, такие как 5'-кэп и 3'- поли(А)-хвост (которые обозначают так же, как поли(А)-хвост или поли(А)-последовательность), как правило, добавляются к транскрибированной (незрелой) мРНК в ходе процессинга мРНК.In the search for an alternative approach to mRNA stabilization, it was found that naturally occurring eukaryotic mRNA molecules contain characteristic stabilizing elements. For example, they may contain so-called untranslated regions (UTRs) at their 5' end (5'-UTR) and/or at their 3' end (3'-UTR), as well as other structural features such as 5' -cap-structure or 3'-poly(A)-tail. Both the 5'-UTR and the 3'-UTR are typically transcribed from genomic DNA and are therefore an immature mRNA element. Structural features of the mature mRNA, such as a 5' cap and a 3' poly(A) tail (which are also referred to as the poly(A) tail or poly(A) sequence), are typically added to the transcribed (immature) mRNA during mRNA processing.

3'-поли(А)-хвост, как правило, представляет собой монотонный участок последовательности, который состоит из аденозиновых нуклеотидов, добавленный к 3'-концу транскрибированной мРНК. Он может содержать вплоть до примерно 400 аденозиновых нуклеотидов. Установлено, что длина такого 3'-поли(А)-хвоста может являться элементом, имеющим решающее значение для стабильности индивидуальной мРНК.The 3'-poly(A) tail is typically a monotonic stretch of sequence that consists of adenosine nucleotides added to the 3' end of the transcribed mRNA. It may contain up to about 400 adenosine nucleotides. It has been found that the length of such a 3'-poly(A)-tail may be an element of decisive importance for the stability of an individual mRNA.

Было продемонстрировано также, что 3'-UTR мРНК α-глобина может являться важным фактором, обеспечивающим хорошо известную стабильность мРНК α-глобина (Rodgers и др., Regulated α-globin mRNA decay is a cytoplasmic еще t proceeding through 3'-to-5' exosome-dependent decapping, RNA, 8, 2002, сс. 1526-1537). 3'-UTR мРНК α-глобина, по-видимому, участвует в формировании специфического рибонуклеопротеинового комплекса, α-комплекса, присутствие которого коррелирует со стабильностью мРНК in vitro (Wang и др., An mRNA стабильность complex functions with poly(A)-binding protein to stabilize mRNA in vitro. Molecular и Cellular biology, том 19, №7, июль 1999 г., сс. 4552-4560).It has also been demonstrated that the 3'-UTR of α-globin mRNA may be an important contributor to the well-known stability of α-globin mRNA (Rodgers et al., Regulated α-globin mRNA decay is a cytoplasmic still t proceeding through 3'-to- 5' exosome-dependent decapping, RNA, 8, 2002, pp. 1526-1537). The 3'-UTR of α-globin mRNA appears to be involved in the formation of a specific ribonucleoprotein complex, the α-complex, whose presence correlates with in vitro mRNA stability (Wang et al., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro Molecular and Cellular Biology, Vol. 19, No. 7, July 1999, pp. 4552-4560).

Кроме того, для UTR в мРНК рибосомального белка была выявлена важная регуляторная функция: хотя 5'-UTR мРНК рибосомального белка контролирует ассоциированную с ростом трансляцию мРНК, строгость указанной регулировки обеспечивается соответствующей 3'-UTR в мРНК рибосомального белка (Ledda и др.. Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, т.344, 2005, сс. 213-220). Этот механизм оказывает влияние на специфическую схему экспрессии рибосомальных белков, которые, как правило, транскрибируются постоянным образом, вследствие чего мРНК некоторых рибосомальных белков, таких как рибосомальный белок S9 или рибосомальный белок L32, называют генами «домашнего хозяйства» (Janovick-Guretzky и др.. Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, и Dietary Treatment, J. Dairy Sci., т. 90, 2007, сс. 2246-2252). Таким образом, ассоциированная с ростом схема экспрессии рибосомальных белков в основном обусловлена регуляцией на уровне трансляции.In addition, an important regulatory function has been identified for the UTR in ribosomal protein mRNA: although the 5'-UTR of ribosomal protein mRNA controls growth-associated mRNA translation, the rigor of this regulation is provided by the corresponding 3'-UTR in ribosomal protein mRNA (Ledda et al.. Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, vol. 344, 2005, pp. 213-220). This mechanism affects the specific expression pattern of ribosomal proteins, which are usually transcribed in a constant manner, as a result of which the mRNA of some ribosomal proteins, such as the S9 ribosomal protein or the L32 ribosomal protein, are called housekeeping genes (Janovick-Guretzky et al. Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., vol. 90, 2007, pp. 2246-2252). Thus, the expression pattern of ribosomal proteins associated with growth is mainly due to regulation at the level of translation.

В WO 2014/164253 A1 описаны некоторые специфические молекулы нуклеиновой кислоты, имеющие 5'-UTR и/или 3'-UTR, но не указаны подробности, касающиеся эффективности трансляции таких молекул.WO 2014/164253 A1 describes some specific nucleic acid molecules having a 5'-UTR and/or 3'-UTR, but does not provide details regarding the efficiency of translation of such molecules.

Вне зависимости от факторов, влияющих на стабильность мРНК, эффективность трансляции введенных молекул нуклеиновой кислоты клетками-мишенями или тканью имеет решающее значение для любого подхода с использованием молекул нуклеиновой кислоты для генной терапии или генетической вакцинации. Как следует из процитированных выше примеров, структурные особенности, такие как UTR, 5'-кэп и 3'-поли(А)-хвост, наряду с регуляцией стабильности, регулируют также трансляцию большинства мРНК. В этом контексте, опубликованы данные о том, что длина поли(А)-хвоста может играть важную роль также и для эффективности трансляции. Однако стабилизирующие 3'-элементы могут оказывать также ослабляющее действие на трансляцию.Regardless of the factors affecting mRNA stability, the efficiency of translation of the introduced nucleic acid molecules by target cells or tissue is critical to any approach using nucleic acid molecules for gene therapy or genetic vaccination. As follows from the examples cited above, structural features such as UTR, 5'-cap and 3'-poly(A)-tail, along with the regulation of stability, also regulate the translation of most mRNA. In this context, published data suggest that the length of the poly(A) tail may also play an important role in the efficiency of translation. However, 3' stabilizing elements can also have a translational dampening effect.

В основу настоящего изобретения была положена задача создать молекулы нуклеиновой кислоты, которые можно применять для генной терапии и/или генетической вакцинации. Задача изобретения заключалась, прежде всего, в том, чтобы создать виды мРНК, которые стабилизированы для защиты от преждевременного разложения или расщепления, но которые не характеризуются значительной функциональной потерей с точки зрения эффективности трансляции. Задачей изобретения являлось также создание искусственной молекулы нуклеиновой кислоты, предпочтительно мРНК, отличающейся высокой эффективностью трансляции. Одна из конкретных задач изобретения заключалась в создании мРНК, позволяющей повышать эффективность трансляции (производства рибосомами соответствующего кодируемого белка), например, по сравнению с референс-молекулой нуклеиновой кислоты (референс-мРНК). Другая задача настоящего изобретения заключалась в том, чтобы создать молекулы нуклеиновой кислоты, кодирующие такие обладающие преимуществами виды мРНК, которые могут быть пригодными для применения в генной терапии и/или генетической вакцинации. Следующая задача настоящего изобретения заключалась в том, чтобы создать фармацевтическую композицию для применения в генной терапии и/или генетической вакцинации. В целом, задача настоящего изобретения заключалась в создании усовершенствованных видов нуклеиновой кислоты, которые позволяют преодолевать указанные выше недостатки существующего уровня техники с использованием экономичного и простого подхода.The present invention was based on the task of creating nucleic acid molecules that can be used for gene therapy and/or genetic vaccination. The objective of the invention was primarily to create mRNA species that are stabilized to protect against premature degradation or cleavage, but which do not suffer from a significant functional loss in terms of translation efficiency. It was also an object of the invention to provide an artificial nucleic acid molecule, preferably mRNA, which is characterized by high translation efficiency. One of the specific objectives of the invention was to create an mRNA that allows you to increase the efficiency of translation (production by ribosomes of the corresponding encoded protein), for example, compared with a reference nucleic acid molecule (reference mRNA). Another object of the present invention was to provide nucleic acid molecules encoding advantageous mRNA species that may be suitable for use in gene therapy and/or genetic vaccination. A further object of the present invention was to provide a pharmaceutical composition for use in gene therapy and/or genetic vaccination. In general, the aim of the present invention was to provide improved nucleic acid species that overcome the above disadvantages of the prior art using an economical and simple approach.

Задача, положенная в основу настоящего изобретения, решается с помощью объектов изобретения, представленных в формуле изобретения. В частности, при создании настоящего изобретения были идентифицированы UTR-элементы (5'-UTR-элементы и 3'-UTR-элементы), которые обеспечивают высокую эффективность трансляции. Общей характерной особенностью предпочтительных молекул нуклеиновой кислоты, предлагаемых в настоящем изобретении, является то, что все они характеризуются эффективностью трансляции, которая превышает эффективность трансляции известных ранее молекул нуклеиновой кислоты. Предложен также анализ для определения высокой эффективности трансляции относительно референс-молекулы нуклеиновой кислоты.The problem underlying the present invention is solved with the help of the objects of the invention presented in the claims. In particular, the present invention has identified UTR elements (5'-UTR elements and 3'-UTR elements) that provide high translation efficiency. A common feature of the preferred nucleic acid molecules of the present invention is that they all have translation efficiencies that exceed those of previously known nucleic acid molecules. An assay is also provided to determine high translation efficiency relative to a reference nucleic acid molecule.

Настоящее изобретение было создано при поддержке правительства США в рамках соглашения № HR 0011-11-3-0001, подписанного DARPA (Агентство передовых оборонных исследовательских проектов). Правительство США обладает определенными правами на изобретение.The present invention was made with the support of the US government under agreement No. HR 0011-11-3-0001 signed by DARPA (Defense Advanced Research Projects Agency). The US government has certain rights to the invention.

Для целей ясности и удобочитаемости ниже даны следующие определения. Любые технические характеристики, указанные в этих определениях, применимы к каждому и всем вариантам осуществления изобретения. В контексте этих вариантов осуществления изобретения специально могут быть даны дополнительные определения и пояснения.For purposes of clarity and readability, the following definitions are given below. Any specifications specified in these definitions apply to each and all embodiments of the invention. In the context of these embodiments of the invention, further definitions and explanations may be specifically given.

Адаптивный иммунный ответ: Как правило, под адаптивным иммунным ответом понимают антигенспецифический ответ иммунной системы. Специфичность в отношении антигена позволяет вырабатывать ответы, приспособленные к специфическим патогенам или инфицированным патогеном клеткам. Способность создавать такие приспособленные ответы, как правило, поддерживается в организме «клетками памяти». Если патоген инфицирует организм более одного раза, то указанные специфические клетки памяти используются для его быстрой элиминации. В этом контексте первая стадия адаптивного иммунного ответа представляет собой активацию наивных антигенспецифических Т-клеток или других иммунных клеток, способных индуцировать антигенспецифический иммунный ответ, антигенпрезентирующими клетками. Это происходит в лимфоидных тканях и органах, через которые постоянно проходят наивные Т-клетки. Три типа клеток, которые могут служить в качестве антигенпрезентирующих клеток, представляют собой дендритные клетки, макрофаги и В-клетки. Каждая из указанных клеток выполняет отдельную функцию при вызывании иммунных ответов. Дендритные клетки могут поглощать антигены посредством фагоцитоза и макропиноцитоза, и они могут стимулироваться при контакте, например, с чужим антигеном, к миграции в местную лимфоидную ткань, где может происходить их дифференцировка в зрелые дендритные клетки. Макрофаги поглощают находящиеся в форме частиц антигены, такие как бактерии, и могут индуцироваться инфекционными агентами или другими соответствующими стимулами и экспрессировать в результате этого молекулы ГКГС. Уникальная способность В-клеток к связыванию и интернализации растворимых белковых антигенов посредством своих рецепторов также может иметь важное значение для индукции Т-клеток. ГКГС-молекулы, как правило, ответственны за презентацию антигена Т-клеткам. При этом презентация антигена на молекулах ГКГС приводит к активации Т-клеток, что индуцирует их пролиферацию и дифференцировку в «вооруженные» эффекторные Т-клетки. Наиболее важной функцией эффекторных Т-клеток является уничтожение (цитолиз) инфицированных клеток цитотоксическими CD8+-Т-клетками и активация макрофагов Th1-клетками, что в совокупности создает опосредованный клетками (клеточный) иммунитет, а активация В-клеток как Th2-, так и Th1-клетками, приводящая к образованию различных классов антител, запускает гуморальный иммунный ответ. Т-клетки распознают антиген посредством своих Т-клеточных рецепторов, которые не распознают антиген и не связываются с ним непосредственно, но вместо этого распознают короткие пептидные фрагменты, например, выведенных из патогена белковых антигенов, например, так называемые эпитопы, которые связываются с молекулами ГКГС на поверхностях других клеток.Adaptive immune response: Typically, adaptive immune response refers to an antigen-specific response of the immune system. Antigen specificity allows for responses tailored to specific pathogens or pathogen-infected cells. The ability to create such adapted responses is usually maintained in the body by "memory cells". If the pathogen infects the body more than once, then these specific memory cells are used for its rapid elimination. In this context, the first stage of an adaptive immune response is the activation of naïve antigen-specific T cells or other immune cells capable of inducing an antigen-specific immune response by antigen-presenting cells. This occurs in lymphoid tissues and organs, through which naive T cells constantly pass. Three types of cells that can serve as antigen presenting cells are dendritic cells, macrophages, and B cells. Each of these cells performs a separate function in inducing immune responses. Dendritic cells can take up antigens via phagocytosis and macropinocytosis, and they can be stimulated upon contact with, for example, a foreign antigen, to migrate to the local lymphoid tissue where they can differentiate into mature dendritic cells. Macrophages engulf particulate antigens such as bacteria and can be induced by infectious agents or other appropriate stimuli and thereby express MHC molecules. The unique ability of B cells to bind and internalize soluble protein antigens through their receptors may also be important for T cell induction. MHC molecules are generally responsible for antigen presentation to T cells. At the same time, antigen presentation on MHC molecules leads to the activation of T cells, which induces their proliferation and differentiation into “armed” effector T cells. The most important function of effector T cells is the destruction (cytolysis) of infected cells by cytotoxic CD8 + T cells and the activation of macrophages by Th1 cells, which together create cell-mediated (cellular) immunity, and the activation of B cells by both Th2 and Th1 cells, leading to the formation of various classes of antibodies, triggers a humoral immune response. T cells recognize an antigen through their T cell receptors, which do not recognize the antigen and do not bind to it directly, but instead recognize short peptide fragments, such as pathogen-derived protein antigens, such as so-called epitopes, which bind to MHC molecules on the surfaces of other cells.

Адаптивная иммунная система: Адаптивная иммунная система в основном предназначена для устранения или предупреждения роста патогенов. Как правило, она регулирует адаптивный иммунный ответ, придавая иммунной системе позвоночных способность распознавать и запоминать специфические патогены (для создания иммунитета) и организовывать более сильную атаку в каждом случае при обнаружении патогена. Система обладает высокой способностью к адаптации вследствие соматической гипермутации (процесс ускоренных соматических мутаций) и V(D)J-рекомбинации (необратимая генетическая рекомбинация сегментов гена рецептора антигена). Этот механизм позволяет небольшому количеству генов создавать огромное количество различных рецепторов антигенов, которые затем уникальным образом экспрессируются на каждом индивидуальном лимфоците. Поскольку реаранжировка гена приводит к необратимому изменению ДНК каждой клетки, то все потомство такой клетки должно затем наследовать гены, кодирующие ту же самую рецепторную специфичность, включая В-клетки памяти и Т-клетки памяти, которые имеют решающее значение для долговременного специфического иммунитета.Adaptive immune system: The adaptive immune system is primarily designed to eliminate or prevent the growth of pathogens. Typically, it regulates the adaptive immune response, giving the vertebrate immune system the ability to recognize and remember specific pathogens (to build immunity) and mount a stronger attack each time a pathogen is detected. The system is highly adaptable due to somatic hypermutation (a process of accelerated somatic mutations) and V(D)J recombination (irreversible genetic recombination of antigen receptor gene segments). This mechanism allows a small number of genes to create a huge number of different antigen receptors, which are then uniquely expressed on each individual lymphocyte. Because the rearrangement of a gene results in an irreversible change in the DNA of each cell, all progeny of that cell must then inherit genes encoding the same receptor specificity, including memory B cells and memory T cells, which are critical for long-term specific immunity.

Адъювант/адъювантный компонент: Адъювант или адъювантный компонент в наиболее широком смысле, как правило, представляет собой фармакологический и/или иммунологический агент, который может модифицировать, например, усиливать, действие других агентов, таких как лекарственное средство или вакцина. Это понятие следует рассматривать в широком смысле, и оно относится к широкому спектру субстанций. Как правило, указанные субстанции обладают способностью повышать иммуногенность антигенов. Например, адъюванты могут распознаваться врожденными иммунными системами и, например, могут вызывать врожденный иммунный ответ. «Адъюванты», как правило, не вызывают адаптивный иммунный ответ. Таким образом, «адъюванты» нельзя классифицировать как антигены. Механизм их действия отличен от механизма действий, запускаемых антигенами, которые приводят к адаптивному иммунному ответу.Adjuvant/Adjuvant Component: An adjuvant or adjuvant component in the broadest sense is generally a pharmacological and/or immunological agent that can modify, for example enhance, the effect of other agents such as a drug or vaccine. This concept should be considered in a broad sense, and it refers to a wide range of substances. As a rule, these substances have the ability to increase the immunogenicity of antigens. For example, adjuvants may be recognized by the innate immune systems and, for example, may elicit an innate immune response. "Adjuvants" generally do not elicit an adaptive immune response. Thus, "adjuvants" cannot be classified as antigens. Their mechanism of action is different from that triggered by antigens that lead to an adaptive immune response.

Антиген: В контексте настоящего изобретения понятие «антиген» относится, как правило, к субстанции, которая может распознаваться иммунной системой, предпочтительно адаптивной иммунной системой, и которая обладает способностью запускать антигенспецифический иммунный ответ, например, посредством образования антител и/или антигенспецифических Т-клеток, в качестве компонента адаптивного иммунного ответа. Как правило, антиген может представлять собой или содержать пептид или белок, который может презентироваться ГКГС Т-клеткам. В контексте настоящего изобретения антиген может представлять собой продукт трансляции предложенной молекулы нуклеиновой кислоты, предпочтительно мРНК, представленной в настоящем описании. В этом контексте под антигенами подразумевают также фрагменты, варианты и производные пептидов и белков, содержащие по меньшей мере один эпитоп. В контексте настоящего изобретения наиболее предпочтительными являются опухолевые антигены и патогенные антигены.Antigen: In the context of the present invention, the term "antigen" refers generally to a substance that can be recognized by the immune system, preferably the adaptive immune system, and which has the ability to trigger an antigen-specific immune response, for example, through the formation of antibodies and/or antigen-specific T cells , as a component of the adaptive immune response. Typically, an antigen may be or contain a peptide or protein that can be presented by MHC to T cells. In the context of the present invention, the antigen may be a translation product of the proposed nucleic acid molecule, preferably mRNA, presented in the present description. In this context, antigens also include fragments, variants and derivatives of peptides and proteins containing at least one epitope. In the context of the present invention, tumor antigens and pathogenic antigens are most preferred.

Иными словами, искусственную молекулу нуклеиновой кислоты можно рассматривать как молекулу нуклеиновой кислоты, не встречающуюся в естественных условиях. Такая молекула нуклеиновой кислоты может не встречаться в естественных условиях из-за своей индивидуальной последовательности (которая не встречается в естественных условиях) и/или из-за других модификаций, например, структурных модификаций нуклеотидов, которые не встречаются в естественных условиях. Искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, молекулу РНК или гибридную молекулу, содержащую участки ДНК и РНК. Как правило, искусственные молекулы нуклеиновой кислоты можно конструировать и/или создавать методами генетической инженерии таким образом, чтобы они соответствовали требуемой искусственной последовательности нуклеотидов (гетерологичной последовательности). В этом контексте искусственная последовательность, как правило, представляет собой последовательность, которая не может встречаться в естественных условиях, т.е. отличается от последовательности дикого типа по меньшей мере одним нуклеотидом. Можно считать, что понятие «дикий тип» относится к последовательности, встречающейся в природе. Кроме того, не следует понимать, что понятие «искусственная молекула нуклеиновой кислоты» обозначает «одну единственную молекулу», как правило, оно включает группу идентичных молекул. Следовательно, оно может относиться к множеству идентичных молекул, содержащихся в аликвоте.In other words, an artificial nucleic acid molecule can be considered as a nucleic acid molecule that does not occur naturally. Such a nucleic acid molecule may not occur naturally due to its individual sequence (which does not occur naturally) and/or due to other modifications, such as structural modifications of nucleotides, which do not occur naturally. The artificial nucleic acid molecule may be a DNA molecule, an RNA molecule, or a hybrid molecule containing portions of DNA and RNA. Generally, artificial nucleic acid molecules can be designed and/or genetically engineered to match the desired artificial nucleotide sequence (heterologous sequence). In this context, an artificial sequence is generally one that cannot occur naturally, i.e. differs from the wild-type sequence by at least one nucleotide. We can consider that the concept of "wild type" refers to a sequence found in nature. In addition, it should not be understood that the term "artificial nucleic acid molecule" means "one single molecule", as a rule, it includes a group of identical molecules. Therefore, it may refer to a plurality of identical molecules contained in an aliquot.

Бицистронная РНК. полицистронная РНК: Бицистронная или полицистронная РНК, как правило, представляет собой РНК, предпочтительно мРНК, которая, как правило, может иметь две (бицистронная) или большее количество (полицистронная) открытых рамок считывания (ОРС). В этом контексте открытая рамка считывания представляет собой последовательность, состоящую из нескольких кодонов, которые могут транслироваться в пептид или белок.bicistronic RNA. polycistronic RNA: A bicistronic or polycistronic RNA is typically an RNA, preferably an mRNA, which can typically have two (bicistronic) or more (polycistronic) open reading frames (ORFs). In this context, an open reading frame is a sequence of multiple codons that can be translated into a peptide or protein.

Носитель/полимерный носитель: В контексте изобретения носитель, как правило, может представлять собой соединение, которое облегчает транспорт и/или включение в комплекс другого соединения (карго, полезный груз). Полимерный носитель, как правило, представляет собой носитель, образующий полимер. Носитель может быть связан со своим полезным грузом посредством ковалентного или нековалентного взаимодействия. Носитель может транспортировать нуклеиновые кислоты, например, РНК или ДНК, к клеткам-мишеням. Носитель может (в некоторых вариантах осуществления изобретения) представлять собой катионный компонент.Carrier/Polymer Carrier: In the context of the invention, a carrier can generally be a compound that facilitates the transport and/or incorporation of another compound (cargo, payload). The polymeric carrier, as a rule, is a carrier that forms a polymer. The carrier may be associated with its payload through a covalent or non-covalent interaction. The carrier can transport nucleic acids, such as RNA or DNA, to target cells. The carrier may (in some embodiments of the invention) be a cationic component.

Катионный компонент: Понятие «катионный компонент», как правило, относится к заряженной молекуле, которая является положительно заряженной (катион) при значении рН, составляющем, как правило, от 1 до 9, предпочтительно при значении рН, равном или ниже 9 (например, от 5 до 9), равном или ниже 8 (например, от 5 до 8), равном или ниже 7 (например, от 5 до 7), наиболее предпочтительно при физиологическом значении рН, например, от 7,3 до 7.4. Таким образом, катионный компонент может представлять собой любое положительно заряженное соединение или полимер, предпочтительно катионный пептид или белок, который является положительно заряженным в физиологических условиях, прежде всего в физиологических условиях in vivo. «Катионный пептид или белок» может содержать по меньшей мере одну положительно заряженную аминокислоту, или более чем одну положительно заряженную аминокислоту, например, выбранную из Arg, His, Lys или Orn. Следовательно, «поликатионные» соединения также подпадают под указанное определение, если они несут более одного положительного заряда в указанных условиях.Cationic component: The term "cationic component" generally refers to a charged molecule that is positively charged (cation) at a pH value typically between 1 and 9, preferably at or below pH 9 (e.g., 5 to 9) equal to or less than 8 (eg 5 to 8), equal to or less than 7 (eg 5 to 7), most preferably at physiological pH, eg 7.3 to 7.4. Thus, the cationic component may be any positively charged compound or polymer, preferably a cationic peptide or protein, which is positively charged under physiological conditions, especially in vivo physiological conditions. A "cationic peptide or protein" may contain at least one positively charged amino acid, or more than one positively charged amino acid, for example selected from Arg, His, Lys, or Orn. Therefore, "polycationic" compounds also fall under the specified definition if they carry more than one positive charge under the specified conditions.

5'-Кэп: 5'-Кэп представляет собой структуру, как правило, модифицированную нуклеотидную структуру, которая обычно «завершает (кэпирует)» 5'-конец зрелой мРНК. 5'-Кэп может, как правило, быть образован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида. Предпочтительно 5'-кэп связан с 5'-концом через 5'-5'-трифосфатную связь. 5'-кэп может быть метилирован, например, может представлять собой m7GpppN, где N обозначает концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. Другими примерами структур 5'-кэпа являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или не связанный мостиком метилфосфонатный фрагмент.5' Cap: The 5' cap is a structure, typically a modified nucleotide structure, that typically "caps" the 5' end of a mature mRNA. The 5'-cap can generally be formed by a modified nucleotide, primarily a derivative of a guanine nucleotide. Preferably the 5' cap is linked to the 5' end via a 5'-5' triphosphate bond. The 5' cap may be methylated, eg m7GpppN, where N is the 5' terminal nucleotide of the nucleic acid carrying the 5' cap, typically the 5' end of the RNA. Other examples of 5'-cap structures are glyceryl, inverted deoxy group (fragment) devoid of a nitrogenous base, 4',5'-methylene nucleotide, 1-(beta-D-erythrofuranosyl) nucleotide, 4'-thionucleotide, carbocyclic nucleotide, 1, 5-anhydrohexitol nucleotide, L-nucleotides, alpha-nucleotide, base-modified nucleotide, treopentofuranosyl nucleotide, acyclic 3',4'-seconucleotide, acyclic 3,4-dihydroxybutyl nucleotide, acyclic 3,5-dihydroxypentyl nucleotide, 3'-3 '-Inverted Nucleotide Fragment, 3'-3'-Inverted Nucleotide Fragment, 3'-2'-Inverted Nucleotide Fragment, 3'-2'-Inverted Nucleotide Fragment, 1,4-Butanediol Phosphate, 3'-Phosphoramidate , hexylphosphate, aminohexylphosphate, 3'-phosphate, 3'-phosphorothioate, phosphorodithioate, or a bridged or unbridged methylphosphonate moiety.

Клеточный иммунитет/клеточный иммунный ответ: Клеточный иммунитет относится, как правило, к активации макрофагов, естественных клеток-киллеров (NK), антигенспецифических цитотоксических Т-лимфоцитов и высвобождению различных цитокинов в ответ на антиген. В более общем смысле клеточный иммунитет основан не на антителах, а на активации клеток иммунной системы. Как правило, клеточный иммунный ответ может характеризоваться, например, активацией антигенспецифических цитотоксических Т-лимфоцитов, которые способны индуцировать апоптоз клеток, например, специфических иммунных клеток типа дендритных клеток или других клеток, экспонирующих эпитопы чужих генов на своей поверхности. Такие клетки могут представлять собой инфицированные вирусом или инфицированные внутриклеточными бактериями, или раковые клетки, экспонирующие опухолевые антигены. Другими характеристиками могут являться активация макрофагов и естественных клеток-киллеров, позволяющая им разрушать патогены, и стимуляция клеток к секреции различных цитокинов, которые влияют на функцию других клеток, участвующих в адаптивных иммунных ответах и врожденных иммунных ответах.Cellular Immunity/Cellular Immune Response: Cellular immunity generally refers to the activation of macrophages, natural killer (NK) cells, antigen-specific cytotoxic T lymphocytes, and the release of various cytokines in response to an antigen. In a more general sense, cellular immunity is not based on antibodies, but on the activation of cells of the immune system. Typically, a cellular immune response may be characterized, for example, by the activation of antigen-specific cytotoxic T-lymphocytes that are capable of inducing cell apoptosis, for example, specific immune cells such as dendritic cells or other cells displaying foreign gene epitopes on their surface. Such cells may be virus-infected or intracellular bacteria-infected, or cancer cells displaying tumor antigens. Other characteristics may be the activation of macrophages and natural killer cells, allowing them to destroy pathogens, and the stimulation of cells to secrete various cytokines that affect the function of other cells involved in adaptive immune responses and innate immune responses.

ДНК: ДНК является общепринятым сокращением дезоксирибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды, как правило, представляют собой мономеры дезоксиаденозинмонофосфата, дезокситимидинмонофосфата, дезоксигуанозинмонофосфата и дезоксицитидинмонофосфата, которые сами состоят из сахарного фрагмента (дезоксирибоза), фрагмента, представляющего собой основание, и фосфатного фрагмента, и образуют полимеры с характерной каркасной структурой. Каркасная структура, как правило, образована с помощью фосфодиэфирных связей между сахарным фрагментом нуклеотида, т.е. дезоксирибозы, первого мономера и фосфатным фрагментом второго смежного мономера. Специфический порядок мономеров, т.е. порядок оснований, сцепленных с сахарным/фосфатным каркасом, называют ДНК-последовательностью. ДНК может быть одноцепочечной или двухцепочечной. В двухцепочечной форме нуклеотиды первой цепи, как правило, гибридизуются с нуклеотидами второй цепи, например, путем спаривания оснований А/Т и спаривания оснований G/C.DNA: DNA is the common abbreviation for deoxyribonucleic acid. It is a nucleic acid molecule, i.e. a polymer made up of nucleotides. These nucleotides are typically deoxyadenosine monophosphate, deoxythymidine monophosphate, deoxyguanosine monophosphate, and deoxycytidine monophosphate monomers, which themselves consist of a sugar moiety (deoxyribose), a base moiety, and a phosphate moiety, and form polymers with a characteristic backbone structure. The framework structure, as a rule, is formed by phosphodiester bonds between the sugar fragment of the nucleotide, i.e. deoxyribose, the first monomer and a phosphate fragment of the second adjacent monomer. The specific order of the monomers, i.e. the order of bases linked to the sugar/phosphate backbone is called the DNA sequence. DNA can be single stranded or double stranded. In the double stranded form, first strand nucleotides typically hybridize to second strand nucleotides, for example, by A/T base pairing and G/C base pairing.

Эпитоп: Эпитопы (которые называют также «антигенными детерминантами») можно подразделить на Т-клеточные эпитопы и В-клеточные эпитопы. В контексте настоящего изобретения Т-клеточные эпитопы или части белков могут содержать фрагменты, предпочтительно имеющие длину от примерно 6 до примерно 20 или даже более аминокислот, например, фрагменты, процессируемые и презентируемые молекулами ГКГС класса I, предпочтительно имеют длину от примерно 8 до примерно 10 аминокислот, например, 8, 9 или 10, (или даже 11 или 12 аминокислот), или фрагменты, процессируемые и презентируемые молекулами ГКГС класса II, предпочтительно имеют длину примерно 13 аминокислот или более, например, 13, 14, 15, 16, 17, 18, 19, 20 или даже большее количество аминокислот, при этом указанные фрагменты можно выбирать из любой части аминокислотной последовательности. Указанные фрагменты, как правило, распознаются Т-клетками в форме комплекса, состоящего из пептидного фрагмента и молекулы ГКГС, т.е. фрагменты, как правило, не распознаются в их нативной форме. В-клеточные эпитопы, как правило, представляют собой фрагменты, локализованные на внешней поверхности (нативных) белковых или пептидных антигенов, указанных в настоящем описании, предпочтительно состоящих из 5-15 аминокислот, более предпочтительно состоящих из 5-12 аминокислот, еще более предпочтительно состоящих из 6-9 аминокислот, которые могут распознаваться антителами, т.е. в их нативной форме.Epitope: Epitopes (also referred to as "antigenic determinants") can be divided into T-cell epitopes and B-cell epitopes. In the context of the present invention, T-cell epitopes or portions of proteins may contain fragments, preferably having a length of from about 6 to about 20 or even more amino acids, for example, fragments processed and presented by MHC class I molecules, preferably have a length of from about 8 to about 10 amino acids, e.g. 8, 9 or 10, (or even 11 or 12 amino acids), or fragments processed and presented by MHC class II molecules are preferably about 13 amino acids or more in length, e.g. 13, 14, 15, 16, 17 , 18, 19, 20, or even more amino acids, and these fragments can be selected from any part of the amino acid sequence. These fragments are usually recognized by T cells in the form of a complex consisting of a peptide fragment and an MHC molecule, i.e. fragments are generally not recognized in their native form. B-cell epitopes are typically fragments located on the outer surface of the (native) protein or peptide antigens described herein, preferably consisting of 5-15 amino acids, more preferably consisting of 5-12 amino acids, even more preferably consisting of of 6-9 amino acids that can be recognized by antibodies, i.e. in their native form.

Такие эпитопы белков или пептидов можно, кроме того, выбирать из любых указанных вариантов таких белков или пептидов. В этом контексте антигенные детерминанты могут представлять собой конформационные или прерывистые эпитопы, состоящие из сегментов указанных в настоящем описании белков или пептидов, которые расположены с перерывами в аминокислотной последовательности белков или пептидов, указанных в настоящем описании, но которые находятся вблизи друг от друга в трехмерной структуре, или непрерывные или линейные эпитопы, состоящие из одной полипептидной цепи.Such protein or peptide epitopes may furthermore be selected from any of the recited variants of such proteins or peptides. In this context, antigenic determinants may be conformational or discontinuous epitopes consisting of segments of proteins or peptides as defined herein that are located at intervals in the amino acid sequence of proteins or peptides as described herein, but which are close to each other in a three-dimensional structure. , or continuous or linear epitopes consisting of a single polypeptide chain.

Фрагмент последовательности: фрагмент последовательности, как правило, представляет собой укороченный участок полноразмерной последовательности, например, молекулы нуклеиновой кислоты или аминокислотной последовательности. Следовательно, фрагмент, как правило, состоит из последовательности, которая идентична соответствующему сегменту полноразмерной последовательности. В контексте настоящего изобретения предпочтительный фрагмент последовательности состоит из непрерывного сегмента, содержащего такие элементы, как нуклеотиды или аминокислоты, который соответствует непрерывному состоящему из указанных элементов сегменту молекулы, из которой происходит фрагмент, длина которого составляет по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, и наиболее предпочтительно по меньшей мере 80% от всей (т.е. полноразмерной) молекулы, из которой происходит фрагмент.Sequence Fragment: A sequence fragment is typically a shortened portion of a full-length sequence, such as a nucleic acid molecule or an amino acid sequence. Therefore, a fragment typically consists of a sequence that is identical to the corresponding segment of the full-length sequence. In the context of the present invention, a preferred sequence fragment consists of a contiguous segment containing elements such as nucleotides or amino acids, which corresponds to a contiguous segment of these elements of the molecule from which the fragment is derived, the length of which is at least 30%, more preferably at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, and most preferably at least 80% of the total (i.e. full length) molecule from which fragment occurs.

G/C-модифицированная: G/C-модифицированная нуклеиновая кислота, как правило, может представлять собой нуклеиновую кислоту, предпочтительно искусственную молекулу нуклеиновой кислоты, указанную в настоящем описании, созданную на основе модифицированной последовательности дикого типа, которая содержит предпочтительно повышенное количество гуанозиновых и/или цитозиновых нуклеотидов по сравнению с последовательностью дикого типа. Для получения указанного повышенного количества можно осуществлять замену кодонов, содержащих аденозиновые или тимидиновые нуклеотиды, на кодоны, содержащие гуанозиновые или цитозиновые нуклеотиды. При повышенном содержании G/C в кодирующей области ДНК или РНК, при заменах можно использовать вырожденность генетического кода. Таким образом, замены кодонов предпочтительно не изменяют кодируемые аминокислотные остатки, но исключительно увеличивают содержание G/C в молекуле нуклеиновой кислоты.G/C-modified: G/C-modified nucleic acid, as a rule, can be a nucleic acid, preferably an artificial nucleic acid molecule, specified in the present description, created on the basis of a modified wild-type sequence, which preferably contains an increased amount of guanosine and/ or cytosine nucleotides compared to the wild-type sequence. To obtain this increased number, it is possible to carry out the replacement of codons containing adenosine or thymidine nucleotides with codons containing guanosine or cytosine nucleotides. With an increased content of G / C in the coding region of DNA or RNA, the degeneracy of the genetic code can be used for substitutions. Thus, codon changes preferably do not change the encoded amino acid residues, but only increase the G/C content of the nucleic acid molecule.

Генная терапия: Генная терапия, как правило, может представлять собой лечение организма пациента или выделенных элементов организма пациента, например, выделенных тканей/клеток, с помощью нуклеиновых кислот, кодирующих пептид или белок. Как правило, она может включать по меньшей мере одну из следующих стадий а) введение нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании, непосредственно пациенту - любым путем введения - либо in vitro в выделенные клетки/ткани пациента, что приводит к трансфекции клеток пациента, либо in vivo/ex vivo, либо in vitro; б) транскрипция и/или трансляция интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.Gene therapy: Gene therapy can generally be the treatment of a patient's body or isolated elements of the patient's body, eg, isolated tissues/cells, with nucleic acids encoding a peptide or protein. Typically, it may include at least one of the following steps: a) administering a nucleic acid, preferably an artificial nucleic acid molecule as defined herein, directly to a patient - by any route of administration - or in vitro into isolated patient cells/tissues, resulting in transfection of patient cells, either in vivo/ex vivo or in vitro; b) transcription and/or translation of the introduced nucleic acid molecule; and optionally c) re-administering the isolated transfected cells to the patient if the nucleic acid was not administered directly to the patient.

Генетическая вакцинация: Генетическая вакцинация, как правило, может представлять собой вакцинацию, осуществляемую путем введения молекулы нуклеиновой кислоты, кодирующей антиген или иммуноген или его фрагменты. Молекулу нуклеиновой кислоты можно вводить в организм индивидуума или в выделенные клетки индивидуума. После трансфекции определенных клеток организма или после трансфекции выделенных клеток антиген или иммуноген может экспрессироваться указанными клетками и затем презентироваться иммунной системе, вызывая адаптивный, т.е. антигенспецифический иммунный ответ. Таким образом, генетическая вакцинация, как правило, включает по меньшей мере одну из следующих стадий: а) введение нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании, индивидууму, предпочтительно пациенту, или в выделенные клетки индивидуума, предпочтительно пациента, что обычно приводит к трансфекции клеток индивидуума in vivo или in vitro; б) транскрипцию и/или трансляцию интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток индивидууму, предпочтительно пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.Genetic vaccination: Genetic vaccination, as a rule, can be a vaccination carried out by introducing a nucleic acid molecule encoding an antigen or immunogen or fragments thereof. The nucleic acid molecule can be introduced into the body of an individual or into isolated cells of an individual. After transfection of certain cells of the body or after transfection of isolated cells, the antigen or immunogen can be expressed by these cells and then presented to the immune system, causing an adaptive, i. antigen-specific immune response. Thus, genetic vaccination typically comprises at least one of the following steps: a) introducing a nucleic acid, preferably an artificial nucleic acid molecule as defined herein, into an individual, preferably a patient, or into isolated cells of an individual, preferably a patient, which usually results in transfection of the individual's cells in vivo or in vitro; b) transcription and/or translation of the introduced nucleic acid molecule; and optionally c) re-administering the isolated transfected cells to an individual, preferably a patient, if the nucleic acid was not administered directly to the patient.

Гетерологичная последовательность: Как правило, считается, что две последовательности являются «гетерологичными», если они не происходят из одного и того же гена. Это означает, что, хотя гетерологичные последовательности могут происходить из одного и того же организма, они в естественных условиях (в природе) не встречаются в одной и той же молекуле, например, в одной и той же молекуле нуклеиновой кислоты.Heterologous sequence: Generally, two sequences are considered to be "heterologous" if they do not come from the same gene. This means that although heterologous sequences may originate from the same organism, they do not naturally occur in the same molecule, for example, in the same nucleic acid molecule.

Гуморальный иммунитет/гуморальный иммунный ответ: Гуморальный иммунитет, как правило, относится к производству антител и необязательно к вспомогательным процессам, которые могут сопровождать его. Гуморальный иммунный ответ, как правило, может характеризоваться, например, активацией Th2 и производством цитокинов, образованием зародышевого центра и переключением изотипа, созреванием аффинности и образованием клеток памяти. Гуморальный иммунитет, как правило, может относиться также к эффекторным функциям антител, включая нейтрализацию патогенов и токсинов, классическую активацию комплемента и стимулирование опсонинами фагоцитоза и элиминации патогенов.Humoral Immunity/Humoral Immune Response: Humoral immunity generally refers to the production of antibodies and not necessarily the ancillary processes that may accompany it. The humoral immune response can typically be characterized by, for example, Th2 activation and cytokine production, germinal center formation and isotype switching, affinity maturation, and memory cell formation. Humoral immunity, as a rule, can also refer to the effector functions of antibodies, including the neutralization of pathogens and toxins, classical complement activation, and the stimulation of phagocytosis and elimination of pathogens by opsonins.

Иммуноген: В контексте настоящего изобретения под иммуногеном, как правило, понимают соединение, которое обладает способностью стимулировать иммунный ответ. Предпочтительно иммуноген представляет собой пептид, полипептид или белок. В наиболее предпочтительном варианте осуществления изобретения иммуноген в контексте настоящего изобретения представляет собой продукт трансляции применяемой молекулы нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании. Как правило, иммуноген вызывает по меньшей мере адаптивный иммунный ответ.Immunogen: In the context of the present invention, an immunogen is generally understood to mean a compound that has the ability to stimulate an immune response. Preferably the immunogen is a peptide, polypeptide or protein. In the most preferred embodiment of the invention, the immunogen in the context of the present invention is a translation product of the nucleic acid molecule used, preferably the artificial nucleic acid molecule referred to in the present description. Typically, the immunogen elicits at least an adaptive immune response.

Иммуностимулирующая композиция: В контексте изобретения иммуностимулирующая композиция, как правило, может представлять собой композицию, содержащую по меньшей мере один компонент, который обладает способностью индуцировать иммунный ответ или из которого может происходить компонент, обладающий способностью индуцировать иммунный ответ. Такой иммунный ответ предпочтительно может представлять собой врожденный иммунный ответ или комбинацию адаптивного и врожденного иммунного ответа. В контексте настоящего описания иммуностимулирующая композиция предпочтительно содержит по меньшей мере одну искусственную молекулу нуклеиновой кислоты, более предпочтительно РНК, например, молекулу мРНК. Иммуностимулирующий компонент, такой как мРНК, может находиться в составе комплекса с пригодным носителем. Таким образом, иммуностимулирующая композиция может содержать комплекс мРНК/носитель. Кроме того, иммуностимулирующая композиция может содержать адъювант и/или пригодный наполнитель для иммуностимулирующего компонента, такого как мРНК.Immunostimulatory composition: In the context of the invention, an immunostimulatory composition can generally be a composition containing at least one component that has the ability to induce an immune response or from which a component that has the ability to induce an immune response can be derived. Such an immune response may preferably be an innate immune response or a combination of an adaptive and an innate immune response. In the context of the present description, the immunostimulatory composition preferably contains at least one artificial nucleic acid molecule, more preferably RNA, for example, an mRNA molecule. An immunostimulatory component, such as mRNA, may be complexed with a suitable carrier. Thus, the immunostimulatory composition may comprise an mRNA/carrier complex. In addition, the immunostimulatory composition may contain an adjuvant and/or a suitable excipient for the immunostimulatory component, such as mRNA.

Иммунный ответ: Иммунный ответ может, как правило, представлять собой либо специфическую реакцию адаптивной иммунной системы на конкретный антиген (так называемый специфический или адаптивный иммунный ответ), либо неспецифическую реакцию врожденной иммунной системы (так называемый неспецифический или врожденный иммунный ответ), либо их комбинацию.Immune response: An immune response can generally be either a specific reaction of the adaptive immune system to a particular antigen (so-called specific or adaptive immune response), or a non-specific reaction of the innate immune system (so-called non-specific or innate immune response), or a combination of both. .

Иммунная система: Иммунная система может защищать организмы от инфекции. Если патогену удалось преодолеть физический барьер организма и попасть в указанный организм, то врожденная иммунная система обеспечивает немедленный, но неспецифический ответ. Если патоген ускользает от этого врожденного ответа, у позвоночных имеется второй уровень защиты, представляющий собой адаптивную иммунную систему. В этом случае иммунная система адаптирует свой ответ в процессе инфекции для улучшения распознавания патогена. Затем этот улучшенный ответ сохраняется после элиминации патогена в форме иммунологической памяти и позволяет адаптивной иммунной системе организовывать более быстрые и сильные атаки каждый раз при проникновении указанного патогена. Таким образом, иммунная система включает врожденную и адаптивную иммунную систему. Каждая из этих двух частей, как правило, включает так называемые гуморальный и клеточный компоненты.Immune System: The immune system can protect organisms from infection. If the pathogen has managed to overcome the physical barrier of the organism and enter the specified organism, then the innate immune system provides an immediate, but non-specific response. If the pathogen eludes this innate response, vertebrates have a second layer of defense, which is the adaptive immune system. In this case, the immune system adapts its response during infection to improve recognition of the pathogen. This improved response is then stored after elimination of the pathogen in the form of an immunological memory and allows the adaptive immune system to mount faster and stronger attacks each time that pathogen enters. Thus, the immune system includes the innate and adaptive immune systems. Each of these two parts, as a rule, includes the so-called humoral and cellular components.

Иммуностимулирующая РНК: Иммуностимулирующая РНК (isPHK) в контексте изобретения, как правило, может представлять собой РНК, которая обладает способностью индуцировать врожденный иммунный ответ. Обычно она не имеет открытой рамки считывания и, таким образом, не кодирует пептид-антиген или иммуноген, но вызывает иммунный ответ, например, посредством связывания со специфическим типом Толл-подобного рецептора (TLR) или другими приемлемыми рецепторами. Однако, естественно, также и мРНК, имеющие открытую рамку считывания и кодирующие пептид/белок, могут индуцировать врожденный иммунный ответ и, следовательно, могут являться иммуностимулирующими РНК.Immunostimulatory RNA: Immunostimulatory RNA (isRNA) in the context of the invention, as a rule, can be an RNA that has the ability to induce an innate immune response. It usually does not have an open reading frame and thus does not encode an antigen peptide or immunogen, but elicits an immune response, for example by binding to a specific type of Toll-like receptor (TLR) or other suitable receptors. However, of course, also mRNAs having an open reading frame and encoding a peptide/protein can induce an innate immune response and can therefore be immunostimulatory RNAs.

Врожденная иммунная система: Врожденная иммунная система, которую называют также неспецифической иммунной системой, как правило, включает клетки и механизмы, которые неспецифически защищают хозяина от заражения другими организмами. Это означает, что клетки врожденной системы могут распознавать патогены и реагировать на них обычным путем, но, в отличие от адаптивной иммунной системы, она не обеспечивает долговременный или защитный иммунитет хозяину. Врожденная иммунная система может, например, активироваться лигандами патоген-ассоциированных распознающих молекулярные паттерны (РАМР) рецепторов, например, Толл-подобных рецепторов (TLR), или другими вспомогательными субстанциями, такими как липополисахариды, TNF-альфа, лиганд CD40 или цитокины, монокины, лимфокины, интерлейкины или хемокины, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-альфа, IFN-бета, IFN-гамма, GM-CSF, G-CSF, M-CSF, LT-бета, TNF-альфа, факторы роста и hGH, лиганд человеческого Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, лиганд мышиного Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 или TLR13, лиганд NOD-подобного рецептора, лиганд RIG-1-подобного рецептора, Иммуностимулирующая нуклеиновая кислота, Иммуностимулирующая РНК (isPHK), CpG-ДНК, антибактериальный агент или противовирусный агент. Как правило, ответ врожденной иммунной системы включает рекрутинг иммунных клеток к областям заражения посредством производства химических факторов, включая специализированные химические медиаторы, которые называют цитокинами; активацию каскада комплемента; идентификацию и удаление чужих субстанций, присутствующих в органах, тканях, крови и лимфе, специализированными лейкоцитами; активацию адаптивной иммунной системы посредством процесса, известного как презентация антигена; и/или функционирование в качестве физического и химического барьера для инфекционных агентов.Innate immune system: The innate immune system, also referred to as the non-specific immune system, typically includes cells and mechanisms that non-specifically protect the host from infection by other organisms. This means that the cells of the innate system can recognize and respond to pathogens in the usual way, but, unlike the adaptive immune system, it does not provide long-term or protective immunity to the host. The innate immune system can, for example, be activated by ligands of pathogen-associated molecular pattern recognition (PAMP) receptors, such as Toll-like receptors (TLRs), or other accessory substances such as lipopolysaccharides, TNF-alpha, CD40 ligand, or cytokines, monokines, lymphokines, interleukins or chemokines, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL- 24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-alpha, IFN-beta, IFN-gamma, GM-CSF, G-CSF, M-CSF, LT-beta, TNF-alpha, growth factors and hGH, human Toll-like receptor ligand TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10 , mouse Toll-like receptor ligand TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12, or TLR13, NOD-like receptor ligand, RIG-1-like receptor ligand, Immunostimulatory nucleic acid that, Immunostimulatory RNA (isPHK), CpG-DNA, antibacterial agent or antiviral agent. Typically, the response of the innate immune system involves the recruitment of immune cells to areas of infection through the production of chemical factors, including specialized chemical mediators called cytokines; activation of the complement cascade; identification and removal of foreign substances present in organs, tissues, blood and lymph by specialized leukocytes; activation of the adaptive immune system through a process known as antigen presentation; and/or functioning as a physical and chemical barrier to infectious agents.

Сайт клонирования: Под сайтом клонирования, как правило, понимают сегмент молекулы нуклеиновой кислоты, пригодный для встраивания нуклеотидной последовательности, например, нуклеотидной последовательности, содержащей открытую рамку считывания. Встраивание можно осуществлять с помощью любого метода молекулярной биологии, известного специалисту в данной области, например, посредством рестрикции и лигирования. Сайт клонирования, как правило, содержит один или несколько сайтов, распознаваемых рестриктазами (сайты рестрикции). Указанные один или несколько сайтов рестрикции могут распознаваться рестриктазами, расщепляющими ДНК в этих сайтах. Сайт клонирования, который содержит более одного сайта рестрикции, можно обозначать также как множественный сайт клонирования (MCS) или полилинкер.Cloning site: A cloning site is generally understood to mean a segment of a nucleic acid molecule suitable for insertion of a nucleotide sequence, for example a nucleotide sequence containing an open reading frame. Insertion can be accomplished by any molecular biology technique known to one of skill in the art, such as restriction and ligation. The cloning site typically contains one or more sites recognized by restriction enzymes (restriction sites). These one or more restriction sites can be recognized by restriction enzymes that cleave DNA at these sites. A cloning site that contains more than one restriction site may also be referred to as a multiple cloning site (MCS) or polylinker.

Молекула нуклеиновой кислоты: Молекула нуклеиновой кислоты представляет собой молекулу, которая содержит, предпочтительно состоит из компонентов нуклеиновой кислоты. Понятие «молекула нуклеиновой кислоты» предпочтительно относится к молекулам ДНК или РНК. Его предпочтительно применяют в качестве синонима понятия «полинуклеотид». Предпочтительно молекула нуклеиновой кислоты представляет собой полимер, содержащий или состоящий из нуклеотидных мономеров, которые ковалентно связаны друг с другом фосфодиэфирными связями сахарного/фосфатного каркаса. Понятие «нуклеиновая кислота» включает также модифицированные молекулы нуклеиновой кислоты, такие как молекулы ДНК или РНК с модифицированным основанием, модифицированным сахарным фрагментом или модифицированным каркасом.Nucleic acid molecule: A nucleic acid molecule is a molecule that contains, preferably consists of nucleic acid components. The term "nucleic acid molecule" preferably refers to DNA or RNA molecules. It is preferably used as a synonym for the term "polynucleotide". Preferably, the nucleic acid molecule is a polymer containing or consisting of nucleotide monomers that are covalently linked to each other by sugar/phosphate backbone phosphodiester bonds. The term "nucleic acid" also includes modified nucleic acid molecules, such as DNA or RNA molecules with a modified base, a modified sugar moiety, or a modified backbone.

Открытая рамка считывания: Открытая рамка считывания (ОРС) в контексте изобретения, как правило, может представлять собой состоящую из нескольких нуклеотидных триплетов последовательность, которая может транслироваться в пептид или белок. Открытая рамка считывания предпочтительно содержит на своем 5'-конце стартовый кодон, т.е. комбинацию трех последовательно расположенных нуклеотидов, кодирующих, как правило, аминокислоту метионин (ATG или AUG), и следующую за ним область, длина которой, как правило, кратна 3 нуклеотидам. ОРС предпочтительно оканчивается стоп-кодоном (например, ТАА, TAG, TGA). Как правило, в открытой рамке считывания присутствует только один стоп-кодон. Таким образом, открытая рамка считывания в контексте настоящего изобретения предпочтительно представляет собой нуклеотидную последовательность, состоящую из кратного трем количества нуклеотидов, которая начинается стартовым кодоном (например, ATG или AUG), и которая предпочтительно заканчивается стоп-кодоном (например, ТАА, TGA или TAG, или UAA, UAG, UGA соответственно). Открытая рамка считывания может быть выделена или она может быть встроена в более длинную нуклеотидную последовательность, например, в вектор или мРНК. Открытую рамку считывания можно называть также «кодирующей белок областью».Open Reading Frame: An Open Reading Frame (ORF) in the context of the invention can typically be a multiple nucleotide triplet sequence that can be translated into a peptide or protein. The open reading frame preferably contains a start codon at its 5' end, i. e. a combination of three consecutive nucleotides encoding, as a rule, the amino acid methionine (ATG or AUG), and the region following it, the length of which, as a rule, is a multiple of 3 nucleotides. The ORF preferably ends with a stop codon (eg TAA, TAG, TGA). Typically, there is only one stop codon in an open reading frame. Thus, an open reading frame in the context of the present invention is preferably a nucleotide sequence consisting of a multiple of three nucleotides, which begins with a start codon (for example, ATG or AUG), and which preferably ends with a stop codon (for example, TAA, TGA or TAG , or UAA, UAG, UGA respectively). The open reading frame may be isolated or inserted into a longer nucleotide sequence, such as a vector or mRNA. An open reading frame may also be referred to as a "protein coding region".

Пептид: Пептид или полипептид, как правило, представляет собой полимер, состоящий из аминокислотных мономеров, связанных пептидными связями. Он, как правило, содержит менее 50 мономерных звеньев. Однако понятие «пептид» не исключает молекулы, имеющие более 50 мономерных звеньев. Длинные пептиды называют также полипептидами, как правило, они имеют от 50 до 600 мономерных звеньев.Peptide: A peptide or polypeptide is typically a polymer of amino acid monomers linked by peptide bonds. It usually contains less than 50 monomeric units. However, the term "peptide" does not exclude molecules having more than 50 monomeric units. Long peptides are also called polypeptides, as a rule, they have from 50 to 600 monomer units.

Фармацевтически эффективное количество: В контексте изобретения под фармацевтически эффективным количеством, как правило, понимают количество, достаточное для того, чтобы индуцировать фармацевтическое действие, такое как иммунный ответ, измененный патологический уровень экспрессируемого пептида или белка, или замену недостающего генного продукта, например, в случае наличия патологической ситуации.Pharmaceutically effective amount: In the context of the invention, a pharmaceutically effective amount is generally understood to mean an amount sufficient to induce a pharmaceutical effect, such as an immune response, an altered abnormal level of an expressed peptide or protein, or a replacement of a missing gene product, for example, in the case of the presence of a pathological situation.

Белок: Белок, как правило, содержит один или несколько пептидов или полипептидов. Белок, как правило, уложен с образованием 3-мерной структуры, которая может требоваться для проявления биологической функции белка.Protein: A protein typically contains one or more peptides or polypeptides. The protein is typically folded into a 3-dimensional structure, which may be required for the biological function of the protein.

Поли(А)-последовательность: Поли(А)-последовательность, которую называют также поли(А)-хвостом или 3'-поли(А)-хвостом, как правило, представляет собой последовательность аденозиновых нуклеотидов, содержащую, например, вплоть до примерно 400 аденозиновых нуклеотидов, например, от примерно 25 до примерно 400, предпочтительно от примерно 50 до примерно 400, более предпочтительно от примерно 50 до примерно 300, еще более предпочтительно от примерно 50 до примерно 250, наиболее предпочтительно от примерно 60 до примерно 250 аденозиновых нуклеотидов. Поли(А)-последовательность, как правило, локализована на 3'-конце мРНК. В контексте настоящего изобретения поли(А)-последовательность может быть локализована внутри мРНК или любой другой молекулы нуклеиновой кислоты, например, внутри вектора, например, вектора, служащего в качестве матрицы для создания РНК, предпочтительно мРНК, например, при транскрипции вектора.Poly(A) sequence: A poly(A) sequence, also referred to as a poly(A) tail or 3'-poly(A) tail, is typically an adenosine nucleotide sequence containing, for example, up to about 400 adenosine nucleotides, e.g., from about 25 to about 400, preferably from about 50 to about 400, more preferably from about 50 to about 300, even more preferably from about 50 to about 250, most preferably from about 60 to about 250 adenosine nucleotides . The poly(A) sequence is typically located at the 3' end of the mRNA. In the context of the present invention, the poly(A) sequence may be located within an mRNA or any other nucleic acid molecule, for example within a vector, for example a vector serving as a template for making an RNA, preferably an mRNA, for example, when the vector is transcribed.

Полиаденилирование: Под полиаденилированием, как правило, понимают добавление поли(А)-последовательности к молекуле нуклеиновой кислоты, такой как молекула РНК, например, незрелая мРНК. Полиаденилирование может индуцироваться так называемым сигналом полиаденилирования. Указанный сигнал предпочтительно локализован в сегменте нуклеотидов на 3'-конце молекулы нуклеиновой кислоты, такой как молекула РНК, подлежащая полиаденилированию. Сигнал полиаденилирования, как правило, содержит гексамер, состоящий из адениновых и/или урациловых/тиминовых нуклеотидов, предпочтительно последовательность гексамера AAUAAA. Также возможны другие последовательности, предпочтительно гексамерные последовательности. Полиаденилирование, как правило, имеет место во время процессинга пре-мРНК (которую называют также незрелой мРНК). Как правило, созревание РНК (превращение пре-мРНК в зрелую мРНК) включает стадию полиаденилирования.Polyadenylation: By polyadenylation is generally meant the addition of a poly(A) sequence to a nucleic acid molecule, such as an RNA molecule, eg immature mRNA. Polyadenylation can be induced by the so-called polyadenylation signal. Said signal is preferably located in a segment of nucleotides at the 3' end of the nucleic acid molecule, such as the RNA molecule to be polyadenylated. The polyadenylation signal typically contains a hexamer consisting of adenine and/or uracil/thymine nucleotides, preferably the hexamer sequence AAUAAA. Other sequences are also possible, preferably hexameric sequences. Polyadenylation typically occurs during the processing of pre-mRNA (also referred to as immature mRNA). Typically, RNA maturation (conversion of pre-mRNA to mature mRNA) includes a polyadenylation step.

Сайт рестрикции: Сайт рестрикции, который называют также как сайт, распознаваемый рестриктазой, представляет собой нуклеотидную последовательность, распознаваемую рестрктазой. Сайт рестрикции, как правило, представляет собой короткую, предпочтительно палиндромную нуклеотидную последовательность, например, последовательность, содержащую от 4 до 8 нуклеотидов. Сайт рестрикции предпочтительно специфически распознается рестриктазой. Рестриктаза, как правило, расщепляет нуклеотидную последовательность, содержащую сайт рестрикции, в этом сайте. В двухцепочечной нуклеотидной последовательности, такой как двухцепочечная последовательность ДНК, рестриктаза, как правило, расщепляет обе цепи нуклеотидной последовательности.Restriction site: A restriction site, also referred to as a restriction enzyme recognition site, is a nucleotide sequence recognized by a restriction enzyme. The restriction site is typically a short, preferably palindromic, nucleotide sequence, such as a sequence of 4 to 8 nucleotides. The restriction site is preferably specifically recognized by the restriction enzyme. The restriction enzyme typically cleaves a nucleotide sequence containing a restriction site at that site. In a double-stranded nucleotide sequence, such as a double-stranded DNA sequence, the restriction enzyme typically cleaves both strands of the nucleotide sequence.

РНК, мРНК: РНК является общепринятым сокращением для рибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды представляют собой, как правило, мономеры аденозинмонофосфата, уридинмонофосфата, гуанозинмонофосфата и цитидинмонофосфата, соединенные друг с другом вдоль так называемого каркаса. Каркас формируется с помощью фосфодиэфирных связей между сахаром, т.е. рибозой, первого мономера и фосфатным фрагментом второго смежного мономера. Конкретную последовательность мономеров называют РНК-последовательностью. Как правило, РНК можно получать путем транскрипции ДНК-последовательности, например, внутри клетки. В эукариотических клетках транскрипция, как правило, происходит в ядре или в митохондрии. In vivo транскрипция ДНК, как правило, приводит к образованию так называемой незрелой РНК, которая в результате процессинга должна превратиться в так называемую матричную (информационную) РНК, которую сокращенно обозначают как мРНК. Процессинг незрелой РНК, например, в эукариотических организмах, включает ряд различных пост-транскрипционных модификаций, таких как сплайсинг, 5'-кэпирование, полиаденилирование, экспорт из ядра или митохондрии и т.п. Совокупность указанных процессов называют также созреванием РНК. Зрелая матричная РНК, как правило, представляет собой нуклеотидную последовательность, которая может транслироваться в аминокислотную последовательность конкретного пептида или белка. Как правило, зрелая мРНК содержит 5'-кэп, 5'UTR, открытую рамку считывания, необязательно 3'UTR и поли(А)-последовательность. Помимо матричной РНК существует несколько некодирующих типов РНК, которые могут участвовать в регуляции транскрипции и/или трансляции.RNA, mRNA: RNA is the common abbreviation for ribonucleic acid. It is a nucleic acid molecule, i.e. a polymer made up of nucleotides. Said nucleotides are, as a rule, monomers of adenosine monophosphate, uridine monophosphate, guanosine monophosphate and cytidine monophosphate, connected to each other along the so-called backbone. The framework is formed with the help of phosphodiester bonds between sugars, i.e. ribose, the first monomer and the phosphate fragment of the second adjacent monomer. A particular sequence of monomers is called an RNA sequence. Typically, RNA can be obtained by transcription of a DNA sequence, for example, within a cell. In eukaryotic cells, transcription usually occurs in the nucleus or mitochondria. In vivo transcription of DNA, as a rule, leads to the formation of the so-called immature RNA, which, as a result of processing, must turn into the so-called messenger (messenger) RNA, which is abbreviated as mRNA. Processing of immature RNA, for example in eukaryotic organisms, involves a number of different post-transcriptional modifications such as splicing, 5' capping, polyadenylation, nuclear or mitochondrial export, and the like. The combination of these processes is also called RNA maturation. Mature messenger RNA is typically a nucleotide sequence that can be translated into the amino acid sequence of a particular peptide or protein. Typically, the mature mRNA contains a 5'cap, a 5'UTR, an open reading frame, optionally a 3'UTR, and a poly(A) sequence. In addition to messenger RNA, there are several non-coding types of RNA that may be involved in the regulation of transcription and/or translation.

Последовательность молекулы нуклеиновой кислоты: Под последовательностью молекулы нуклеиновой кислоты, как правило, понимают конкретный и индивидуальный порядок расположения, т.е. последовательный ряд входящих в нее нуклеотидов. Под последовательностью белка или пептида, как правило, понимают порядок расположения, т.е. последовательный ряд входящих в него аминокислот.Sequence of a Nucleic Acid Molecule: Sequence of a nucleic acid molecule is generally understood to mean a specific and individual arrangement, i. a series of nucleotides in it. By the sequence of a protein or peptide, as a rule, is understood the order of arrangement, i. consecutive series of amino acids included in it.

Идентичность последовательности: Две или большее количество последовательностей являются идентичными, если они имеют одинаковую длину и порядок расположения нуклеотидов или аминокислот. Процент идентичности, как правило, характеризует степень идентичности двух последовательностей, т.е. он, как правило, характеризует процент нуклеотидов, которые соответствуют по своему положению идентичным нуклеотидам референс-последовательности. При определении степени идентичности считается, что подлежащие сравнению последовательности имеют одну и ту же длину, т.е. длину наиболее длинной последовательности из подлежащих сравнению последовательностей. Это означает, что первая последовательность, состоящая из 8 нуклеотидов, идентична на 80% второй последовательности, состоящей из 10 нуклеотидов, которая содержит первую последовательность. Другими словами, в контексте настоящего изобретения идентичность последовательностей предпочтительно относится к проценту нуклеотидов в последовательности, которые находятся в одних и тех же положениях в двух или большем количестве последовательностей, имеющих одинаковую длину. При сравнительном анализе первичной структуры последовательностей бреши обычно рассматривают как неидентичные положения безотносительно к их действительному положению.Sequence Identity: Two or more sequences are identical if they are the same length and nucleotide or amino acid order. Percent identity generally characterizes the degree of identity between two sequences, i.e. it usually characterizes the percentage of nucleotides that correspond in position to identical nucleotides in the reference sequence. When determining the degree of identity, the sequences to be compared are considered to be of the same length, i.e. the length of the longest sequence of the sequences to be compared. This means that the first 8 nucleotide sequence is 80% identical to the second 10 nucleotide sequence that contains the first sequence. In other words, in the context of the present invention, sequence identity preferably refers to the percentage of nucleotides in a sequence that are in the same positions in two or more sequences that are the same length. In a comparative analysis of the primary structure of sequences, gaps are usually considered as non-identical positions, regardless of their actual position.

Стабилизированная молекула нуклеиновой кислоты: Стабилизированная молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, предпочтительно молекулу ДНК или РНК, модифицированную таким образом, чтобы она обладала большей стабильностью к расщеплению или разрушению, например, факторами окружающей среды, или ферментативному расщеплению, такому как расщепление экзо- или эндонуклеазами, чем молекула нуклеиновой кислоты без модификации. Предпочтительно стабилизированная молекула нуклеиновой кислоты в контексте настоящего изобретения является стабилизированной в клетке, такой как прокариотическая или эукариотическая клетка, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Стабилизирующее действие можно оказывать также вне клеток, например, в буферном растворе и т.д., например, в процессе производства фармацевтической композиции, которая содержит стабилизированную молекулу нуклеиновой кислоты.Stabilized Nucleic Acid Molecule: A stabilized nucleic acid molecule is a nucleic acid molecule, preferably a DNA or RNA molecule, modified to be more resistant to cleavage or degradation, for example by environmental factors, or to enzymatic cleavage, such as cleavage of exo- or endonucleases than the nucleic acid molecule without modification. Preferably, the stabilized nucleic acid molecule in the context of the present invention is stabilized in a cell, such as a prokaryotic or eukaryotic cell, preferably in a mammalian cell, such as a human cell. The stabilizing effect can also be exerted outside the cells, for example in a buffer solution, etc., for example during the production of a pharmaceutical composition which contains a stabilized nucleic acid molecule.

Трансфекция: Понятие «трансфекция» относится к интродукции молекул нуклеиновой кислоты, таких как молекулы ДНК или РНК (например, мРНК), в клетки, предпочтительно в эукариотические клетки. В контексте настоящего изобретения под понятие «трансфекция» подпадает любой известный специалисту в данной области метод интродукции молекул нуклеиновой кислоты в клетки, предпочтительно в эукариотические клетки, такие как клетки млекопитающих. Такие методы включают, например, электропорацию, липофекцию, например, на основе катионных липидов и/или липосом, осаждение фосфатом кальция, трансфекцию на основе наночастиц, трансфекцию на основе вирусов или трансфекцию на основе катионных полимеров, таких как ДЭАЭ-декстран или полиэтиленимин, и т.д. Предпочтительно интродукцию осуществляют без использования вирусов.Transfection: The term "transfection" refers to the introduction of nucleic acid molecules, such as DNA or RNA (eg mRNA) molecules, into cells, preferably eukaryotic cells. In the context of the present invention, "transfection" refers to any method known to the person skilled in the art for introducing nucleic acid molecules into cells, preferably eukaryotic cells, such as mammalian cells. Such methods include, for example, electroporation, lipofection, for example, based on cationic lipids and/or liposomes, calcium phosphate precipitation, nanoparticle-based transfection, virus-based transfection, or transfection based on cationic polymers, such as DEAE-dextran or polyethyleneimine, and etc. Preferably, the introduction is carried out without the use of viruses.

Трансляционная эффективность (или эффективность трансляции): В контексте настоящего описания указанное понятие, как правило, относится к свойству молекулы нуклеиновой кислоты (например, мРНК), содержащей открытую рамку считывания (ОРС). Эффективность трансляции поддается количественной оценке. Эффективность трансляции, как правило, измеряют путем определения количества белка, транслированного с ОРС. При экспериментальной количественной оценке эффективности трансляции предпочтительно ОРС кодирует репортерный белок или любой другой белок, поддающийся количественной оценке. Однако, не вдаваясь в какую-либо конкретную теорию, можно считать, что высокая эффективность трансляции, как правило, обеспечивается специфическим UTR-элементом (специфическим 5'-UTR-элементом или специфическим 3'-UTR-элементом). Таким образом, в контексте настоящего изобретения понятие «эффективность трансляции» используют, прежде всего, применительно к молекулам нуклеиновой кислоты, которые содержат помимо ОРС по меньшей мере один 5'-UTR-элемент и/или по меньшей мере один 3'-UTR-элемент, предпочтительно представленный в настоящем описании. Хотя для целей экспериментальной количественной оценки эффективности трансляции следует использовать ОРС, кодирующую репортерный белок или любой другой белок, который можно количественно оценивать, настоящее изобретение не ограничивается такими целями; следовательно, по меньшей мере один 5'-UTR-элемент и/или по меньшей мере один 3'-UTR-элемент, предлагаемый в изобретении (который обеспечивает высокую эффективность трансляции), может содержаться в молекуле нуклеиновой кислоты, содержащей ОРС, которая не кодирует репортерный белок.Translation efficiency (or translation efficiency): In the context of the present description, the specified concept, as a rule, refers to a property of a nucleic acid molecule (eg, mRNA) containing an open reading frame (ORF). Translation efficiency is quantifiable. Translation efficiency is generally measured by determining the amount of protein translated from the ORF. When experimentally quantifying translation efficiency, preferably the ORF encodes a reporter protein or any other quantifiable protein. However, without wishing to be bound by any particular theory, it can be assumed that high translation efficiency is usually provided by a specific UTR element (specific 5'-UTR element or specific 3'-UTR element). Thus, in the context of the present invention, the term "translation efficiency" is used primarily in relation to nucleic acid molecules that contain, in addition to ORFs, at least one 5'-UTR element and/or at least one 3'-UTR element , preferably presented in the present description. Although an ORF encoding a reporter protein or any other protein that can be quantified should be used for purposes of experimental quantification of translation efficiency, the present invention is not limited to such purposes; therefore, at least one 5'-UTR element and/or at least one 3'-UTR element of the invention (which provides high translation efficiency) may be contained in a nucleic acid molecule containing an ORF that does not encode reporter protein.

Эффективность трансляции является относительным понятием. Так, можно определять и сравнивать эффективность трансляции различных, например, двух или большего количества молекул нуклеиновой кислоты, например, путем экспериментальной количественной оценки белка, колируемого ОРС. Это можно осуществлять в стандартизованных условиях, например, с помощью стандартизованного анализа, представленного в настоящем описании. Таким образом, эффективность трансляции, определенная в стандартизованных условиях, является объективной характеристикой. Предпочтительно определяют и сравнивают эффективность трансляции двух молекул нуклеиновой кислоты. Первую из указанных двух молекул нуклеиновой кислоты можно обозначить как «рассматриваемая молекула нуклеиновой кислоты» или «рассматриваемая конструкция», а вторую из указанных двух молекул нуклеиновой кислоты можно обозначить как «референс-молекула нуклеиновой кислоты» или «референс-конструкция». Рассматриваемая молекула нуклеиновой кислоты может представлять собой искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении. Для рассматриваемой цели референс-молекула нуклеиновой кислоты и рассматриваемая молекула нуклеиновой кислоты должны иметь одну и ту же ОРС (имеющую идентичную нуклеотидную последовательность); и предпочтительно нуклеотидная последовательность рассматриваемой молекулы нуклеиновой кислоты идентична нуклеотидной последовательности референс-молекулы нуклеиновой кислоты за исключением UTR-элемента, подлежащего тестированию, т.е. либо 5'-ЦТК--элемента, либо 3'-UTR-элемента; иными словами, рассматриваемая молекула нуклеиновой кислоты и референс-молекула нуклеиновой кислоты предпочтительно отличаются друг от друга только тем, что либо их 5'-UTR-элементы, либо их 3'-UTR-элементы имеют отличную друг от друга нуклеотидную последовательность; таким образом, 5'-UTR-элемент или 3'-UTR-элемент представляет собой единственную структурную особенность, которая отличает рассматриваемую молекулу нуклеиновой кислоты от референс-молекулы нуклеиновой кислоты.Translation efficiency is a relative concept. Thus, it is possible to determine and compare the efficiency of translation of different, for example, two or more nucleic acid molecules, for example, by experimental quantification of the protein collated by the ORF. This can be done under standardized conditions, for example using the standardized assay provided herein. Thus, the efficiency of translation, determined under standardized conditions, is an objective characteristic. Preferably, the translation efficiency of two nucleic acid molecules is determined and compared. The first of these two nucleic acid molecules may be referred to as "the nucleic acid molecule of interest" or "the construct of interest", and the second of these two nucleic acid molecules may be referred to as the "reference nucleic acid molecule" or "the reference construct". The nucleic acid molecule in question may be an artificial nucleic acid molecule according to the present invention. For the purpose in question, the reference nucleic acid molecule and the nucleic acid molecule in question must have the same ORF (having the same nucleotide sequence); and preferably the nucleotide sequence of the nucleic acid molecule in question is identical to the nucleotide sequence of the reference nucleic acid molecule except for the UTR element to be tested, i. either a 5'-CTK-element or a 3'-UTR element; in other words, the nucleic acid molecule in question and the reference nucleic acid molecule preferably differ from each other only in that either their 5'-UTR elements or their 3'-UTR elements have a different nucleotide sequence from each other; thus, the 5'-UTR element or 3'-UTR element is the only structural feature that distinguishes the nucleic acid molecule in question from the reference nucleic acid molecule.

В представленном в настоящем описании анализе рассматриваемой молекулой нуклеиновой кислоты и референс-молекулой нуклеиновой кислоты трансфектируют клетки млекопитающего и определяют эффективность трансляции. Если эффективность трансляции рассматриваемой молекулы нуклеиновой кислоты выше, чем эффективность трансляции референс-молекулы нуклеиновой кислоты, то считается, что рассматриваемая молекула нуклеиновой кислоты должна характеризоваться высокой эффективностью трансляции. В этом случае считается, что 5'-UTR-элемент или 3'-UTR-элемент, которым различаются рассматриваемая молекула нуклеиновой кислоты и референс-молекула нуклеиновой кислоты, обеспечивает высокую эффективность трансляции (рассматриваемой молекулы нуклеиновой кислоты). Иными словами, считается, что высокая эффективность трансляции должна «обеспечиваться» специфическим 5'-UTR-элементом или 3'-UTR-элементом, который присутствует в рассматриваемой молекуле нуклеиновой кислоты, но не присутствует в референс-молекуле нуклеиновой кислоты; и считается, что рассматриваемая молекула нуклеиновой кислоты (или искусственная молекула нуклеиновой кислоты), которая содержит такую 5'-UTR или 3'-UTR и по меньшей мере одну ОРС, «должна характеризоваться» высокой эффективностью трансляции.In the presently described assay, the subject nucleic acid molecule and the reference nucleic acid molecule are transfected into mammalian cells and the efficiency of translation is determined. If the translation efficiency of the nucleic acid molecule in question is higher than the translation efficiency of the reference nucleic acid molecule, then the nucleic acid molecule in question is considered to have a high translation efficiency. In this case, the 5'-UTR element or 3'-UTR element that distinguishes the nucleic acid molecule in question and the reference nucleic acid molecule is considered to provide high translation efficiency (of the nucleic acid molecule in question). In other words, it is believed that high translation efficiency should be "provided" by a specific 5'-UTR element or 3'-UTR element that is present in the nucleic acid molecule in question, but not present in the reference nucleic acid molecule; and it is considered that the subject nucleic acid molecule (or artificial nucleic acid molecule), which contains such a 5'-UTR or 3'-UTR and at least one ORF, "should be characterized" by high translation efficiency.

Вакцина: Под вакциной, как правило, понимают предназначенный для профилактики или терапии продукт, содержащий по меньшей мере один антиген, предпочтительно иммуноген. Антиген или иммуноген может иметь происхождение из любого материала, пригодного для вакцинации. Например, антиген или иммуноген может происходить из патогена, такого как бактерии или вирусные частицы и т.д., или из опухолевой или раковой ткани. Антиген или иммуноген стимулирует адаптивную иммунную систему организма вырабатывать адаптивный иммунный ответ.Vaccine: A vaccine is generally understood to mean a prophylactic or therapeutic product containing at least one antigen, preferably an immunogen. The antigen or immunogen may be derived from any material suitable for vaccination. For example, the antigen or immunogen may be from a pathogen such as bacteria or viral particles, etc., or from a tumor or cancer tissue. The antigen or immunogen stimulates the body's adaptive immune system to produce an adaptive immune response.

Вектор: Понятие «вектор» относится к молекуле нуклеиновой кислоты, предпочтительно к искусственной молекуле нуклеиновой кислоты. В контексте настоящего изобретения вектор можно применять для встраивания или хранения требуемой нуклеотидной последовательности, такой как нуклеотидная последовательность, содержащая открытую рамку считывания. Таким векторы могут представлять собой векторы для хранения, экспрессионные векторы, клонирующие векторы, векторы для переноса и т.д. Вектор для хранения представляет собой вектор, который позволяет удобно хранить молекулу нуклеиновой кислоты, например, молекулу мРНК. Так, вектор может содержать последовательность, соответствующую, например, требуемой последовательности мРНК или ее части, такой как последовательность, соответствующая открытой рамке считывания и 3'-UTR и/или 5'-UTR мРНК. Экспрессионный вектор можно применять для производства продуктов экспрессии, таких как РНК, например, мРНК, или пептиды, полипептиды или белки. Например, экспрессионный вектор может содержать последовательности, необходимые для транскрипции сегмента последовательности вектора, такой как промоторная последовательность, например, промоторная последовательность РНК-полимеразы. Клонирующий вектор, как правило, представляет собой вектор, который содержит сайт клонирования, который можно применять для встраивания нуклеотидных последовательностей в вектор. Клонирующий вектор может представлять собой, например, плазмидный вектор или вектор на основе бактериофага. Вектор для переноса может представлять собой вектор, который пригоден для переноса молекул нуклеиновой кислоты в клетки или организмы, например, вирусные векторы. В контексте настоящего изобретения вектор может представлять собой, например, РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой молекулу ДНК. В контексте настоящего описания предпочтительно вектор содержит сайт клонирования, маркер для селекции, такой как фактор, обусловливающий устойчивость к антибиотикам, и последовательность, пригодную для размножения вектора, такую как сайт инициации репликации. В контексте настоящего описания предпочтительно вектор представляет собой плазмидный вектор.Vector: The term "vector" refers to a nucleic acid molecule, preferably an artificial nucleic acid molecule. In the context of the present invention, a vector can be used to insert or store a desired nucleotide sequence, such as a nucleotide sequence containing an open reading frame. Such vectors may be storage vectors, expression vectors, cloning vectors, transfer vectors, and the like. A storage vector is a vector that allows convenient storage of a nucleic acid molecule, such as an mRNA molecule. Thus, the vector may contain a sequence corresponding to, for example, the desired mRNA sequence or a portion thereof, such as a sequence corresponding to the open reading frame and the 3'-UTR and/or 5'-UTR of the mRNA. An expression vector can be used to produce expression products such as RNA, eg mRNA, or peptides, polypeptides or proteins. For example, the expression vector may contain sequences necessary for transcription of a segment of the vector's sequence, such as a promoter sequence, such as an RNA polymerase promoter sequence. A cloning vector is typically a vector that contains a cloning site that can be used to insert nucleotide sequences into the vector. The cloning vector may be, for example, a plasmid vector or a bacteriophage-based vector. The transfer vector may be a vector that is suitable for transferring nucleic acid molecules into cells or organisms, such as viral vectors. In the context of the present invention, the vector may be, for example, an RNA vector or a DNA vector. Preferably the vector is a DNA molecule. In the context of the present description, preferably the vector contains a cloning site, a selection marker, such as an antibiotic resistance factor, and a sequence suitable for propagating the vector, such as an origin of replication. In the context of the present description, preferably the vector is a plasmid vector.

Наполнитель: Под наполнителем, как правило, понимают материал, пригодный для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение. Он может представлять собой, например, физиологически приемлемую жидкость, пригодную для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение.Excipient: An excipient is generally understood to mean a material suitable for storing, transporting and/or administering a compound, such as a pharmaceutically active compound. It may be, for example, a physiologically acceptable liquid suitable for storing, transporting and/or administering a compound, such as a pharmaceutically active compound.

3'-нетранслируемая область (3'-UTR): Как правило, понятие «3'-UTR» относится к части искусственной молекулы нуклеиновой кислоты, которая локализована с 3'-стороны (т.е. «по ходу транскрипции») открытой рамки считывания и которая не транслируется в белок. Как правило, 3'-UTR представляет собой часть мРНК, которая локализована между кодирующей белок областью (открытой рамкой считывания (ОРС) или кодирующей последовательностью (CDS)) и поли(А)-последовательностью мРНК. В контексте изобретения понятие «3'-UTR» может включать также элементы, которые не кодируются в матрице, с которой транскрибируется РНК, но которые добавляются после транскрипции в процессе созревания, например, поли(А)-последовательность. 3'-UTR мРНК не транслируется в аминокислотную последовательность. Последовательность 3'-UTR, как правило, кодируется геном, который транскрибируется в соответствующую мРНК в процессе экспрессии гена. Геномная последовательность сначала транскрибируется в незрелую мРНК, которая содержит необязательные интроны. Незрелая мРНК затем дополнительно процессируется с образованием зрелой мРНК в процессе созревания. Указанный процесс созревания включает стадии 5'-кэпирования, сплайсинга незрелой мРНК с вырезанием необязательных интронов и модификаций 3'-конца, таких как полиаденилирование 3'-конца незрелой мРНК, и необязательные расщепления эндо-/или экзонуклеазами и т.д. В контексте настоящего изобретения 3'-UTR соответствует последовательности зрелой мРНК, которая локализована между стоп-кодоном кодирующей области белка, предпочтительно непосредственно примыкает с 3'-стороны к стоп-кодону кодирующей белок области, и поли(А)-последовательностью мРНК. Понятие «соответствует» означает, что последовательность 3'-UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной в определении последовательности 3'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «3'-UTR гена» означает последовательность, которая соответствует 3'-UTR зрелой мРНК, полученной из указанного гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «3'-UTR гена» включает последовательность ДНК и последовательность РНК (как смысловую, так и антисмысловую цепи, и как зрелые, так и незрелые последовательности) 3'-UTR. Предпочтительно 3'-UTR имеют длину более 20, 30, 40 или 50 нуклеотидов.3'-untranslated region (3'-UTR): In general, the term "3'-UTR" refers to the part of an artificial nucleic acid molecule that is located on the 3'-side (i.e. "downstream") of the open frame reading and which is not translated into protein. Typically, the 3'UTR is the portion of the mRNA that is located between the protein coding region (open reading frame (ORF) or coding sequence (CDS)) and the mRNA poly(A) sequence. In the context of the invention, the term "3'-UTR" may also include elements that are not encoded in the template from which the RNA is transcribed, but which are added after transcription during maturation, for example, a poly(A) sequence. The 3'-UTR of mRNA is not translated into an amino acid sequence. The 3'-UTR sequence is typically encoded by a gene that is transcribed into the corresponding mRNA during gene expression. The genomic sequence is first transcribed into immature mRNA, which contains optional introns. The immature mRNA is then further processed into mature mRNA during maturation. Said maturation process includes the steps of 5' capping, splicing of the immature mRNA with excision of optional introns and 3' end modifications such as polyadenylation of the 3' end of the immature mRNA, and optional endo-/or exonuclease cleavages, etc. In the context of the present invention, the 3'-UTR corresponds to a mature mRNA sequence that is located between the stop codon of the protein coding region, preferably immediately adjacent 3' to the stop codon of the protein coding region, and the mRNA poly(A) sequence. The term "corresponds" means that the 3'-UTR sequence may be an RNA sequence, such as in the mRNA sequence specified in the definition of the 3'UTR sequence, or a DNA sequence that corresponds to the specified RNA sequence. In the context of the present invention, the term "3'-UTR of a gene" means a sequence that corresponds to the 3'-UTR of a mature mRNA derived from said gene, i.e. mRNA obtained by transcription of a gene and maturation of immature mRNA. The term "3'-UTR of a gene" includes a DNA sequence and an RNA sequence (both sense and antisense strands, and both mature and immature sequences) 3'-UTR. Preferably the 3'-UTRs are greater than 20, 30, 40 or 50 nucleotides in length.

5'-нетранслируемая область (5'-UTR): Понятие «5'-UTR», как правило, относится к части искусственной молекулы нуклеиновой кислоты, которая локализована с 5'-стороны (т.е. «в обратном направлении») относительно открытой рамки считывания мРНК и которая не транслируется в белок. Под 5'-UTR, как правило, понимают конкретный сегмент матричной РНК (мРНК), который локализован с 5'-стороны открытой рамки считывания мРНК. Как правило, 5'-UTR начинается с сайта инициации транскрипции и заканчивается за один нуклеотид до стартового кодона открытой рамки считывания. Предпочтительно 5'-UTR имеет длину более 20, 30, 40 или 50 нуклеотидов. 5'-UTR может содержать элементы, предназначенные для контроля генной экспрессии, так называемые регуляторные элементы. Указанные регуляторные элементы могут представлять собой, например, сайты связывания рибосом. 5'-UTR может подвергаться пост-транскрипционным модификациям, например, путем добавления 5'-кэпа. 5'-UTR не транслируется в аминокислотную последовательность. Последовательность 5'-UTR, как правило, кодируется геном, который транскрибируется в соответствующую мРНК в процессе генной экспрессии. Геномная последовательность сначала транскрибируется в незрелую мРНК, которая содержит необязательные интроны. Незрелая мРНК затем дополнительно процессируется с образованием зрелой мРНК в процессе созревания. Указанный процесс созревания включает стадии 5'-кэпирования, сплайсинга незрелой мРНК с вырезанием необязательных интронов и модификаций 3'-конца, таких как полиаденилирование 3'-конца незрелой мРНК, и необязательные расщепления эндо-/или экзонуклеазами и т.д. В контексте настоящего изобретения 5'-UTR соответствует последовательности зрелой мРНК, локализованной между стартовым кодоном и, например, 5'-кэпом. Предпочтительно 5'-UTR соответствует последовательности, которая простирается от нуклеотида, расположенного с 3'-стороны 5'-кэпа, более предпочтительно от нуклеотида, непосредственно примыкающего с 3'-стороны к 5'-кэпу, до нуклеотида, расположенного с 5'-стороны стартового кодона кодирующей белок области, предпочтительно до нуклеотида, непосредственно примыкающего с 5'-стороны к стартовому кодону кодирующей белок области. Нуклеотид, непосредственно примыкающий с 3'-стороны к 5'-кэпу зрелой мРНК, как правило, соответствует сайту инициации транскрипции. Понятие «соответствует» означает, что последовательность 5'-UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной при определении последовательности 5'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «5'-UTR гена» обозначает последовательность, которая соответствует 5'-UTR зрелой мРНК, полученной из этого гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «5'UTR гена» включает последовательность ДНК и последовательность РНК (как смысловую, так и антисмысловую цепи, и как зрелые, так и незрелые последовательности) 5'-UTR.5'-Untranslated Region (5'-UTR): The term "5'-UTR" generally refers to the part of an artificial nucleic acid molecule that is located on the 5' side (i.e., "backward") relative to open reading frame of mRNA and which is not translated into protein. Under the 5'-UTR, as a rule, understand the specific segment of messenger RNA (mRNA), which is located on the 5'-side of the open reading frame of the mRNA. Typically, the 5'-UTR starts at the site of transcription initiation and ends one nucleotide before the start codon of the open reading frame. Preferably the 5'-UTR is greater than 20, 30, 40 or 50 nucleotides in length. The 5'-UTR may contain elements designed to control gene expression, so-called regulatory elements. Said regulatory elements may be, for example, ribosome binding sites. The 5'-UTR may be subject to post-transcriptional modifications, for example by adding a 5'-cap. The 5'-UTR is not translated into an amino acid sequence. The 5'UTR sequence is typically encoded by a gene that is transcribed into the corresponding mRNA during gene expression. The genomic sequence is first transcribed into immature mRNA, which contains optional introns. The immature mRNA is then further processed into mature mRNA during maturation. Said maturation process includes the steps of 5' capping, splicing of the immature mRNA with excision of optional introns and 3' end modifications such as polyadenylation of the 3' end of the immature mRNA, and optional endo-/or exonuclease cleavages, etc. In the context of the present invention, the 5'-UTR corresponds to a mature mRNA sequence located between the start codon and, for example, the 5'-cap. Preferably, the 5'-UTR corresponds to a sequence that extends from the nucleotide located 3'-side of the 5'-cap, more preferably from the nucleotide immediately adjacent 3'-side of the 5'-cap, to the nucleotide located 5'- side of the start codon of the protein coding region, preferably up to the nucleotide immediately adjacent on the 5' side of the start codon of the protein coding region. The nucleotide immediately adjacent on the 3' side to the 5' cap of the mature mRNA usually corresponds to the site of transcription initiation. The term "corresponds" means that the 5'-UTR sequence may be an RNA sequence, such as in the mRNA sequence specified when determining the 5'UTR sequence, or a DNA sequence that corresponds to the specified RNA sequence. In the context of the present invention, the term "5'-UTR of a gene" means a sequence that corresponds to the 5'-UTR of the mature mRNA derived from this gene, i.e. mRNA obtained by transcription of a gene and maturation of immature mRNA. The term "5'UTR of a gene" includes a DNA sequence and an RNA sequence (both sense and antisense strands, and both mature and immature sequences) of the 5'UTR.

5'-концевой олигопиримидиновый тракт (ТОР): 5'-концевой олигопиримидиновый тракт (ТОР), как правило, обозначает сегмент пиримидиновых нуклеотидов, локализованный в 5'-концевой области молекулы нуклеиновой кислоты, например, в 5'-концевой области некоторых молекул мРНК или в 5'-концевой области функционального элемента, например, транскрибируемой области некоторых генов. Последовательность начинается с цитидина, который, как правило, соответствует сайту инициации транскрипции, и за которым следует сегмент, как правило, состоящий примерно из 3-30 пиримидиновых нуклеотидов. Например, ТОР может содержать 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или даже большее количество нуклеотидов. Пиримидиновый сегмент и, следовательно, 5'-ТОР, заканчивается одним нуклеотидом, расположенным в 5'-направлении относительно первого пуринового нуклеотида, локализованного по ходу транскрипции относительно ТОР. Матричную РНК, которая содержит 5'-концевой олигопиримидиновый тракт, часто обозначают как ТОР-мРНК. Таким образом, гены, из которых получают указанные матричные РНК, обозначают как ТОР-гены. Последовательности ТОР, например, обнаружены в генах и мРНК, кодирующих пептидные факторы элонгации и рибосомальные белки.5' oligopyrimidine tract (TOR): The 5' oligopyrimidine tract (TOR) generally refers to a segment of pyrimidine nucleotides located at the 5' end of a nucleic acid molecule, such as the 5' end of some mRNA molecules. or in the 5'-terminal region of a functional element, for example, the transcribed region of some genes. The sequence begins with a cytidine, which typically corresponds to the site of transcription initiation, and is followed by a segment typically consisting of about 3-30 pyrimidine nucleotides. For example, TOP can contain 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 , 26, 27, 28, 29, 30 or even more nucleotides. The pyrimidine segment, and hence the 5'-TOP, terminates in one nucleotide located 5'-direction relative to the first purine nucleotide located downstream of the TOP. Messenger RNA that contains the 5' oligopyrimidine tract is often referred to as TOP mRNA. Thus, the genes from which these messenger RNAs are derived are referred to as TOP genes. TOP sequences, for example, are found in genes and mRNAs encoding peptide elongation factors and ribosomal proteins.

ТОР-мотив: В контексте настоящего изобретения ТОР-мотив представляет собой нуклеотидную последовательность, которая соответствует 5'-ТОР, описанному выше. Таким образом, ТОР-мотив в контексте настоящего изобретения предпочтительно обозначает состоящий из пиримидиновых нуклеотидов сегмент длиной 3-30 нуклеотидов. Предпочтительно ТОР-мотив состоит по меньшей мере из 3 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 4 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 5 пиримидиновых нуклеотидов, более предпочтительно по меньшей мере 6 нуклеотидов, более предпочтительно по меньшей мере 7 нуклеотидов, наиболее предпочтительно по меньшей мере 8 пиримидиновых нуклеотидов, при этом сегмент пиримидиновых нуклеотидов предпочтительно начинается на его 5'-конце с цитозинового нуклеотида. В ТОР-генах и ТОР-мРНК ТОР-мотив предпочтительно начинается на его 5'-конце с сайта инициации транскрипции и заканчивается на расстоянии одного нуклеотида в 5'-направлении относительно первого пуринового остатка в указанном гене или мРНК. В контексте настоящего изобретения ТОР-мотив предпочтительно локализован на 5'-конце последовательности, которая представляет собой 5'-UTR, или на 5'-конце последовательности, которая кодирует 5'-UTR. Таким образом, в контексте настоящего изобретения сегмент из 3 или большего количества пиримидиновых нуклеотидов предпочтительно называют «ТОР-мотивом», если сегмент локализован на 5'-конце соответствующей последовательности, такой как искусственная молекула нуклеиновой кислоты, 5'UTR-элемент искусственной молекулы нуклеиновой кислоты или нуклеотидная последовательность, которая происходит из 5'-UTR ТОР-гена, представленной в настоящем описании. Другими словами, сегмент, состоящий из 3 или большего количества пиримидиновых нуклеотидов, который не локализован на 5'-конце 5'-UTR или 5'-UTR-элемента, но локализован где-либо внутри 5'-UTR или 5'-UTR-элемента, предпочтительно не обозначают как «ТОР-мотив».TOP motif: In the context of the present invention, the TOP motif is a nucleotide sequence that corresponds to the 5'-TOP described above. Thus, the TOP motif in the context of the present invention preferably denotes a 3-30 nucleotide long segment consisting of pyrimidine nucleotides. Preferably the TOP motif consists of at least 3 pyrimidine nucleotides, preferably at least 4 pyrimidine nucleotides, preferably at least 5 pyrimidine nucleotides, more preferably at least 6 nucleotides, more preferably at least 7 nucleotides, most preferably at least 8 pyrimidine nucleotides, with the pyrimidine nucleotide segment preferably beginning at its 5' end with a cytosine nucleotide. In TOP genes and TOP mRNA, the TOP motif preferably starts at its 5' end from the site of transcription initiation and ends one nucleotide away in the 5' direction from the first purine residue in said gene or mRNA. In the context of the present invention, the TOP motif is preferably located at the 5'end of the sequence which is the 5'UTR or at the 5'end of the sequence which encodes the 5'UTR. Thus, in the context of the present invention, a segment of 3 or more pyrimidine nucleotides is preferably referred to as a "TOP motif" if the segment is located at the 5' end of the corresponding sequence, such as an artificial nucleic acid molecule, the 5'UTR element of the artificial nucleic acid molecule or a nucleotide sequence that is derived from the 5'UTR of the TOP gene provided herein. In other words, a segment of 3 or more pyrimidine nucleotides that is not located at the 5' end of the 5'-UTR or 5'-UTR element, but is located somewhere within the 5'-UTR or 5'-UTR- element is preferably not referred to as a "TOP motif".

ТОР-ген: ТОР-гены, как правило, характеризуются присутствием 5'-концевого олигопримидинового тракта. Кроме того, большинство ТОР-генов характеризуются связанной с ростом регуляцией трансляции. Однако известны также ТОР-гены с тканеспецифической регуляцией трансляции. Как указано выше, 5'-UTR ТОР-гена соответствует последовательности 5'-UTR зрелой мРНК, происходящей из ТОР-гена, которая предпочтительно простирается от нуклеотида, примыкающего с 3'-стороны к 5'-кэпу, до нуклеотида, примыкающего с 5'-стороны к стартовому кодону. 5'-UTR ТОР-гена, как правило, не содержит никаких стартовых кодонов, предпочтительно не содержит расположенных в обратном направлении AUG (uAUG) или расположенных в обратном направлении открытых рамок считывания (uOPC). В данном контексте под расположенными в обратном направлении AUG и расположенными в обратном направлении открытыми рамками считывания, как правило, понимают AUG и открытые рамки считывания, которые находятся в 5'-направлении относительно стартового кодона (AUG) открытой рамки считывания, которая должна транслироваться. 5'-UTR ТОР-генов, как правило, являются относительно короткими. Длины 5'-UTR ТОР-генов могут варьироваться от 20 нуклеотидов вплоть до 500 нуклеотидов и, как правило, они содержат менее чем примерно 200 нуклеотидов, предпочтительно менее чем примерно 150 нуклеотидов, более предпочтительно менее чем примерно 100 нуклеотидов. Примерами 5'-UTR ТОР-генов в контексте настоящего изобретения являются нуклеотидные последовательности, простирающиеся от нуклеотида в положении 5 до нуклеотида, непосредственно примыкающего к 5'-концу стартового кодона (например, ATG) в последовательностях, которые представлены в SEQ ID NO: 1-1363 заявки на патент РСТ/ЕР 2012/002448, содержание которой включено в настоящее описание в качестве ссылки. В этом контексте наиболее предпочтительным фрагментом 5'-UTR ТОР-гена является 5'-UTR ТОР-гена без 5'ТОР-мотива. Понятия «5'-UTR ТОР-гена» или «5'-ТОР UTR» предпочтительно относится к 5'-UTR встречающегося в естественных условиях ТОР-гена. Предпочтительным примером является SEQ ID NO: 208 (5'-UTR большой субъединицы человеческого рибосомального белка 32 без 5'-концевого олигопиримидинового тракта); которая соответствует SEQ ID NO: 1368, представленной в заявке на патент WO 2013/143700).TOP gene: TOP genes are generally characterized by the presence of a 5'-terminal oligoprimidine tract. In addition, most TOP genes are characterized by growth-related regulation of translation. However, TOP genes with tissue-specific regulation of translation are also known. As indicated above, the 5'-UTR of the TOP gene corresponds to the sequence of the 5'-UTR of the mature mRNA derived from the TOP gene, which preferably extends from the nucleotide adjacent 3' to the 5' cap to the nucleotide adjacent 5 '-sides to the start codon. The 5'UTR of the TOP gene generally does not contain any start codons, preferably no upstream AUGs (uAUGs) or upstream open reading frames (uOPCs). In this context, reversed AUGs and reversed open reading frames are generally understood to mean AUGs and open reading frames that are 5' from the start codon (AUG) of the open reading frame to be translated. The 5'UTRs of TOP genes tend to be relatively short. The lengths of the 5'UTRs of TOP genes can vary from 20 nucleotides up to 500 nucleotides and are typically less than about 200 nucleotides, preferably less than about 150 nucleotides, more preferably less than about 100 nucleotides. Examples of the 5' UTRs of TOP genes in the context of the present invention are nucleotide sequences extending from the nucleotide at position 5 to the nucleotide immediately adjacent to the 5' end of the start codon (eg, ATG) in the sequences shown in SEQ ID NO: 1 -1363 patent application PCT/EP 2012/002448, the contents of which are incorporated herein by reference. In this context, the most preferred fragment of the 5'UTR of the TOP gene is the 5'UTR of the TOP gene without the 5'TOP motif. The terms "5'-UTR of the TOP gene" or "5'-TOP UTR" preferably refers to the 5'-UTR of the naturally occurring TOP gene. A preferred example is SEQ ID NO: 208 (5'-UTR of the large subunit of human ribosomal protein 32 without a 5'-oligopyrimidine tract); which corresponds to SEQ ID NO: 1368 presented in patent application WO 2013/143700).

Дикий тип, например, молекула нуклеиновой кислоты дикого типа: Понятие «дикий тип» может относиться к последовательности, встречающейся в естественных условиях. Под молекулой нуклеиновой кислоты дикого типа, как правило, следует понимать молекулу нуклеиновой кислоты, например, ДНК или РНК, которая встречается в естественных условиях. Иными словами, под искусственной молекулой нуклеиновой кислоты можно понимать встречающуюся в естественных условиях молекулу нуклеиновой кислоты. Такая молекула нуклеиновой кислоты может рассматриваться как встречающаяся в естественных условиях благодаря ее индивидуальной последовательности (которая встречается в естественных условиях) и/или вследствие наличия других модификаций, например, структурных модификаций нуклеотидов, которые встречаются в естественных условиях. Молекула нуклеиновой кислоты дикого типа может представлять собой молекулу ДНК, молекулу РНК или гибридную молекулу, содержащую ДНК- и РНК-сегменты. В контексте настоящего описания понятие «дикий тип» относится к любой последовательности, если она встречается в природе, при этом не требуется, чтобы она имелась в публично доступных коллекциях последовательностей, таких как GenBank. Национальные институты здоровья (NIH) располагают публично доступной аннотированной коллекцией публично доступных нуклеотидных последовательностей («GenBank», доступной с помощью системы поиска NCBI Entrez: http://www.ncbi.nlm.nih.gov), (Nucleic Acids Research; 41(D1), 2013, D36-42), которая включает публично доступные последовательности дикого типа. Каждой единице записи в GenBank приписан уникальный постоянный идентификатор, называемый кодом доступа и присутствующий в строке ACCESSION единицы записи в GenBank; а изменения в данных о последовательности отслеживаются с помощью численного расширения кода доступа, присутствующего в строке VERSION единицы записи в GenBank. Кроме того, понятие «молекула нуклеиновой кислоты дикого типа» не сводится к понятию «одна единственная молекула», а, как правило, подразумевается, что оно включает совокупность идентичных молекул. Следовательно, оно относится к множеству идентичных молекул, содержащихся в аликвоте.Wild type, eg, wild type nucleic acid molecule: The term "wild type" may refer to a naturally occurring sequence. A wild-type nucleic acid molecule is generally understood to mean a nucleic acid molecule, such as DNA or RNA, that occurs naturally. In other words, an artificial nucleic acid molecule can be understood as a naturally occurring nucleic acid molecule. Such a nucleic acid molecule may be considered to be naturally occurring due to its individual sequence (which occurs naturally) and/or due to the presence of other modifications, such as structural modifications of nucleotides, which occur naturally. The wild-type nucleic acid molecule can be a DNA molecule, an RNA molecule, or a hybrid molecule containing DNA and RNA segments. In the context of the present description, the term "wild type" refers to any sequence, if it occurs in nature, it is not required that it be in publicly available collections of sequences, such as GenBank. The National Institutes of Health (NIH) maintains a publicly accessible annotated collection of publicly available nucleotide sequences ("GenBank", accessible through the NCBI Entrez search engine: http://www.ncbi.nlm.nih.gov), (Nucleic Acids Research; 41( D1), 2013, D36-42), which includes publicly available wild-type sequences. Each GenBank record is assigned a unique permanent identifier, called an access code, which appears in the ACCESSION line of the GenBank record; and changes in the sequence data are tracked by the numeric expansion of the access code present in the VERSION line of the GenBank record unit. In addition, the concept of "wild-type nucleic acid molecule" is not limited to the concept of "one single molecule", but, as a rule, it is understood that it includes a set of identical molecules. Therefore, it refers to a plurality of identical molecules contained in an aliquot.

Подробное описаниеDetailed description

Изобретение относится к искусственной молекуле нуклеиновой кислоты, содержащей по меньшей мере одну открытую рамку считывания и по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент), и/или по меньшей мере один элемент 5'-нетранслируемой области (5'-UTR-элемент), где указанная искусственная молекула нуклеиновой кислоты характеризуется высокой эффективностью трансляции. Эффективность трансляции обусловлена, по меньшей мере частично, 5'-UTR-элементом или 3'-UTR-элементом, или и 5'-UTR-элементом и 3'-UTR-элементом. Изобретение относится также к применению такой искусственной молекулы нуклеиновой кислоты в генной терапии и/или генетической вакцинации. Кроме того, предложены новые 3'-UTR-элементы и 5'-UTR-элементы.The invention relates to an artificial nucleic acid molecule containing at least one open reading frame and at least one element of the 3'-untranslated region (3'-UTR element), and/or at least one element of the 5'-untranslated region ( 5'-UTR element), where the specified artificial nucleic acid molecule is characterized by high translation efficiency. Translation efficiency is due at least in part to the 5'UTR element or the 3'UTR element, or both the 5'UTR element and the 3'UTR element. The invention also relates to the use of such an artificial nucleic acid molecule in gene therapy and/or genetic vaccination. In addition, new 3'-UTR elements and 5'-UTR elements have been proposed.

Первый объект настоящего изобретения относится к искусственной молекуле нуклеиновой кислоты, содержащейThe first object of the present invention relates to an artificial nucleic acid molecule containing

а. по меньшей мере одну открытую рамку считывания (ОРС); иa. at least one open reading frame (ORF); and

б. по меньшей мере один элемент, представляющий собой 3'-нетранслируемую область (3'-UTR-элемент), и/или по меньшей мере один элемент, представляющий собой 5'-нетранслируемую область (5'-UTR-элемент),b. at least one element representing a 3'-untranslated region (3'-UTR element) and/or at least one element representing a 5'-untranslated region (5'-UTR element),

где указанная искусственная молекула нуклеиновой кислоты характеризуется высокой эффективностью трансляции.wherein said artificial nucleic acid molecule is characterized by high translation efficiency.

Например, искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, может отличаться от других (например, дикого типа или искусственных) молекул нуклеиновой кислоты тем, что по меньшей мере один 3'-UTR-элемент (предпочтительно один 3'-UTR-элемент) заменен по меньшей мере на один неидентичный 3'-UTR-элемент (предпочтительно на один 3'-UTR-элемент), или тем, что по меньшей мере один 5'-UTR-элемент (предпочтительно один 5'-UTR-элемент) заменен по меньшей мере на один неидентичный 5'-UTR-элемент (предпочтительно на один 5'-UTR-элемент).For example, an artificial nucleic acid molecule of the invention may differ from other (eg, wild-type or artificial) nucleic acid molecules in that at least one 3'-UTR element (preferably one 3'-UTR element) is replaced at least one non-identical 3'-UTR element (preferably one 3'-UTR element), or that at least one 5'-UTR element (preferably one 5'-UTR element) is replaced by at least one non-identical 5'UTR element (preferably one 5'UTR element).

В целом, замена одного (или по меньшей мере одного) 3'-UTR-элемента или замена одного (или по меньшей мере одного) 5'-UTR-элемента (в исходной молекуле нуклеиновой кислоты или референс-молекуле нуклеиновой кислоты), как правило, означает, что последовательность, содержащую по меньшей мере некоторые нуклеотиды указанного 3'-UTR-элемента или указанного 5'-UTR-элемента, заменяют на неидентичную последовательность нуклеиновой кислоты. Предпочтительно, когда заменяют 5'-UTR-элемент, то непрерывную последовательность нуклеотидов 5'-UTR-элемента заменяют на неидентичную непрерывную последовательность (элемент) нуклеотидов; а когда заменяют 3'-UTR-элемент, то непрерывную последовательность нуклеотидов 3'-UTR-элемента заменяют на неидентичную непрерывную последовательность (элемент) нуклеотидов. Непрерывная последовательность нуклеотидов исходного (подлежащего замене) элемента и заменяющего элемента, каждая независимо может иметь любую длину, например, от 1 до более чем 500 нуклеотидов, от 20 до 500 нуклеотидов, от 40 до 400 нуклеотидов, от 60 до 300 нуклеотидов, от 80 до 200 нуклеотидов или от 100 до 150 нуклеотидов. Когда заменяют (5'- или 3'-) UTR-элемент, это не означает, что необходимо заменять все нуклеотиды, расположенные с 5'-стороны от стартового кодона или все нуклеотиды, расположенные с 3'-стороны от стоп-кодона. В предпочтительных вариантах осуществления изобретения заменяют непрерывную последовательность, которая представляет собой поднабор всех нуклеотидов, локализованных с 5'-стороны от стартового кодона, или поднабор всех нуклеотидов, локализованных с 3'-стороны от стоп-кодона соответственно. Такие примеры представлены на фиг. 1Б (5') и 1В (3'). Можно заменять строго известный 5'-UTR-элемент или известный 3'-UTR-элемент, присутствующий в исходной последовательности или референс-последовательности. Например, если нуклеиновая кислота (например, нуклеиновая референс-кислота) содержит 5'-UTR-элемент, соответствующий последовательности, представленной в SEQ ID NO: 208, то искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, можно создавать путем замены строго всей непрерывной последовательности, представленной в SEQ ID NO: 208, на неидентичный непрерывный 5'-UTR-элемент, предлагаемый в настоящем изобретении, т.е. на 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции. Альтернативно этому, можно заменять не только (строго) известный UTR-элемент, например, заменять непрерывную нуклеотидную последовательность, содержащую дополнительные нуклеотиды, т.е. являющиеся дополнительными по отношению к известному UTR-элементу, или, например, заменять только часть известного UTR-элемента (как правило, основную часть, т.е. 90% его длины или более). Хотя эти возможности проиллюстрированы в настоящем описании для случая 5'-UTR-элементов, те же самые возможности существуют также и для 3'-UTR-элементов. Иными словами, замещенный UTR-элемент не обязательно должен строго соответствовать границам известного UTR-элемента. Эти возможности дополнительно проиллюстрированы с помощью примера на фиг. 1Б и фиг. 1В соответственно, в каждом случае в сравнении с фиг. 1А. Аналогично этому замещающий UTR-элемент не обязательно должен строго соответствовать границам известного UTR-элемента.In general, a substitution of one (or at least one) 3'UTR element, or a substitution of one (or at least one) 5'UTR element (in the parent or reference nucleic acid molecule) is generally , means that a sequence containing at least some of the nucleotides of the specified 3'-UTR element or the specified 5'-UTR element, is replaced with a non-identical nucleic acid sequence. Preferably, when the 5'-UTR element is replaced, the contiguous nucleotide sequence of the 5'-UTR element is replaced with a non-identical contiguous nucleotide sequence (element); and when the 3'-UTR element is replaced, the contiguous nucleotide sequence of the 3'-UTR element is replaced with a non-identical contiguous nucleotide sequence (element). A continuous sequence of nucleotides of the original (to be replaced) element and the replacement element, each independently can be of any length, for example, from 1 to more than 500 nucleotides, from 20 to 500 nucleotides, from 40 to 400 nucleotides, from 60 to 300 nucleotides, from 80 up to 200 nucleotides or from 100 to 150 nucleotides. When a (5'- or 3'-) UTR element is replaced, this does not mean that all nucleotides located 5'-side of the start codon or all nucleotides located 3'-side of the stop codon need to be replaced. In preferred embodiments, a contiguous sequence is replaced that is a subset of all nucleotides located 5' to the start codon or a subset of all nucleotides located 3' to the stop codon, respectively. Such examples are shown in Fig. 1B (5') and 1C (3'). You can replace a well-known 5'-UTR element or a known 3'-UTR element present in the original sequence or reference sequence. For example, if a nucleic acid (for example, a nucleic reference acid) contains a 5'-UTR element corresponding to the sequence shown in SEQ ID NO: 208, then an artificial nucleic acid molecule of the present invention can be created by replacing strictly the entire continuous sequence shown in SEQ ID NO: 208, on a non-identical continuous 5'-UTR element, proposed in the present invention, ie. on the 5'-UTR element, which ensures high translation efficiency. Alternatively, it is possible to replace not only the (strictly) known UTR element, for example, to replace a continuous nucleotide sequence containing additional nucleotides, i. e. that are complementary to a known UTR element, or, for example, replace only part of a known UTR element (usually the main part, i.e. 90% of its length or more). While these possibilities are illustrated herein for 5'UTR elements, the same possibilities exist for 3'UTR elements as well. In other words, the replaced UTR element need not strictly conform to the boundaries of the known UTR element. These possibilities are further illustrated with the example in FIG. 1B and FIG. 1B respectively, in each case in comparison with FIG. 1A. Similarly, a replacement UTR element does not need to strictly conform to the boundaries of a known UTR element.

Предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, не содержит 3'-UTR (элемент) и/или 5'-UTR (элемент) рибосомального белка S6, RPL36AL, rps16 или рибосомального белка L9. Более предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, не содержит 3'-UTR (элемент) и/или 5'-UTR (элемент) рибосомального белка S6, RPL36AL, rps16 или рибосомального белка L9 и открытая рамка считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, не кодирует белок GFP. Еще более предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, не содержит 3'-UTR (элемент) и/или 5'-UTR (элемент) рибосомального белка S6, RPL36AL, rps16 или рибосомального белка L9 и открытая рамка считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, не кодирует репортерный белок, например, выбранный из группы, которая состоит из белков глобина (прежде всего, бета-глобина), белка люциферазы, белков GFP, белков глюкуронидазы (прежде всего, бета-глюкуронидазы) или их вариантов, например, вариантов, последовательности которых идентичны по меньшей мере на 70% последовательности белка глобина, белка люциферазы, белка GFP или белка глюкуронидазы.Preferably, the artificial nucleic acid molecule of the present invention does not contain the 3'-UTR (element) and/or 5'-UTR (element) of the S6 ribosomal protein, RPL36AL, rps16 or the L9 ribosomal protein. More preferably, the artificial nucleic acid molecule of the present invention does not contain the 3'-UTR (element) and/or 5'-UTR (element) of the S6 ribosomal protein, RPL36AL, rps16 or L9 ribosomal protein and the open reading frame of the artificial nucleic acid molecule , proposed in the present invention, does not encode the GFP protein. Even more preferably, the artificial nucleic acid molecule of the present invention does not contain the 3'-UTR (element) and/or 5'-UTR (element) of ribosomal protein S6, RPL36AL, rps16 or ribosomal protein L9 and the open reading frame of the artificial nucleic acid molecule acid of the present invention does not encode a reporter protein, for example, selected from the group consisting of globin proteins (primarily beta-globin), luciferase protein, GFP proteins, glucuronidase proteins (primarily beta-glucuronidase) or their variants, for example, variants whose sequences are at least 70% identical to the sequence of a globin protein, a luciferase protein, a GFP protein, or a glucuronidase protein.

Понятие «3'-UTR-элемент» относится к нуклеотидной последовательности, которая содержит или состоит из нуклеотидной последовательности, полученной из 3'-UTR или из варианта или фрагмента 3'-UTR. Понятие «3'-UTR-элемент» предпочтительно относится к нуклеотидной последовательности, которая содержится в 3'-UTR искусственной нуклеотидной последовательности, такой как искусственная мРНК. Следовательно, в контексте настоящего изобретения 3'-UTR-элемент предпочтительно может представлять собой 3'-UTR мРНК, предпочтительно искусственной мРНК, или может содержаться в 3'-UTR соответствующей матрицы для транскрипции. Предпочтительно 3'-UTR-элемент представляет собой нуклеотидную последовательность, которая соответствует 3'-UTR мРНК, предпочтительно 3'-UTR искусственной мРНК, такой как мРНК, полученная в результате транскрипции созданной генетическими методами векторной конструкции. Предпочтительно 3'-UTR-элемент в контексте настоящего изобретения функционирует в качестве 3'-UTR или кодирует нуклеотидную последовательность, которая выполняет функцию 3'-UTR.The term "3'-UTR element" refers to a nucleotide sequence that contains or consists of a nucleotide sequence derived from a 3'-UTR or from a 3'-UTR variant or fragment. The term "3'-UTR element" preferably refers to a nucleotide sequence that is contained in a 3'-UTR of an artificial nucleotide sequence, such as an artificial mRNA. Therefore, in the context of the present invention, the 3'UTR element may preferably be the 3'UTR of an mRNA, preferably an artificial mRNA, or may be contained in the 3'UTR of an appropriate transcription template. Preferably, the 3'UTR element is a nucleotide sequence that corresponds to the 3'UTR of an mRNA, preferably the 3'UTR of an artificial mRNA, such as an mRNA obtained by transcription of a genetically engineered vector construct. Preferably, the 3'UTR element in the context of the present invention functions as a 3'UTR or encodes a nucleotide sequence that functions as a 3'UTR.

Соответственно понятие «5'-UTR-элемент» относится к нуклеотидной последовательности, которая содержит или состоит из нуклеотидной последовательности, полученной из 5'-UTR или из варианта или фрагмента 5'-UTR. Понятие «5'-UTR-элемент» предпочтительно относится к нуклеотидной последовательности, которая содержится в 5'-UTR искусственной нуклеотидной последовательности, такой как искусственная мРНК. Следовательно, в контексте настоящего изобретения 5'-UTR-элемент предпочтительно может представлять собой 5'-UTR мРНК, предпочтительно искусственной мРНК, или может содержаться в 5'-UTR соответствующей матрицы для транскрипции. Предпочтительно 5'-UTR-элемент представляет собой нуклеотидную последовательность, которая соответствует 5'-UTR мРНК, предпочтительно 5'-UTR искусственной мРНК, такой как мРНК, полученной в результате транскрипции созданной генетическими методами векторной конструкции. Предпочтительно 5'-UTR-элемент в контексте настоящего изобретения функционирует в качестве 5'-UTR или кодирует нуклеотидную последовательность, которая выполняет функцию 5'-UTR.Accordingly, the term "5'-UTR element" refers to a nucleotide sequence that contains or consists of a nucleotide sequence derived from a 5'-UTR or from a 5'-UTR variant or fragment. The term "5'-UTR element" preferably refers to a nucleotide sequence that is contained in a 5'-UTR of an artificial nucleotide sequence, such as an artificial mRNA. Therefore, in the context of the present invention, the 5'UTR element may preferably be the 5'UTR of an mRNA, preferably an artificial mRNA, or may be contained in the 5'UTR of an appropriate transcription template. Preferably the 5'UTR element is a nucleotide sequence that corresponds to the 5'UTR of an mRNA, preferably the 5'UTR of an artificial mRNA, such as an mRNA obtained by transcription of a genetically engineered vector construct. Preferably, the 5'UTR element in the context of the present invention functions as a 5'UTR or encodes a nucleotide sequence that functions as a 5'UTR.

3'-UTR-элемент и/или 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты. Так, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может, в частности, содержать:The 3'UTR element and/or the 5'UTR element in the artificial nucleic acid molecule of the present invention provides high translation efficiency of said artificial nucleic acid molecule. Thus, an artificial nucleic acid molecule according to the present invention may, in particular, contain:

3'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты,3'-UTR element, which ensures high efficiency of translation of the specified artificial nucleic acid molecule,

5'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты,5'-UTR element, which ensures high efficiency of translation of the specified artificial nucleic acid molecule,

3'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, и 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты.a 3'UTR element that provides high translation efficiency of said artificial nucleic acid molecule; and a 5'UTR element that provides high translation efficiency of said artificial nucleic acid molecule.

Предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит 3'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, и/или 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты.Preferably, the artificial nucleic acid molecule of the present invention comprises a 3'-UTR element that provides high translation efficiency of said artificial nucleic acid molecule and/or a 5'-UTR element that provides high translation efficiency of said artificial nucleic acid molecule. .

Предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит по меньшей мере один 3'-UTR-элемент и по меньшей мере один 5'-UTR-элемент, а именно, по меньшей мере один 3'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, и по меньшей мере один 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты.Preferably, the artificial nucleic acid molecule of the present invention contains at least one 3'-UTR element and at least one 5'-UTR element, namely at least one 3'-UTR element, which provides high translation efficiency of said artificial nucleic acid molecule, and at least one 5'-UTR element that provides high translation efficiency of said artificial nucleic acid molecule.

Как подробно описано ниже, указанный по меньшей мере один 3'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, или указанный по меньшей мере один 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, может быть выбран из встречающихся в естественных условиях (предпочтительно гетерологичных) 3'-UTR-элементов и 5'-UTR-элементов (в совокупности обозначены как встречающиеся в естественных условиях UTR-элементы или UTR-элементы дикого типа), и из искусственных 3'-UTR-элементов и искусственных 5'-UTR-элементов (в совокупности обозначены как искусственные UTR-элементы). UTR-элементы дикого типа можно выбирать из группы, состоящей из UTR-элементов дикого типа, известных из литературы и имеющихся в публично доступных базах данных, таких как GenBank (NCBI), и UTR-элементов дикого типа, которые не были ранее опубликованы. Последние можно идентифицировать путем секвенирования мРНК, присутствующих в клетках, предпочтительно в клетках млекопитающих. С использованием такого подхода при создании изобретения было идентифицировано несколько не опубликованных ранее UTR-элементов дикого типа, и UTR-элементы этого типа предложены в настоящем изобретении. Понятие «искусственный UTR-элемент» не накладывает специальных ограничений и может относиться к любой нуклеотидной последовательности, которая не обнаружена в естественных условиях, т.е. не является идентичной UTR-элементу дикого типа. Однако, в предпочтительных вариантах осуществления изобретения искусственный UTR-элемент, применяемый согласно настоящему изобретению, представляет собой нуклеотидную последовательность, которая обладает определенной степенью идентичности с последовательностью UTR-элемента дикого типа, например, составляющей от 10 до 99,9%, от 20 до 99%, от 30 до 98%, от 40 до 97%, от 50 до 96%, от 60 до 95%, от 70 до 90%. В предпочтительных вариантах осуществления изобретения искусственная UTR, применяемая согласно настоящему изобретению, идентична UTR дикого типа за исключением того, что один или два, или три, или четыре, или пять или более пяти нуклеотидов заменены таким же количеством нуклеотидов (например, один нуклеотид заменен на один нуклеотид). Предпочтительно замена одного нуклеотида представляет собой замену на соответствующий комплементарный нуклеотид. Предпочтительные искусственные UTR-элементы соответствуют UTR-элементам дикого типа за исключением того, что (I) некоторые или все триплеты ATG в 5'-UTR-элементе дикого типа (если они присутствуют) превращены в триплет TAG; и/или (II) выбранный(е) сайт(ы) расщепления конкретной рестриктазой в 5'-UTR-элементе дикого типа или в 3'-UTR-элементе дикого типа (если он присутствует) элиминированы путем замены одного нуклеотида в сайте расщепления указанной специфической рестриктазой на комплементарный нуклеотид, что приводит к удалению сайтов расщепления указанной специфической рестриктазой. Последнее, как правило, требуется в том случае, когда UTR-элемент (например, дикого типа) содержит сайт расщепления указанной специфической рестриктазой, и когда указанную конкретную рестриктазу используют (планируют использовать) на последующих стадиях клонирования.As detailed below, said at least one 3'UTR element that provides high translation efficiency of said artificial nucleic acid molecule, or said at least one 5'UTR element that provides high translation efficiency of said artificial nucleic acid molecule acids, can be selected from naturally occurring (preferably heterologous) 3'-UTR elements and 5'-UTR elements (collectively referred to as naturally occurring UTR elements or wild-type UTR elements), and from artificial 3'UTR elements and artificial 5'UTR elements (collectively referred to as artificial UTR elements). Wild type UTR elements can be selected from the group consisting of wild type UTR elements known from the literature and available in publicly available databases such as GenBank (NCBI) and wild type UTR elements that have not been previously published. The latter can be identified by sequencing mRNAs present in cells, preferably mammalian cells. Using this approach, several previously unpublished wild-type UTR elements were identified in the invention, and UTR elements of this type are proposed in the present invention. The term "artificial UTR element" is not particularly limited and may refer to any nucleotide sequence that is not found naturally, i.e. is not identical to a wild-type UTR element. However, in preferred embodiments of the invention, the artificial UTR element used according to the present invention is a nucleotide sequence that has a certain degree of identity with the sequence of the wild-type UTR element, for example, ranging from 10 to 99.9%, from 20 to 99 %, 30 to 98%, 40 to 97%, 50 to 96%, 60 to 95%, 70 to 90%. In preferred embodiments, the artificial UTR used according to the present invention is identical to the wild-type UTR except that one or two or three or four or five or more than five nucleotides are replaced by the same number of nucleotides (e.g., one nucleotide is replaced by one nucleotide). Preferably, the single nucleotide substitution is a substitution for the corresponding complementary nucleotide. Preferred artificial UTR elements correspond to wild-type UTR elements, except that (i) some or all of the ATG triplets in the wild-type 5' UTR element (if present) are converted to a TAG triplet; and/or (II) the selected restriction enzyme cleavage site(s) in the wild-type 5'-UTR element or in the wild-type 3'-UTR element (if present) are eliminated by replacing one nucleotide in the cleavage site of the specified specific restriction enzyme to a complementary nucleotide, which results in the removal of cleavage sites by said specific restriction enzyme. The latter is generally required when the UTR element (eg, wild-type) contains a cleavage site for said specific restriction enzyme, and when said specific restriction enzyme is (is intended to be) used in subsequent cloning steps.

Поскольку такое расщепление внутри 5'-UTR-элементов и 3'-UTR-элементов является нежелательным, то можно создавать искусственный UTR-элемент, в котором элиминирован сайт рестрикции, расщепляемый указанной специфической рестриктазой. Такую замену можно осуществлять с помощью любого пригодного метода, известного специалисту в данной области, например, с помощью ПЦР с использованием модифицированных праймеров.Since such cleavage within 5'-UTR elements and 3'-UTR elements is undesirable, it is possible to create an artificial UTR element in which the restriction site cleaved by said specific restriction enzyme is eliminated. Such replacement can be carried out using any suitable method known to the person skilled in the art, for example, using PCR using modified primers.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, необязательно содержит по меньшей мере один 3'-UTR-элемент и по меньшей мере один 5'-ЦТК-элемент, а именно, по меньшей мере один 3'-UTR-элемент, который пролонгирует и/или повышает производство белка, кодируемого указанной искусственной молекулой нуклеиновой кислоты, и по меньшей мере один 5'-UTR-элемент, который пролонгирует и/или повышает производство белка, кодируемого указанной искусственной молекулой нуклеиновой кислоты.The artificial nucleic acid molecule of the present invention optionally contains at least one 3'UTR element and at least one 5'CTC element, namely at least one 3'UTR element that prolongs and/or increases the production of a protein encoded by said artificial nucleic acid molecule and at least one 5'-UTR element that prolongs and/or increases the production of a protein encoded by said artificial nucleic acid molecule.

Производство белка: Анализ для определения того, имеет ли место пролонгирование и/или повышение производства белкаProtein production: Assay to determine if there is a prolongation and/or increase in protein production

«Пролонгирование и/или повышение производства белка с указанной искусственной молекулы нуклеиновой кислоты» в целом относится к количеству белка, продуцируемого с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, которая содержит соответствующий 3'-UTR-элемент и/или 5'-UTR-элемент, по сравнению с количеством белка, продуцируемого с соответствующей нуклеиновой референс-кислоты, которая не содержит 3'-UTR и/или 5'-UTR или содержит референс-3'-UTR и/или референс-5'-UTR, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях в комбинации с ОРС."Prolonging and/or increasing protein production from said artificial nucleic acid molecule" generally refers to the amount of protein produced from an artificial nucleic acid molecule of the present invention that contains the appropriate 3'-UTR element and/or 5'-UTR element, as compared to the amount of protein produced from the corresponding nucleic acid reference that does not contain a 3'-UTR and/or 5'-UTR or contains a reference 3'-UTR and/or a reference 5'-UTR, such as a 3'UTR and/or a 5'UTR occurring naturally in combination with an ORF.

В частности, по меньшей мере один 3'-UTR-элемент и/или 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, пролонгирует производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, которая не содержит 3'-UTR и/или 5'-UTR или содержит референс-3'-UTR и/или референс-5'- UTR, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях в комбинации с ОРС.In particular, at least one 3'-UTR element and/or 5'-UTR element of the artificial nucleic acid molecule of the present invention prolongs the production of protein from the artificial nucleic acid molecule of the present invention, for example, from mRNA , proposed in the present invention, compared with the corresponding nucleic acid, which does not contain 3'-UTR and/or 5'-UTR or contains a reference-3'-UTR and/or reference-5'-UTR, such as 3'- UTR and/or 5'-UTR occurring naturally in combination with ORF.

В частности, по меньшей мере один 3'-UTR-элемент и/или 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает производство белка, прежде всего экспрессию белка или общее производство белка, с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, которая не содержит 3'-UTR и/или 5'-UTR или содержит референс-3'-UTR и/или референс-5'-UТР, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях в комбинации с ОРС.In particular, at least one 3'-UTR element and/or 5'-UTR element of the artificial nucleic acid molecule of the present invention increases protein production, especially protein expression or overall protein production, from the artificial nucleic acid molecule. , proposed in the present invention, for example, with the mRNA proposed in the present invention, compared with the corresponding nucleic acid that does not contain a 3'-UTR and/or 5'-UTR or contains a reference 3'-UTR and/or a reference 5'-UTR, such as 3'-UTR and/or 5'-UTR, occurring naturally in combination with ORF.

Предпочтительно по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, не оказывает отрицательного влияния на эффективность трансляции нуклеиновой кислоты по сравнению с эффективностью трансляции соответствующей нуклеиновой кислоты, которая не содержит 3'-UTR и/или 5'-UTR или содержит референс-3'-UTR и/или референс-5'-UTR, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. В альтернативном варианте 3'-UTR и/или 5'-UTR повышают эффективность трансляции по сравнению с эффективностью трансляции белка, кодируемого соответствующей ОРС в ее естественной окружении.Preferably, at least one 3'-UTR element and/or at least one 5'-UTR element of the artificial nucleic acid molecule of the present invention does not adversely affect the translation efficiency of the nucleic acid compared to the translation efficiency of the corresponding nucleic acid. an acid that does not contain a 3'-UTR and/or a 5'-UTR or contains a reference 3'-UTR and/or a reference 5'-UTR, such as a 3'-UTR and/or a 5'-UTR occurring in natural conditions in combination with ORS. Alternatively, the 3'-UTR and/or 5'-UTR increase the efficiency of translation compared to the efficiency of translation of the protein encoded by the corresponding ORF in its natural environment.

Понятие «соответствующая молекула нуклеиновой кислоты» или «референс-молекула нуклеиновой кислоты», используемое в настоящем описании, означает, что за исключением различных 3'-UTR и/или 5'-UTR, референс-молекула нуклеиновой кислоты сопоставима, предпочтительно идентична, искусственной молекуле нуклеиновой кислоты, предлагаемой в изобретении, которая содержит 3'-UTR-элемент и/или 5'-UTR-элемент.The term "corresponding nucleic acid molecule" or "reference nucleic acid molecule", as used in the present description, means that with the exception of different 3'-UTR and/or 5'-UTR, the reference nucleic acid molecule is comparable, preferably identical, artificial a nucleic acid molecule according to the invention which contains a 3'UTR element and/or a 5'UTR element.

Для оценки производства белка с предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты in vivo или in vitro, как указано в настоящем описании (т.е. in vitro относится к («живым») клеткам и/или ткани, включая ткань живого индивидуума; клетки включают, в частности, клеточные линии, первичные клетки, клетки в ткани или в организме индивидуумов, предпочтительными являются клетки млекопитающих, например, человеческие клетки и мышиные клетки, и наиболее предпочтительными являются человеческие линии клеток HeLa, HEPG2 и U-937 и мышиные линии клеток NIH3T3, JAWSII и L929, кроме того, наиболее предпочтительными являются первичные клетки, в наиболее предпочтительных вариантах осуществления изобретения - человеческие кожные фибробласты (HDF)), определяют экспрессию кодируемого белка после осуществления инъекции/трансфекции предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты в клетки-/ткани-мишени и сравнения с экспрессией белка, индуцируемой нуклеиновой референс-кислотой. В данной области известны количественные методы определения экспрессии белка (например, вестерн-блоттинг, FACS, ELISA, масс-спектрометрия). В рассматриваемом контексте наиболее пригодным является определение экспрессии репортерных белков типа люциферазы, зеленого флуоресцентного белка (GFP) или секретируемой щелочной фосфатазы (SEAP). Для этого искусственную нуклеиновую кислоту, предлагаемую в изобретении, или нуклеиновую референс-кислоту интродуцируют в ткань-мишень или клетку-мишень, например, посредством трансфекции или инъекции, предпочтительно в систему экспрессии млекопитающих, такую как клетки млекопитающих, например, в клетки линии HDF, L929, HepG2 и/или Hela. Через несколько часов или через несколько дней (например, через 6, 12, 24, 48 или 72 ч) после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты берут образец клеток-мишеней и проводят измерения с помощью FACS и/или лизируют. После этого лизаты можно использовать для обнаружения экспрессированного белка (и определения тем самым эффективности экспрессии белка) с помощью нескольких методов, например, вестерн-блоттинга, FACS, ELISA, масс-спектрометрии или путем измерения флуоресценции или люминесценции.To evaluate the production of a protein from an artificial nucleic acid molecule of the invention in vivo or in vitro as defined herein (i.e., in vitro refers to (“live”) cells and/or tissue, including tissue from a living individual; cells include in particular cell lines, primary cells, cells in tissue or in the body of individuals, mammalian cells such as human cells and mouse cells are preferred, and most preferred are human HeLa, HEPG2 and U-937 cell lines and mouse NIH3T3 cell lines , JAWSII and L929, in addition, the most preferred are primary cells, in the most preferred embodiments of the invention - human dermal fibroblasts (HDF)), determine the expression of the encoded protein after the injection / transfection of the artificial nucleic acid molecule of the invention into cells / tissues -targets and comparisons with protein expression induced by nucleic reference acid. Quantitative methods for determining protein expression are known in the art (eg Western blotting, FACS, ELISA, mass spectrometry). In this context, the most suitable is the determination of the expression of reporter proteins such as luciferase, green fluorescent protein (GFP) or secreted alkaline phosphatase (SEAP). To do this, the artificial nucleic acid according to the invention or the reference nucleic acid is introduced into the target tissue or target cell, for example by transfection or injection, preferably into a mammalian expression system, such as mammalian cells, for example into HDF cells, L929, HepG2 and/or Hela. Hours or days later (eg 6, 12, 24, 48 or 72 hours) after initiation of expression or after introduction of the nucleic acid molecule, a sample of target cells is taken and measured by FACS and/or lysed. The lysates can then be used to detect the expressed protein (and thereby determine the efficiency of protein expression) by several methods, such as Western blotting, FACS, ELISA, mass spectrometry, or by measuring fluorescence or luminescence.

Следовательно, если экспрессию белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, сравнивают с экспрессией белка с референс-молекулы нуклеиновой кислоты в определенные моменты времени (например, через 6, 12, 24, 48 или 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты), то обе молекулы нуклеиновой кислоты интродуцируют по отдельности в ткани-/клетки-мишени, берут образец ткани/клеток в определенный момент времени, приготавливают белковые лизаты согласно конкретному протоколу, скорректированному для конкретного метода обнаружения (например, для вестерн-блоттинга, ELISA, измерения флуоресценции или люминесценции и т.д., как это известно в данной области) и проводят обнаружение белка с помощью выбранного метода обнаружения. В качестве альтернативы измерениям количеств экспрессируемого белка в клеточных лизатах, или в дополнение к измерениям количеств белка в клеточных лизатах, с помощью FACS-анализа можно определять количества белка также до лизиса собранных клеток или параллельно с использованием аликвот.Therefore, if the expression of a protein from an artificial nucleic acid molecule of the invention is compared with the expression of a protein from a reference nucleic acid molecule at certain time points (for example, 6, 12, 24, 48, or 72 hours after the initiation of expression or after the introduction of the molecule nucleic acid), then both nucleic acid molecules are introduced separately into target tissues/cells, a sample of tissue/cells is taken at a certain point in time, protein lysates are prepared according to a specific protocol adjusted for a specific detection method (for example, for Western blotting, ELISA, fluorescence or luminescence measurements, etc., as known in the art) and detect the protein using the selected detection method. As an alternative to measuring the amounts of expressed protein in cell lysates, or in addition to measuring the amounts of protein in cell lysates, FACS analysis can also determine the amount of protein prior to lysis of harvested cells or in parallel using aliquots.

Понятие «пролонгирование производства белка» с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, предпочтительно означает, что производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, пролонгируется по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, например, которая содержит референс-3'-UTR и/или референс-5'-UTR или в которой отсутствует 3'-UTR и/или референс-5'-UTR, предпочтительно в экспрессионной системе млекопитающих, такой как HDF, L929, HEP2G или HeLa-клетки. Так, белок, продуцируемый с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, можно обнаруживать в течение более длительного периода времени, чем тот, в течение которого можно обнаруживать белок, продуцируемый с референс-молекулы нуклеиновой кислоты. Иными словами, количество белка, продуцированного с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, измеренное в более поздний момент времени, например, через 48 ч или 72 ч после трансфекции, больше, чем количество белка, продуцированного с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, в соответствующий более поздний момент времени. Такой «более поздний момент времени» может представлять собой, например, любой момент времени по истечении 24 ч после инициации экспрессии, такой как трансфекция молекулой нуклеиновой кислоты, например, через 36, 48, 60, 72, 96 ч после инициации экспрессии, т.е. после трансфекции. Кроме того, для одной и той же нуклеиновой кислоты количество белка, продуцированного в более поздний момент времени, можно стандартизовать относительно количества, продуцированного в более ранний (референс) момент времени, например, количество белка, продуцированного в более поздний момент времени, можно выражать в виде процента от количества белка через 24 ч после трансфекции.The term "prolongation of protein production" from an artificial nucleic acid molecule, such as an artificial mRNA, preferably means that the production of a protein from an artificial nucleic acid molecule, such as an artificial mRNA, is prolonged compared to the production of a protein from a reference nucleic acid molecule, such as a reference -mRNA, for example, which contains a reference 3'-UTR and/or a reference-5'-UTR or lacks a 3'-UTR and/or a reference-5'-UTR, preferably in a mammalian expression system such as HDF, L929, HEP2G or HeLa cells. Thus, a protein produced from an artificial nucleic acid molecule, such as an artificial mRNA, can be detected for a longer period of time than that during which a protein produced from a reference nucleic acid molecule can be detected. In other words, the amount of protein produced from an artificial nucleic acid molecule, such as an artificial mRNA, measured at a later point in time, for example, 48 hours or 72 hours after transfection, is greater than the amount of protein produced from a reference nucleic acid molecule, such as a reference mRNA, at an appropriate later time point. Such a "later time point" can be, for example, any time point after 24 hours after initiation of expression, such as transfection with a nucleic acid molecule, for example, 36, 48, 60, 72, 96 hours after initiation of expression, i.e. e. after transfection. In addition, for the same nucleic acid, the amount of protein produced at a later time point can be standardized with respect to the amount produced at an earlier (reference) time point, for example, the amount of protein produced at a later time point can be expressed as as a percentage of the amount of protein 24 h after transfection.

Предпочтительно эффект пролонгирования производства белка определяют путем (I) измерения количеств белка, например, полученных в результате экспрессии кодируемого репортерного белка, такого как люцифераза, предпочтительно в экспрессионной системе млекопитающих, такой как клетки линии HDF, L929, HEP2G или HeLa, в зависимости от времени, (II) определения количества белка, обнаруженного в «референс-момент» времени t1, например, t1=24 ч после трансфекции, при этом указанное количество белка принимают за 100%, (III) измерения количества белка, обнаруженного в один или несколько более поздних моментов времени t2, t3 и т.д., например, t2=48 ч и t3=72 ч после трансфекции, и расчета относительного количества белка, обнаруженного в более поздний момент времени в виде процента от количества белка в момент времени t1. Например, для белка, экспрессированного в момент времени t1 в количестве «80», в момент времени t2 в количестве «20» и в момент времени t3 в количестве «10», относительное количество белка в момент времени t2 будет составлять 25%, а в момент времени t3 12,5%. Затем эти относительные количества в более поздний момент времени можно сравнивать на стадии (IV) с относительными количествами белка в соответствующие моменты времени, полученными в случае молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR соответственно или содержащей референс-3'-UTR и/или референс-5'-UTR соответственно. Путем сравнения относительного количества белка, продуцированного с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, с относительным количеством белка, продуцированного с референс-молекулы нуклеиновой кислоты, т.е. молекулы, не содержащей 3'- и/или 5'-UTR соответственно или содержащей референс-3'-UTR и/или референс-5'-UTR соответственно, можно определять коэффициент, характеризующий, во сколько раз пролонгируется производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, по сравнению с производством белка с референс-молекулы нуклеиновой кислоты.Preferably, the effect of prolonging protein production is determined by (i) measuring the amounts of protein, for example, obtained from the expression of an encoded reporter protein such as luciferase, preferably in a mammalian expression system such as HDF, L929, HEP2G or HeLa cell lines, as a function of time , (II) determining the amount of protein detected at the "reference" time t 1 , for example, t 1 =24 h after transfection, while the specified amount of protein is taken as 100%, (III) measuring the amount of protein found in one or several later time points t 2 , t 3 etc., for example, t 2 =48 h and t 3 =72 h after transfection, and calculating the relative amount of protein found at the later time point as a percentage of the amount of protein at time t 1 . For example, for a protein expressed at time t 1 in the amount of "80", at time t 2 in the amount of "20" and at time t 3 in the amount of "10", the relative amount of protein at time t 2 will be 25 %, and at time t 3 12.5%. These relative amounts at a later time point can then be compared in step (IV) with the relative amounts of protein at the respective time points obtained in the case of a nucleic acid molecule lacking the 3'- and/or 5'-UTR, respectively, or containing reference-3 '-UTR and/or reference-5'-UTR, respectively. By comparing the relative amount of protein produced from the artificial nucleic acid molecule of the present invention with the relative amount of protein produced from the reference nucleic acid molecule, i. molecule that does not contain 3'- and/or 5'-UTR, respectively, or contains a reference-3'-UTR and/or reference-5'-UTR, respectively, it is possible to determine the coefficient characterizing how many times the production of a protein from an artificial nucleic molecule is prolonged acid of the present invention compared to the production of a protein from a reference nucleic acid molecule.

Предпочтительно по меньшей мере один 3'- и/или 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в изобретении, пролонгирует производство белка с указанной искусственной молекулы нуклеиновой кислоты по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно по меньшей мере в 2 раза, еще более предпочтительно по меньшей мере в 2,5 раза по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, которая не содержит 3'- и/или 5'-UTR соответственно или содержит референс-3'-UTR и/или референс-5'-UTR соответственно. Иными словами, (относительное) количество белка, продуцированного с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, в определенный более поздний момент времени, указанный выше, повышается на коэффициент, составляющий по меньшей мере 1,2, предпочтительно по меньшей мере 1,5, более предпочтительно по меньшей мере 2, еще более предпочтительно по меньшей мере 2,5, по сравнению с (относительным) количеством белка, продуцированным с референс-молекулы нуклеиновой кислоты, которая не содержит 3'- и/или 5'-UTR соответственно или содержит референс-3'-UTR и/или референс-5'-UTR соответственно, в тот же самый более поздний момент времени.Preferably, at least one 3'- and/or 5'-UTR element in the artificial nucleic acid molecule of the invention prolongs protein production from said artificial nucleic acid molecule by at least 1.2 times, preferably at least 1.5-fold, more preferably at least 2-fold, even more preferably at least 2.5-fold, compared to protein production from a reference nucleic acid molecule that does not contain a 3'- and/or 5'-UTR respectively or contains a reference 3'-UTR and/or a reference 5'-UTR, respectively. In other words, the (relative) amount of protein produced from the artificial nucleic acid molecule according to the invention, at a certain later point in time indicated above, is increased by a factor of at least 1.2, preferably at least 1.5, more preferably at least 2, even more preferably at least 2.5, compared to the (relative) amount of protein produced from a reference nucleic acid molecule that does not contain the 3'- and/or 5'-UTR, respectively, or contains reference-3'-UTR and/or reference-5'-UTR, respectively, at the same later point in time.

Альтернативно этому пролонгирующее действие на производство белка можно определять также путем (I) измерения количеств белка, например, полученных в результате экспрессии кодируемого репортерного белка, такого как люцифераза, предпочтительно в экспрессионной системе млекопитающих, такой как клетки линии HDF, L929, HEP2G или HeLa, в зависимости от времени, (II) определения момента времени, в который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после трансфекции искусственной молекулой нуклеиновой кислоты, и (III) сравнения момента времени, который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, с указанным моментом времени, определенным для молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно.Alternatively, the prolongation effect on protein production can also be determined by (I) measuring the amounts of protein, for example, obtained from the expression of an encoded reporter protein such as luciferase, preferably in a mammalian expression system such as HDF, L929, HEP2G or HeLa cell lines, depending on time, (II) determining the point in time at which the amount of protein falls below the amount of protein detected, for example, 1, 2, 3, 4, 5, or 6 h after the initiation of expression, for example, after 1, 2, 3 , 4, 5, or 6 hours after transfection with the artificial nucleic acid molecule, and (III) comparing the time point at which the amount of protein becomes lower than the amount of protein detected, for example, 1, 2, 3, 4, 5, or 6 hours after initiation of expression , with a specified time point defined for a nucleic acid molecule that lacks a 3'-UTR and/or a 5'-UTR, respectively, or that contains a reference-3'-UTR and/or a reference-5'-U TR respectively.

Например, производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, в количестве, представляющем собой по меньшей мере количество, обнаруженное на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты, пролонгируется по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в клетках линии HDF, L929, HEP2G или HeLa. Так, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно позволяет пролонгировать производство белка в количестве, которое представляет собой по меньшей мере количество, обнаруженное на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции, по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно.For example, producing a protein from an artificial nucleic acid molecule, such as an artificial mRNA, in an amount that is at least the amount found in the initial phase of expression, for example, 1, 2, 3, 4, 5, or 6 hours after initiation of expression, for example, after transfection with a nucleic acid molecule, prolongs at least about 5 hours, preferably at least about 10 hours, more preferably at least about 24 hours compared to the production of a protein from a reference nucleic acid molecule, such as a reference -mRNA, in a mammalian expression system such as mammalian cells, for example HDF, L929, HEP2G or HeLa cell lines. Thus, the artificial nucleic acid molecule of the present invention preferably allows the prolongation of protein production in an amount that is at least the amount found in the initial phase of expression, for example, 1, 2, 3, 4, 5 or 6 hours after initiation of expression, e.g., after transfection, for at least about 5 hours, preferably at least about 10 hours, more preferably at least about 24 hours, compared to producing a protein from a reference nucleic acid molecule lacking 3 '-UTR and/or 5'-UTR, respectively, or which contains a reference-3'-UTR and/or a reference-5'-UTR, respectively.

В предпочтительных вариантах осуществления изобретения период производства белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, удлинен по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно по меньшей мере в 2 раза, еще более предпочтительно по меньшей мере в 2,5 раза по сравнению с периодом производства белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно.In preferred embodiments of the invention, the period of production of a protein from an artificial nucleic acid molecule of the present invention is extended by at least 1.2 times, preferably at least 1.5 times, more preferably at least 2 times, even more preferably at least 2.5 times the period of protein production from a reference nucleic acid molecule that lacks a 3'-UTR and/or a 5'-UTR, respectively, or that contains a reference 3'-UTR and/or a reference -5'-UTR, respectively.

Предпочтительно указанное пролонгирующее действие на производство белка достигается, когда общее количество белка, продуцированное с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, в течение периода времени, составляющего 48 или 72 ч, соответствует по меньшей мере количеству белка, продуцированного с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-ЦТК и/или референс-5'-UTR соответственно, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты. Так, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, которая обеспечивает пролонгированное производство белка в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в клетках линии HDF, L929, HEP2G или HeLa, как указано выше, при этом общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 или 72 ч, представляет собой по меньшей мере общее количество белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях с ORF искусственной молекулы нуклеиновой кислоты.Preferably, said prolongation effect on protein production is achieved when the total amount of protein produced from the artificial nucleic acid molecule of the present invention, for example, over a period of 48 or 72 hours, corresponds to at least the amount of protein produced from the reference a nucleic acid molecule that lacks a 3'-UTR and/or a 5'-UTR, respectively, or that contains a reference-3'-CTK and/or a reference-5'-UTR, respectively, such as a 3'-UTR and/or a 5' -UTR that occurs naturally with the ORF of an artificial nucleic acid molecule. Thus, the present invention provides an artificial nucleic acid molecule that provides prolonged protein production in a mammalian expression system, such as mammalian cells, for example, in HDF, L929, HEP2G or HeLa cells, as described above, while the total amount of protein produced from said artificial nucleic acid molecule, for example, over a period of 48 or 72 hours, is at least the total amount of protein produced, for example, during a specified period of time, from a reference nucleic acid molecule that lacks 3 '-UTR and/or 5'-UTR, respectively, or which contains a reference-3'-UTR and/or a reference-5'-UTR, respectively, such as a 3'-UTR and/or 5'-UTR, naturally occurring with ORF of an artificial nucleic acid molecule.

Кроме того, понятие «пролонгированная экспрессия белка» включает также понятие «стабилизированная экспрессия белка», при этом «стабилизированная экспрессия белка» предпочтительно означает, что имеет место более равномерное производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, в течение заранее определенного периода времени, например, в течение 24 ч, более предпочтительно в течение 48 ч, еще более предпочтительно в течение 72 ч, по сравнению с референс-молекулой нуклеиновой кислоты, например, мРНК, которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно или в которой отсутствует 3'-UTR и/или 5'-UTR соответственно.In addition, the term "prolonged protein expression" also includes the term "stable protein expression", while "stable protein expression" preferably means that there is a more uniform production of protein from the artificial nucleic acid molecule of the present invention for a predetermined period of time. a period of time, e.g., within 24 hours, more preferably within 48 hours, even more preferably within 72 hours, as compared to a reference nucleic acid molecule, e.g. -5'-UTR, respectively, or lacking a 3'-UTR and/or 5'-UTR, respectively.

Следовательно, уровень производства белка, например, в системе млекопитающих, с искусственной молекулы нуклеиновой кислоты, содержащей 3'-UTR-элемент и/или 5'-UTR-элемент, предлагаемый в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, предпочтительно не снижается до уровня, обнаруженного для референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, указанная выше. Для оценки того, до какой степени снижается производство белка со специфической молекулы нуклеиновой кислоты, можно сравнивать, например, количество белка (кодируемого соответствующей ОРС), обнаруженное через 24 ч после инициации экспрессии, например, через 24 ч после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, клетки, такой как клетка млекопитающего, с количеством белка, обнаруженного через 48 ч после инициации экспрессии, например, через 48 ч после трансфекции. Так, отношение количества белка, кодируемого ОРС искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, такое как количество репортерного белка, например, люциферазы, обнаруженного в более поздний момент времени, например, через 48 ч после инициации экспрессии, например, после трансфекции, к количеству белка, обнаруженного в более ранний момент времени, например, через 24 ч после инициации экспрессии, например, после трансфекции, предпочтительно больше, чем соответствующее отношение (определенное для тех же самых моментов времени) для референс-молекулы нуклеиновой кислоты, содержащей референс-3'- и/или референс-5'-UTR соответственно или в которой отсутствует 3'-UTR и/или 5'-UTR соответственно.Therefore, the level of protein production, for example, in a mammalian system, from an artificial nucleic acid molecule containing a 3'-UTR element and/or a 5'-UTR element of the present invention, for example, from an mRNA of the present invention, preferably does not decrease to the level found for a reference nucleic acid molecule, such as the reference mRNA mentioned above. To assess the extent to which the production of protein from a specific nucleic acid molecule is reduced, one can compare, for example, the amount of protein (encoded by the corresponding ORF) found 24 hours after initiation of expression, for example, 24 hours after transfection with an artificial nucleic acid molecule, proposed in the present invention, a cell, such as a mammalian cell, with the amount of protein detected 48 hours after initiation of expression, for example, 48 hours after transfection. Thus, the ratio of the amount of protein encoded by the ORF of the artificial nucleic acid molecule of the present invention, such as the amount of a reporter protein, such as luciferase, detected at a later point in time, such as 48 hours after initiation of expression, such as after transfection, to the amount of protein detected at an earlier time point, e.g. 24 hours after initiation of expression, e.g. after transfection, preferably greater than the corresponding ratio (determined for the same time points) for a reference nucleic acid molecule containing reference-3 '- and/or reference-5'-UTR, respectively, or which lacks a 3'-UTR and/or 5'-UTR, respectively.

Предпочтительно отношение количества белка, кодируемого ОРС искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, количество репортерного белка, например, люциферазы, обнаруженное в более поздний момент времени, например, через 48 ч после инициации экспрессии, например, после трансфекции, к количеству белка, обнаруженному в более ранний момент времени, например, через 24 ч после инициации экспрессии, например, после трансфекции, предпочтительно составляет по меньшей мере 0,2, более предпочтительно по меньшей мере примерно 0,3, еще более предпочтительно по меньшей мере примерно 0,4, еще более предпочтительно по меньшей мере примерно 0,5, и наиболее предпочтительно по меньшей мере примерно 0,7. Для соответствующей референс-молекулы нуклеиновой кислоты, например, мРНК, которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно, или в которой отсутствует 3'-UTR и/или 5'-UTR соответственно, указанное отношение может составлять, например, от примерно 0,05 до примерно 0,35.Preferably, the ratio of the amount of protein encoded by the ORF of the artificial nucleic acid molecule of the present invention, e.g., the amount of a reporter protein, e.g. protein detected at an earlier time point, e.g., 24 hours after initiation of expression, e.g., after transfection, is preferably at least 0.2, more preferably at least about 0.3, even more preferably at least about 0 .4, even more preferably at least about 0.5, and most preferably at least about 0.7. For the corresponding reference nucleic acid molecule, e.g. mRNA, which contains the reference 3'-UTR and/or the reference 5'-UTR, respectively, or which lacks the 3'-UTR and/or 5'-UTR, respectively, the indicated ratio may be, for example, from about 0.05 to about 0.35.

Таким образом, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элемент и/или 5'-UTR-элемент, описанный выше, при этом отношение количества белка, например, количество люциферазы, обнаруженное через 48 ч после инициации экспрессии, к количеству белка, обнаруженному через 24 ч после инициации экспрессии, предпочтительно в системе экспрессии млекопитающих, такой как клетки млекопитающих, например, в HDF-клетках или HeLa-клетках, предпочтительно составляет по меньшей мере 0,2, более предпочтительно по меньшей мере примерно 0,3, более предпочтительно по меньшей мере примерно 0,4, еще более предпочтительно по меньшей мере примерно 0,5, еще более предпочтительно по меньшей мере примерно 0,6, и наиболее предпочтительно по меньшей мере примерно 0,7. Таким образом, предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 ч, по меньшей мере соответствует общему количеству белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты.Thus, the present invention provides an artificial nucleic acid molecule comprising an ORF and a 3'-UTR element and/or a 5'-UTR element as described above, wherein the ratio of the amount of protein, e.g., the amount of luciferase, detected 48 hours after of initiation of expression, to the amount of protein found 24 hours after initiation of expression, preferably in a mammalian expression system such as mammalian cells, for example in HDF cells or HeLa cells, is preferably at least 0.2, more preferably at least at least about 0.3, more preferably at least about 0.4, even more preferably at least about 0.5, even more preferably at least about 0.6, and most preferably at least about 0.7. Thus, preferably, the total amount of protein produced from said artificial nucleic acid molecule, for example, over a period of 48 hours, at least corresponds to the total amount of protein produced, for example, during said period of time, from a reference nucleic acid molecule. an acid which lacks a 3'-UTR and/or a 5'-UTR, respectively, or which contains a reference-3'-UTR and/or a reference-5'-UTR, respectively, such as a 3'-UTR and/or a 5'-UTR , which occurs naturally with the ORF of an artificial nucleic acid molecule.

Предпочтительно в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элемент и/или 5'-UTR-элемент, описанный выше, при этом отношение количества белка, например, количество люциферазы, обнаруженное через 72 ч после инициации экспрессии, к количеству белка, обнаруженному через 24 ч после инициации экспрессии, предпочтительно в системе экспрессии млекопитающих, такой, например, как клетки линии HeLa или HDF, предпочтительно превышает примерно 0,05, более предпочтительно превышает примерно 0,1, более предпочтительно превышает примерно 0,2, еще более предпочтительно превышает примерно 0,3, при этом предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 72 ч, представляет собой по меньшей мере общее количество белка, продуцированного, например, в течение указанного периода времени с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно, такую как 3'-UTR и/или 5'-UTR, встречающаяся в естественных условиях c OPC искусственной молекулы нуклеиновой кислоты.Preferably, the present invention provides an artificial nucleic acid molecule comprising an ORF and a 3'UTR element and/or a 5'UTR element as described above, wherein the ratio of the amount of protein, e.g. the amount of luciferase, detected 72 hours after initiation of expression , to the amount of protein detected 24 hours after initiation of expression, preferably in a mammalian expression system such as HeLa or HDF cells, preferably greater than about 0.05, more preferably greater than about 0.1, more preferably greater than about 0 ,2, even more preferably greater than about 0.3, preferably the total amount of protein produced from said artificial nucleic acid molecule, for example, over a period of 72 hours, is at least the total amount of protein produced, for example , during the specified period of time from the reference nucleic acid molecule, in which missing 3'-UTR and/or 5'-UTR, respectively, or which contains a reference 3'-UTR and/or a reference-5'-UTR, respectively, such as a 3'-UTR and/or a 5'-UTR occurring naturally conditions c OPC artificial nucleic acid molecule.

«Увеличенная экспрессия белка» или «повышенная экспрессия белка» в контексте настоящего изобретения предпочтительно обозначает увеличенную/повышенную экспрессию белка в один из моментов времени после инициации экспрессии или увеличенное/повышенное общее количество экспрессированного белка, по сравнению с экспрессией, индуцированной референс-молекулой нуклеиновой кислоты. Так, уровень белка, обнаруженный в определенный момент времени после инициации экспрессии, например, после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, после трансфекции мРНК, предлагаемой в настоящем изобретении, например, через 6, 12, 24, 48 или 72 ч после трансфекции, предпочтительно превышает уровень белка, обнаруженный в этот же самый момент времени после инициации экспрессии, например, после трансфекции референс-молекулой нуклеиновой кислоты, такой как референс-мРНК, которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно или в которой отсутствует 3'-UTR и/или 5'-UTR соответственно. В предпочтительном варианте осуществления изобретения максимальное количество белка (определенное, например, по активности или массе белка), экспрессированного с искусственной молекулы нуклеиновой кислоты, увеличено по сравнению с количеством белка, экспрессированного с нуклеиновой референс-кислоты, которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно или в которой отсутствует 3'-UTR и/или 5'-UTR соответственно. Пиковые уровни экспрессии предпочтительно достигаются в пределах 48 ч, более предпочтительно в пределах 24 ч и еще более предпочтительно в пределах 12 ч после, например, трансфекции."Increased protein expression" or "increased protein expression" in the context of the present invention preferably means increased/increased protein expression at one of the time points after initiation of expression, or increased/increased total protein expressed, compared to expression induced by a reference nucleic acid molecule. . Thus, the level of protein detected at a certain point in time after the initiation of expression, for example, after transfection with an artificial nucleic acid molecule of the present invention, for example, after transfection of an mRNA of the present invention, for example, after 6, 12, 24, 48 or 72 hours after transfection, preferably exceeds the protein level detected at the same time point after initiation of expression, for example, after transfection with a reference nucleic acid molecule, such as a reference mRNA, which contains a reference 3'-UTR and/or a reference 5'-UTR, respectively, or lacking a 3'-UTR and/or 5'-UTR, respectively. In a preferred embodiment of the invention, the maximum amount of protein (determined, for example, by activity or protein weight) expressed from an artificial nucleic acid molecule is increased compared to the amount of protein expressed from a reference nucleic acid that contains a reference 3'-UTR and /or reference-5'-UTR, respectively, or in which there is no 3'-UTR and/or 5'-UTR, respectively. Peak expression levels are preferably reached within 48 hours, more preferably within 24 hours and even more preferably within 12 hours after, for example, transfection.

Предпочтительно понятие «увеличенное общее производство белка» или «повышенное общее производство белка», с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, относится к увеличенному/повышенному производству белка в течение периода времени, в течение которого белок продуцируется с искусственной молекулы нуклеиновой кислоты, например, в течение 48 ч или 72 ч, предпочтительно в системе экспрессии млекопитающих, такой как клетки млекопитающих, например, в клетках линии HDF, L929, HEP2G или HeLa, по сравнению с референс-молекулой нуклеиновой кислоты, в которой отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-UTR соответственно. Согласно предпочтительному варианту осуществления изобретения кумулятивное количество белка, экспрессированного в течение периода времени, увеличивается, если применяют искусственную молекулу нуклеиновой кислоты, предлагаемую в изобретении.Preferably, "increased total protein production" or "increased total protein production" from the artificial nucleic acid molecule of the invention refers to increased/increased protein production over the period of time that the protein is produced from the artificial nucleic acid molecule, e.g. , within 48 hours or 72 hours, preferably in a mammalian expression system, such as mammalian cells, for example, in HDF, L929, HEP2G or HeLa cells, compared to a reference nucleic acid molecule that lacks a 3'-UTR and /or 5'-UTR, respectively, or which contains a reference-3'-UTR and/or a reference-5'-UTR, respectively. According to a preferred embodiment of the invention, the cumulative amount of protein expressed over a period of time is increased if an artificial nucleic acid molecule according to the invention is used.

Общее количество белка в течение определенного периода времени можно определять путем (I) сбора ткани или клеток в несколько моментов времени после интродукции искусственной молекулы нуклеиновой кислоты (например, через 6, 12, 24, 48 и 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты), и можно определять количество белка в каждый момент времени как указано выше. Для расчета кумулятивного количества белка можно применять математический метод определения общего количества белка, например, можно определять площадь под кривой (AUC) согласно следующей формуле:The total amount of protein over a period of time can be determined by (i) collecting tissue or cells at several time points after the introduction of the artificial nucleic acid molecule (e.g., 6, 12, 24, 48, and 72 hours after the initiation of expression or after the introduction of the nucleic acid molecule). acids), and the amount of protein at each time point can be determined as above. To calculate the cumulative amount of protein, a mathematical method for determining the total amount of protein can be used, for example, you can determine the area under the curve (AUC) according to the following formula:

Figure 00000001
Figure 00000001

Для расчета площади под кривой для общего количества белка вычисляют интеграл уравнения кривой экспрессии между каждыми конечными точками (а и b).To calculate the area under the curve for total protein, the integral of the equation of the expression curve between each endpoints (a and b) is calculated.

Таким образом, понятие «общее производство белка» предпочтительно относится к площади под кривой (AUC), описывающей производство белка в зависимости от времени.Thus, the term "total protein production" preferably refers to the area under the curve (AUC) describing protein production as a function of time.

Предпочтительно по меньшей мере один 3'-UTR-элемент или 5'-UTR-элемент, предлагаемый в настоящем изобретении повышает производство белка с указанной искусственной молекулы нуклеиновой кислоты по меньшей мере 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза, по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'- UTR и/или 5'-UTR соответственно. Иными словами, общее количество белка, продуцированного с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, в определенный момент времени, например, через 48 ч или 72 ч после инициации экспрессии, например, после трансфекции, повышается на коэффициент, составляющий по меньшей мере 1,5, предпочтительно по. меньшей мере 2, более предпочтительно по меньшей мере 2,5, по сравнению с (относительно) количеством белка, продуцированного с референс-молекулы нуклеиновой кислоты, в которой, например, отсутствует 3'-UTR и/или 5'-UTR соответственно или которая содержит референс-3'-UTR и/или референс-5'-ЦТР соответственно, в соответствующий более поздний момент времени.Preferably, at least one 3'-UTR element or 5'-UTR element of the present invention increases protein production from said artificial nucleic acid molecule at least 1.5-fold, preferably at least 2-fold, more preferably at least 2.5 times as compared to protein production from a reference nucleic acid molecule lacking the 3'-UTR and/or 5'-UTR, respectively. In other words, the total amount of protein produced from the artificial nucleic acid molecule of the invention at a certain point in time, for example, 48 hours or 72 hours after the initiation of expression, for example, after transfection, is increased by a factor of at least 1, 5, preferably according to. at least 2, more preferably at least 2.5, compared to the (relatively) amount of protein produced from a reference nucleic acid molecule that, for example, lacks a 3'-UTR and/or a 5'-UTR, respectively, or which contains a reference-3'-UTR and/or a reference-5'-CTR, respectively, at a corresponding later time point.

Пролонгирующее производство мРНК и/или белка действие и эффективность и/или повышающее производство белка действие и эффективность вариантов, фрагментов и/или вариантов фрагментов 3'-UTR и/или 5'-UTR, а также пролонгирующее действие на мРНК и/или производство белка и эффективность и/или повышающее производство белка действие и эффективность по меньшей мере одного 3'-UTR-элемента и/или по меньшей мере одного 5'-UTR-элемента искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно определять с помощью любого пригодного для этой цели метода, известного специалисту в данной области.Prolongation of mRNA and/or protein production and/or protein production and/or protein production of 3'-UTR and/or 5'-UTR variants, fragments and/or fragment variants and prolongation of mRNA and/or protein production and/or protein production-enhancing activity and the potency of at least one 3'UTR element and/or at least one 5'UTR element of the artificial nucleic acid molecule of the present invention can be determined using any suitable for this purpose, a method known to the person skilled in the art.

Например, можно создавать искусственные молекулы мРНК, содержащие кодирующую последовательность/открытую рамку считывания (ОРС) репортерного белка, такого как люцифераза, и 3'-UTR-элемент, предлагаемый в настоящем изобретении, а именно, такой, который пролонгирует и/или повышает производство белка с указанной искусственной молекулы мРНК. Кроме того, такая предлагаемая в изобретении молекула мРНК может содержать также 5'-UTR-элемент, предлагаемый в настоящем изобретении, а именно, такой, который пролонгирует и/или повышает производство белка с указанной искусственной молекулы мРНК, не содержать 5'-UTR-элемент или 5'-UTR-элемент, не предлагаемый в настоящем изобретении, например, референс-5'-UTR. Следовательно можно создавать искусственные молекулы мРНК, содержащие кодирующую последовательность/открытую рамку считывания (ОРС) репортерного белка, такого как люцифераза, и 5'-UTR-элемент, предлагаемый в настоящем изобретении, а именно, такой, который пролонгирует и/или повышает производство белка с указанной искусственной молекулы мРНК. Кроме того, такая предлагаемая в изобретении молекула мРНК может содержать также 3'-UTR-элемент, предлагаемый в настоящем изобретении, а именно, такой, который пролонгирует и/или повышает производство белка с указанной искусственной молекулы мРНК, не содержать 3'-UTR-элемент или 3'-UTR-элемент, не предлагаемый в настоящем изобретении, например, референс-3'-UTRFor example, one can create artificial mRNA molecules containing the coding sequence/open reading frame (ORF) of a reporter protein, such as luciferase, and a 3'-UTR element of the present invention, namely one that prolongs and/or increases the production protein from the specified artificial mRNA molecule. In addition, such an inventive mRNA molecule may also contain a 5'-UTR element according to the present invention, namely one that prolongs and/or increases protein production from said artificial mRNA molecule, does not contain a 5'-UTR- element or 5'-UTR element not proposed in the present invention, for example, the reference 5'-UTR. It is therefore possible to create artificial mRNA molecules containing the coding sequence/open reading frame (ORF) of a reporter protein such as luciferase and a 5'-UTR element of the present invention, namely one that prolongs and/or increases protein production from the specified artificial mRNA molecule. In addition, such an inventive mRNA molecule may also contain the 3'-UTR element of the present invention, namely one that prolongs and/or increases protein production from said artificial mRNA molecule, does not contain a 3'-UTR- element or 3'-UTR element not proposed in the present invention, for example, reference-3'-UTR

Согласно настоящему изобретению можно создавать мРНК, например, путем транскрипции in vitro соответствующих векторов, таких как плазмидные векторы, например, таких, которые содержат промотор Т7 и последовательность, кодирующую соответствующие последовательности мРНК. Созданными молекулами мРНК можно трансфектировать клетки с помощью любого метода трансфекции, пригодного для трансфекции мРНК, например, их можно встраивать посредством липофекции в клетки млекопитающих, такие как клетки HeLa или клетки HDF, и образцы можно анализировать в определенные моменты времени после трансфекции, например, через 6 ч, 24 ч, 48 ч и 72 ч после трансфекции. Указанные образцы можно анализировать для определения количеств мРНК и/или количеств белка с помощью методов, хорошо известных специалисту в данной области. Например, количества репортерной мРНК, присутствующей в клетках в определенные моменты времени можно определять с помощью методов количественной ПЦР. Количества репортерного белка, кодируемого соответствующими мРНК, можно определять, например, с помощью вестерн-блоттинга, ELISA-анализов, FACS-анализов или репортерных анализов, таких как анализы люциферазы, в зависимости от применяемого репортерного белка. Эффект стабилизации экспрессии белка и/или пролонгирования экспрессии белка можно анализировать, например, путем определения отношения уровня белка, обнаруженного через 48 ч после трансфекции, к уровню белка, обнаруженного через 24 ч после трансфекции. Чем ближе указанная величина к 1, тем более стабильна экспрессия белка в течение этого периода времени. Такие измерения для определения стабильности экспрессии белка можно, естественно, осуществлять также и через 72 или большее количество часов и можно определять отношение уровня белка, обнаруженного через 72 ч после трансфекции, к уровню белка, обнаруженного через 24 ч после трансфекции.According to the present invention, mRNAs can be generated, for example, by in vitro transcription of appropriate vectors, such as plasmid vectors, for example, those containing the T7 promoter and a sequence encoding the corresponding mRNA sequences. The generated mRNA molecules can be transfected into cells using any transfection method suitable for mRNA transfection, for example, they can be inserted via lipofection into mammalian cells such as HeLa cells or HDF cells, and samples can be analyzed at specific time points after transfection, for example, via 6 h, 24 h, 48 h and 72 h after transfection. These samples can be analyzed to determine the amounts of mRNA and/or amounts of protein using methods well known to the person skilled in the art. For example, the amount of reporter mRNA present in cells at certain time points can be determined using quantitative PCR methods. The amounts of reporter protein encoded by the respective mRNAs can be determined, for example, by Western blotting, ELISA assays, FACS assays, or reporter assays such as luciferase assays, depending on the reporter protein used. The effect of stabilizing protein expression and/or prolonging protein expression can be analyzed, for example, by determining the ratio of the level of protein detected 48 hours after transfection to the level of protein detected 24 hours after transfection. The closer this value is to 1, the more stable the expression of the protein during this period of time. Such measurements to determine the stability of protein expression can, of course, also be carried out after 72 hours or more, and the ratio of the level of protein detected 72 hours after transfection to the level of protein detected 24 hours after transfection can be determined.

Эффективность трансляции: Анализ для определения эффективности трансляцииTranslation Efficiency: Analysis to Determine Translation Efficiency

Как подробно описано выше, эффективность трансляции представляет собой характеристику молекулы нуклеиновой кислоты (например, мРНК), которая содержит открытую рамку считывания (ОРС), и, как правило, она обеспечивается специфическим UTR-элементом (специфическим 5'-UTR-элементом или специфическим 3'-UTR-элементом), который содержится в молекуле нуклеиновой кислоты. Эффективность трансляции, как правило, измеряют по количеству белка, транслированного с ОРС. Касательно этого в настоящем изобретении предложены общие методы, а также специфический анализ. Эффективность трансляции различных, например, двух или большего количества молекул нуклеиновой кислоты можно сравнивать, например, путем экспериментальной количественной оценки белка, кодируемого ОРС.As detailed above, translation efficiency is a characteristic of a nucleic acid molecule (e.g., mRNA) that contains an open reading frame (ORF) and is typically conferred by a specific UTR element (specific 5'-UTR element or specific 3 '-UTR element) contained in the nucleic acid molecule. Translation efficiency is generally measured by the amount of protein translated from the ORF. Regarding this, the present invention provides general methods as well as specific assays. The translation efficiency of different, eg two or more, nucleic acid molecules can be compared, for example, by experimental quantification of the protein encoded by the ORF.

В целом, для оценки эффективности трансляции применяют методы, основанные на применении клеток. Эффективность трансляции предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты экспериментально тестируют in vivo или in vitro, как указано в настоящем описании (т.е. in vitro относится к («живым») клеткам и/или ткани, включая ткань живого индивидуума; клетки включают, в частности, клеточные линии, первичные клетки, клетки в ткани или в организме индивидуумов, предпочтительными являются клетки млекопитающих, например, человеческие клетки и мышиные клетки, и наиболее предпочтительными являются человеческие линии клеток HeLa, HEPG2 и U-937 и мышиные линии клеток NIH3T3, JAWSII и L929, кроме того, наиболее предпочтительными являются первичные клетки, в наиболее предпочтительных вариантах осуществления изобретения - человеческие кожные фибробласты (HDF)), экспрессию кодируемого белка определяют после осуществления инъекции/трансфекции предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты в клетки-/ткани-мишени и сравнивают с экспрессией белка, индуцируемой нуклеиновой референс-кислотой. В данной области известны количественные методы определения экспрессии белка (например, вестерн-блоттинг, FACS, ELISA, масс-спектрометрия). В рассматриваемом контексте наиболее пригодным является определение экспрессии репортерных белков типа люциферазы, зеленого флуоресцентного белка (GFP) или секретируемой щелочной фосфатазы (SEAP). Так, искусственную нуклеиновую кислоту, предлагаемую в изобретении, или нуклеиновую референс-кислоту интродуцируют в ткань-мишень или клетку-мишень, например, посредством трансфекции или инъекции, предпочтительно в систему экспрессии млекопитающих, такую как клетки млекопитающих, например, в клетки линии HDF, L929, HepG2 и/или Hela. Через несколько часов или через несколько дней (например, через 6, 12, 24, 48 или 72 ч) после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты берут образец клеток-мишеней и проводят измерения с помощью FACS и/или лизируют. После этого лизаты можно использовать для обнаружения экспрессированного белка (и определения тем самым эффективности экспрессии белка) с помощью нескольких методов, например, вестерн-блоттинга, FACS, ELISA, масс-спектрометрии или путем измерения флуоресценции или люминесценции.In general, cell-based methods are used to evaluate translation efficiency. Translation efficiency of an artificial nucleic acid molecule of the invention is experimentally tested in vivo or in vitro as described herein (i.e., in vitro refers to (“live”) cells and/or tissue, including tissue from a living individual; cells include, in particular cell lines, primary cells, cells in tissue or in the body of individuals, mammalian cells such as human cells and mouse cells are preferred, and most preferred are human HeLa, HEPG2 and U-937 cell lines and mouse NIH3T3 cell lines, JAWSII and L929, in addition, the most preferred are primary cells, in the most preferred embodiments of the invention - human dermal fibroblasts (HDF)), the expression of the encoded protein is determined after injection / transfection of the artificial nucleic acid molecule proposed in the invention into cells - / tissues - target and compared with protein expression induced by ucleic reference acid. Quantitative methods for determining protein expression are known in the art (eg Western blotting, FACS, ELISA, mass spectrometry). In this context, the most suitable is the determination of the expression of reporter proteins such as luciferase, green fluorescent protein (GFP) or secreted alkaline phosphatase (SEAP). Thus, an artificial nucleic acid according to the invention or a reference nucleic acid is introduced into the target tissue or target cell, for example by transfection or injection, preferably into a mammalian expression system, such as mammalian cells, for example, into the HDF cell line, L929, HepG2 and/or Hela. Hours or days (eg, 6, 12, 24, 48, or 72 hours) after initiation of expression or after introduction of the nucleic acid molecule, a sample of target cells is taken and measured by FACS and/or lysed. The lysates can then be used to detect the expressed protein (and thereby determine the efficiency of protein expression) by several methods, such as Western blot, FACS, ELISA, mass spectrometry, or by measuring fluorescence or luminescence.

Так, если экспрессию белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, сравнивают с экспрессией белка с референс-молекулы нуклеиновой кислоты в конкретный момент времени (например, через 6, 12, 24, 48 или 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты), то обе молекулы нуклеиновой кислоты вводят независимо в ткань-мишень/клетки-мишени, берут образец ткани-мишени/клеток-мишеней после определенного момента времени, приготавливают белковые лизаты согласно конкретному протоколу, адаптированному к конкретному методу обнаружения (такому, например, как вестерн-блоттинг, ELISA, измерение флуоресценции или люминесценции и т.д., известному в данной области) и проводят обнаружение белка с помощью выбранного метода обнаружения. В качестве альтернативы измерению количеств экспрессированного белка в клеточных лизатах, или в дополнение к измерению количеств экспрессированного белка в клеточных лизатах можно определять также количества белка с помощью метода FACS до лизиса собранных клеток или параллельно с использованием аликвот.Thus, if the expression of a protein from an artificial nucleic acid molecule of the invention is compared with the expression of a protein from a reference nucleic acid molecule at a specific time point (for example, 6, 12, 24, 48 or 72 hours after the initiation of expression or after the introduction of the molecule nucleic acid), then both nucleic acid molecules are injected independently into the target tissue/target cells, a sample of the target tissue/target cells is taken after a certain point in time, protein lysates are prepared according to a specific protocol adapted to a specific detection method (such as, for example, such as Western blot, ELISA, fluorescence or luminescence measurement, etc. known in the art) and perform protein detection using the selected detection method. As an alternative to measuring the amounts of expressed protein in cell lysates, or in addition to measuring the amounts of expressed protein in cell lysates, protein amounts can also be determined by FACS before harvested cells are lysed or in parallel using aliquots.

Другие общие объекты соответствуют объектам, представленным выше при описании производства белка, если из контекста не следует иное.Other general entities correspond to those presented above in the description of protein production, unless the context dictates otherwise.

Предпочтительно высокая эффективность трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, обеспечивается за счет по меньшей мере одного элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или по меньшей мере одного элемента 5'-нетранслируемой области (5'-UTR-элемента). Выражение «обеспечивается» означает, что при отсутствии по меньшей мере одного элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или по меньшей мере одного элемента 5'-нетранслируемой области (5'-UTR-элемента) эффективность трансляции не является высокой, как указано в настоящем описании.Preferably, the high translation efficiency of the artificial nucleic acid molecule of the present invention is provided by at least one 3'-untranslated region element (3'-UTR element) and/or at least one 5'-untranslated region element (5 '-UTR-element). The expression "provided" means that in the absence of at least one element of the 3'-untranslated region (3'-UTR element) and/or at least one element of the 5'-untranslated region (5'-UTR element), the translation efficiency is not high, as indicated in the present description.

Понятие «высокая эффективность трансляции» можно использовать для сравнения эффективности трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, с референс-молекулой нуклеиновой кислоты. Понятие «референс-молекула нуклеиновой кислоты» в контексте настоящего описания означает, что за исключением различных 3'-UTR и/или 5'-UTR референс-молекула нуклеиновой кислоты сопоставима, предпочтительно идентична, искусственной молекуле нуклеиновой кислоты, предлагаемой в изобретении, которая содержит 3'-UTR-элемент и/или 5'-UTR-элемент. Таким образом, можно сравнивать эффективность трансляции искусственной молекулы нуклеиновой кислоты с эффективностью трансляции референс-молекулы нуклеиновой кислоты. Соответствующий способ сравнения эффективности трансляции представлен в настоящем описании.The term "high translation efficiency" can be used to compare the translation efficiency of an artificial nucleic acid molecule of the present invention with a reference nucleic acid molecule. The term "reference nucleic acid molecule" in the context of the present description means that, with the exception of different 3'-UTR and/or 5'-UTR, the reference nucleic acid molecule is comparable, preferably identical, to an artificial nucleic acid molecule of the invention, which contains 3'UTR element and/or 5'UTR element. Thus, one can compare the translation efficiency of an artificial nucleic acid molecule with the translation efficiency of a reference nucleic acid molecule. An appropriate method for comparing translation efficiency is provided herein.

Все объекты, представленные выше при описании определения производства белка, применимы также к способу сравнения эффективности трансляции, если из контекста не следует иное. Поскольку в способе сравнения эффективности трансляции используют сравнение двух молекул нуклеиновой кислоты, то осуществляют два параллельных эксперимента, единственное различие между указанными двумя экспериментами состоит в природе молекулы нуклеиновой кислоты. Иными словами, все остальные условия, такие, например, как среда для роста, температура, значение рН, в экспериментах являются идентичными. Специалист в данной области с помощью общепринятых подходов может выбрать пригодные условия на основе общей компетенции и представленного в настоящем описании руководства, при условии, что для обоих параллельных экспериментов должны быть выбраны идентичные условия. Как правило, один из параллельных экспериментов проводят с использованием референс-молекулы нуклеиновой кислоты (которая может представлять собой молекулу дикого типа или искусственную молекулу), а другой проводят с искусственной молекулой нуклеиновой кислоты (которую обозначают также как рассматриваемая молекула нуклеиновой кислоты). Этот способ позволяет сравнивать, характеризуется ли рассматриваемая молекула нуклеиновой кислоты высокой эффективностью трансляции; т.е., представляет ли она собой искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении. Конкретные аспекты способа, предназначенного для сравнения эффективности трансляции, заключаются в следующем:All of the matters presented above in describing the definition of protein production also apply to the translation efficiency comparison method, unless the context dictates otherwise. Since the method for comparing translation efficiency uses a comparison of two nucleic acid molecules, two parallel experiments are carried out, the only difference between these two experiments is the nature of the nucleic acid molecule. In other words, all other conditions, such as growth medium, temperature, pH, are identical in the experiments. A person skilled in the art, using conventional approaches, can select suitable conditions based on general competence and the guidance provided in this description, provided that identical conditions should be selected for both parallel experiments. Typically, one of the parallel experiments is carried out using the reference nucleic acid molecule (which may be a wild-type molecule or an artificial molecule), and the other is carried out with an artificial nucleic acid molecule (which is also referred to as the nucleic acid molecule in question). This method makes it possible to compare whether a given nucleic acid molecule has a high translation efficiency; ie, whether it is an artificial nucleic acid molecule according to the present invention. Specific aspects of the method for comparing translation efficiency are as follows:

В рассматриваемом способе референс-молекула нуклеиновой кислоты содержит по меньшей мере одну открытую рамку считывания (ОРС), которая является идентичной по меньшей мере одной открытой рамке считывания (ОРС) искусственной молекулы нуклеиновой кислоты; и референс-молекула нуклеиновой кислоты не содержит по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент) искусственной молекулы нуклеиновой кислоты и/или по меньшей мере один элемент 5'-нетранслируемой области (5'-UTR-элемент) искусственная молекула нуклеиновой кислоты. Эффективность трансляции искусственной молекулы нуклеиновой кислоты и эффективность трансляции референс-молекулы нуклеиновой кислоты сравнивают с помощью способа, включающего стадии, на которых:In the present method, the reference nucleic acid molecule comprises at least one open reading frame (ORF) that is identical to at least one open reading frame (ORF) of the artificial nucleic acid molecule; and the reference nucleic acid molecule does not contain at least one element of the 3'-untranslated region (3'-UTR element) of the artificial nucleic acid molecule and/or at least one element of the 5'-untranslated region (5'-UTR element ) an artificial nucleic acid molecule. The translation efficiency of an artificial nucleic acid molecule and the translation efficiency of a reference nucleic acid molecule are compared by a method comprising the steps of:

(I) трансфектируют клетки млекопитающих искусственной молекулой нуклеиновой кислоты и измеряют количества экспрессированного белка, кодируемого ОРС искусственной молекулы нуклеиновой кислоты, в определенный момент времени после трансфекции (например, через 24 или 48 ч),(i) transfecting mammalian cells with the artificial nucleic acid molecule and measuring the amount of expressed protein encoded by the ORF of the artificial nucleic acid molecule at a certain point in time after transfection (for example, 24 or 48 hours),

(II) трансфектируют клетки млекопитающих референс-молекулой нуклеиновой кислоты и измеряют количества экспрессированного белка, кодируемого ОРС референс-молекулы нуклеиновой кислоты в тот же самый момент времени после трансфекции,(ii) transfecting mammalian cells with the reference nucleic acid molecule and measuring the amounts of expressed protein encoded by the ORF of the reference nucleic acid molecule at the same time point after transfection,

(III) рассчитывают отношение количества белка, экспрессированного с искусственной молекулы нуклеиновой кислоты, к количеству белка, экспрессированного с референс-молекулы нуклеиновой кислоты,(III) calculate the ratio of the amount of protein expressed from the artificial nucleic acid molecule to the amount of protein expressed from the reference nucleic acid molecule,

где отношение, рассчитанное на стадии (III), составляет ≥1, предпочтительно >1.where the ratio calculated in step (III) is ≥1, preferably >1.

Таким образом, путем сравнения относительного количества белка, продуцированного с рассматриваемой молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, с относительным количеством белка, продуцированного с референс-молекулы нуклеиновой кислоты, можно определять коэффициент, на который повышается эффективность трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, по сравнению с эффективностью трансляции референс-молекулы нуклеиновой кислоты.Thus, by comparing the relative amount of protein produced from the subject nucleic acid molecule of the present invention with the relative amount of protein produced from the reference nucleic acid molecule, it is possible to determine the ratio by which the translation efficiency of the artificial nucleic acid molecule of the present invention is improved. of the present invention, compared with the efficiency of translation of the reference nucleic acid molecule.

Понятие «после трансфекции» используют для ссылки на момент времени, в который была осуществлена трансфекция клеток рассматриваемой молекулой нуклеиновой кислоты и референс-молекулой нуклеиновой кислоты.The term "after transfection" is used to refer to the point in time at which cells were transfected with the nucleic acid molecule in question and the reference nucleic acid molecule.

Предпочтительно по меньшей мере один 3'- и/или 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в изобретении, повышает эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно по меньшей мере в 2 раза, еще более предпочтительно по меньшей мере в 2,5 раза, по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, содержащей референс-3'-UTR и/или референс-5'-UTR, соответственно (т.е. отношение, рассчитанное на стадии (III), составляет по меньшей мере 1,2, предпочтительно по меньшей мере 1,5, более предпочтительно по меньшей мере 2, еще более предпочтительно по меньшей мере 2,5). Иными словами, эффективность трансляции повышается на коэффициент, составляющий по меньшей мере 1,2, предпочтительно по меньшей мере 1,5, более предпочтительно по меньшей мере 2, еще более предпочтительно по меньшей мере 2,5, по сравнению с эффективностью трансляции референс-молекулы нуклеиновой кислоты в тот же самый момент времени.Preferably, at least one 3'- and/or 5'-UTR element in the artificial nucleic acid molecule of the invention increases the efficiency of translation of said artificial nucleic acid molecule by at least 1.2 times, preferably at least 1. .5 times, more preferably at least 2 times, even more preferably at least 2.5 times, compared to the production of a protein from a reference nucleic acid molecule containing a reference-3'-UTR and/or reference-5 '-UTR, respectively (i.e. the ratio calculated in step (III) is at least 1.2, preferably at least 1.5, more preferably at least 2, even more preferably at least 2, 5). In other words, the translation efficiency is increased by a factor of at least 1.2, preferably at least 1.5, more preferably at least 2, even more preferably at least 2.5, compared to the translation efficiency of the reference molecule. nucleic acid at the same time.

Высокая эффективность трансляции обеспечивается 5'-UTR или 3'-UTR, которой рассматриваемая молекула нуклеиновой кислоты отличается от референс-молекулы нуклеиновой кислоты.High translation efficiency is provided by the 5'-UTR or 3'-UTR, in which the nucleic acid molecule in question differs from the reference nucleic acid molecule.

В предпочтительном варианте способа сравнения эффективности трансляции, предлагаемого в настоящем изобретении, (I) референс-молекула нуклеиновой кислоты содержит 3'-UTR-элемент, который не присутствует в искусственной молекуле нуклеиновой кислоты, или (II) референс-молекула нуклеиновой кислоты содержит 5'-UTR-элемент, который не присутствует в искусственной молекуле нуклеиновой кислоты. В более предпочтительных вариантах осуществления изобретения, (I) референс-молекула нуклеиновой кислоты содержит 3'-UTR-элемент, который получен из 3'-UTR гена альбумина, предпочтительно 3'-UTR, которая соответствует последовательности, представленной в SEQ ID NO: 207, или (II) референс-молекула нуклеиновой кислоты содержит 5'-UTR-элемент, который получен из 5'-UTR ТОР-гена, предпочтительно 5'-UTR человеческого рибосомального белка большой субъединицы 32 без 5'-концевого олигопиримидинового тракта, предпочтительно 5'-UTR, которая соответствует последовательности, представленной в SEQ ID NO: 208.In a preferred embodiment of the translation efficiency comparison method of the present invention, (i) the reference nucleic acid molecule contains a 3'-UTR element that is not present in the artificial nucleic acid molecule, or (ii) the reference nucleic acid molecule contains a 5' -UTR element that is not present in an artificial nucleic acid molecule. In more preferred embodiments of the invention, (I) the reference nucleic acid molecule contains a 3'-UTR element that is derived from the 3'-UTR of the albumin gene, preferably the 3'-UTR, which corresponds to the sequence shown in SEQ ID NO: 207 , or (ii) the reference nucleic acid molecule contains a 5'-UTR element that is derived from the 5'-UTR of the TOP gene, preferably the 5'-UTR of the human ribosomal large subunit protein 32 without the 5'-oligopyrimidine tract, preferably 5 '-UTR which corresponds to the sequence shown in SEQ ID NO: 208.

В альтернативном предпочтительном варианте осуществления изобретения (I) референс-молекула нуклеиновой кислоты не содержит никакого элемента 3'-нетранслируемой области (3'-UTR-элемента), или (II) референс-молекула нуклеиновой кислоты не содержит никакого элемента 5'-нетранслируемой области (5'-UTR-элемента).In an alternative preferred embodiment of the invention (I) the reference nucleic acid molecule does not contain any element of the 3'-untranslated region (3'-UTR element), or (II) the reference nucleic acid molecule does not contain any element of the 5'-untranslated region (5'-UTR element).

В предпочтительном варианте осуществления изобретения клетки, применяемые на стадии трансфекции искусственной молекулой нуклеиновой кислоты и референс-молекулой нуклеиновой кислоты, представляют собой клетки млекопитающих, предпочтительно выбранные из группы клеток линий HDF, L929, HEP2G и HeLa. Кроме того, предпочтительно способ осуществляют параллельно на более чем одном типе клеток млекопитающих, например, параллельно на комбинации любых двух, предпочтительно любых трех, более предпочтительно всех четырех из указанных выше клеточных линий. Когда способ осуществляют параллельно на более чем одном типе клеток млекопитающих, то можно считать, что рассматриваемая молекула нуклеиновой кислоты должна характеризоваться высокой эффективностью трансляции, если отношение, рассчитанное на стадии (III) составляет ≥ 1, предпочтительно > 1, по меньшей мере для одного из использованных типов клеток млекопитающих. Однако предпочтительно считать, что рассматриваемая молекула нуклеиновой кислоты характеризуется высокой эффективностью трансляции, если отношение, рассчитанное на стадии (III) составляет ≥ 1, предпочтительно > 1, по меньшей мере для двух типов, например, по меньшей мере для трех типов, например, для четырех типов использованных клеток млекопитающих.In a preferred embodiment, the cells used in the transfection step with the artificial nucleic acid molecule and the reference nucleic acid molecule are mammalian cells, preferably selected from the group of HDF, L929, HEP2G and HeLa cell lines. In addition, preferably the method is carried out in parallel on more than one type of mammalian cells, for example, in parallel on a combination of any two, preferably any three, more preferably all four of the above cell lines. When the method is carried out in parallel on more than one type of mammalian cell, it can be considered that the nucleic acid molecule in question should be characterized by high translation efficiency if the ratio calculated in step (III) is ≥ 1, preferably > 1, for at least one of mammalian cell types used. However, it is preferable to consider that the nucleic acid molecule in question has a high translation efficiency if the ratio calculated in step (III) is ≥ 1, preferably > 1, for at least two types, for example, for at least three types, for example, for four types of mammalian cells used.

Количества экспрессированного белка, кодируемого ОРС искусственной молекулы нуклеиновой кислоты и референс-молекулы нуклеиновой кислоты, измеряют в определенный момент времени после трансфекции (например, через 12 ч, 24 ч, 36 ч, 48 ч или 72 ч). Предпочтительно количества экспрессированного белка, кодируемого ОРС, измеряют через 24 ч после трансфекции.The amounts of expressed protein encoded by the ORF of the artificial nucleic acid molecule and the reference nucleic acid molecule are measured at a specific time point after transfection (eg, 12 hours, 24 hours, 36 hours, 48 hours, or 72 hours). Preferably, the amount of expressed protein encoded by the ORF is measured 24 hours after transfection.

В настоящем изобретении предложена также специфическая предпочтительная референс-конструкция, которую можно применять в способе, предлагаемом в настоящем изобретении. Наиболее предпочтительно, чтобы референс-молекула нуклеиновой кислоты представляла собой мРНК, имеющую SEQ ID NO: 205 (фиг. 1А). В этом случае предпочтительно также, чтобы референс-молекула нуклеиновой кислоты отличалась от искусственной молекулы нуклеиновой кислоты только тем, что по меньшей мере один 3'-UTR-элемент заменен по меньшей мере на один другой 3'-UTR-элемент (предпочтительно на один 3'-UTR-элемент), или тем, что по меньшей мере один 5'-UTR-элемент заменен по меньшей мере на один другой 5'-UTR-элемент (предпочтительно на один 5'-UTR-элемент). В любом случае это позволяет осуществлять непосредственное тестирование того, обеспечивает ли указанный другой 3'-UTR-элемент или другой 5'-UTR-элемент соответственно высокую эффективность трансляции.The present invention also provides a specific preferred reference construct that can be used in the method of the present invention. Most preferably, the reference nucleic acid molecule is an mRNA having SEQ ID NO: 205 (FIG. 1A). In this case, it is also preferred that the reference nucleic acid molecule differs from the artificial nucleic acid molecule only in that at least one 3'-UTR element is replaced by at least one other 3'-UTR element (preferably one 3 '-UTR element), or by replacing at least one 5'-UTR element with at least one other 5'-UTR element (preferably one 5'-UTR element). In any case, this allows direct testing of whether said other 3'UTR element or another 5'UTR element provides correspondingly high translation efficiency.

Наиболее предпочтительно способ определения эффективности трансляции характеризуется также тем, что:Most preferably, the method for determining translation efficiency is further characterized in that:

(а) на стадии трансфекции клетки представляют собой клетки млекопитающих, выбранные из группы клеток линий HDF, L929, HEP2G и HeLa; и(a) in the transfection step, the cells are mammalian cells selected from a group of HDF, L929, HEP2G and HeLa cell lines; and

(б) момент времени для измерения представляет собой момент времени, наступивший через 24 ч после трансфекции; и(b) the time point for measurement is the time point 24 hours after transfection; and

(в) референс-молекула нуклеиновой кислоты представляет собой мРНК, имеющую SEQ ID NO: 205 (фиг. 1А); и(c) the reference nucleic acid molecule is an mRNA having SEQ ID NO: 205 (FIG. 1A); and

предпочтительно (г) референс-молекула нуклеиновой кислоты отличается от искусственной молекулы нуклеиновой кислоты только тем, что (I) по меньшей мере один 3'-UTR-элемент (предпочтительно один 3'-UTR-элемент) заменен по меньшей мере на один другой 3'-UTR-элемент (предпочтительно один 3'-UTR-элемент), или (II) по меньшей мере один 5'-UTR-элемент (предпочтительно один 5'-UTR-элемент)) заменен по меньшей мере на один другой 5'-UTR-элемент (предпочтительно один 5'-UTR-элемент); иными словами, рассматриваемая молекула нуклеиновой кислоты идентична референс-молекуле нуклеиновой кислоты, за исключением того, что по меньшей мере один 5'-UTR-элемент отличается от 5'-UTR, представленной на фиг. 1А, или тем, что по меньшей мере один 3'-UTR-элемент отличается от 3'-UTR, представленной на фиг. 1А. Пример замены 5'-UTR-элемента представлен на фиг. 1Б; пример замены 3'-UTR-элемента представлен на фиг. 1В.preferably (d) the reference nucleic acid molecule differs from the artificial nucleic acid molecule only in that (i) at least one 3'-UTR element (preferably one 3'-UTR element) is replaced by at least one other 3 '-UTR element (preferably one 3'-UTR element), or (II) at least one 5'-UTR element (preferably one 5'-UTR element)) replaced by at least one other 5' -UTR element (preferably one 5'-UTR element); in other words, the nucleic acid molecule in question is identical to the reference nucleic acid molecule, except that at least one 5'-UTR element differs from the 5'-UTR shown in FIG. 1A, or in that at least one 3'UTR element differs from the 3'UTR shown in FIG. 1A. An example of a 5'UTR element replacement is shown in FIG. 1B; an example of a 3'UTR element replacement is shown in FIG. 1B.

Если выполнены все условия от (а) до (г), то способ обозначают также как «стандартизованный анализ для определения эффективности трансляции» или просто «анализ для определения эффективности трансляции». Наиболее предпочтительно, когда искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, характеризуется высокой эффективностью трансляции, которая может быть определена с помощью указанного стандартного анализа для определения эффективности трансляции. Этот стандартный анализ позволяет осуществлять непосредственную идентификацию обладающих наибольшим преимуществом искусственных молекул нуклеиновой кислоты.If all conditions (a) to (d) are met, then the method is also referred to as "standardized translation efficiency assay" or simply "translation efficiency assay". Most preferably, the artificial nucleic acid molecule according to the invention has a high translational efficiency, which can be determined using said standard translational efficiency assay. This standard assay allows direct identification of the most advantageous artificial nucleic acid molecules.

Стандартный анализ применяли в примере 3 настоящего изобретения. Таким путем при создании настоящего изобретения было установлено, что группа новых искусственных нуклеиновых кислот обладает дающим преимущество свойством, заключающимся в высокой эффективности трансляции, а именно, более высокой, чем эффективность трансляции референс-молекулы нуклеиновой кислоты, проиллюстрированной на фиг. 1А (см. пример 3.5). Это является очень неожиданным и дающим преимущество открытием, прежде всего по той причине, что указанная референс-молекула нуклеиновой кислоты содержит 3'-UTR-элемент, который получен из 3'-UTR гена альбумина (3'-UTR соответствует последовательности ДНК, представленной в SEQ ID NO: 207), и 5'-UTR-элемент, который получении из 5'-UTR ТОР-гена, прежде всего 5'-UTR человеческого белка большой субъединицы рибосомы 32 без 5'-концевого олигопиримидинового тракта (5'-UTR соответствует последовательности ДНК, представленной в SEQ ID NO: 208). Известно, что такие 3'-UTR-элементы и 5'-UTR-элементы обладают преимуществом с точки зрения трансляции белка в клетке (данные для 3'-UTR, полученной из гена альбумина представлены в WO 2013/143700; для 5'-TOP-UTR представлены в WO 2013/143700). В настоящем изобретении предложено дополнительное усовершенствование.Standard analysis was used in example 3 of the present invention. In this way, the present invention has found that a group of novel artificial nucleic acids have the advantageous property of high translation efficiency, namely, higher translation efficiency than the reference nucleic acid molecule illustrated in FIG. 1A (see example 3.5). This is a very unexpected and advantageous discovery, primarily because said reference nucleic acid molecule contains a 3'-UTR element that is derived from the 3'-UTR of the albumin gene (the 3'-UTR corresponds to the DNA sequence shown in SEQ ID NO: 207), and a 5'-UTR element that is derived from the 5'-UTR of the TOP gene, primarily the 5'-UTR of the human ribosome 32 large subunit protein without the 5'-terminal oligopyrimidine tract (5'-UTR corresponds to the DNA sequence shown in SEQ ID NO: 208). Such 3'-UTR elements and 5'-UTR elements are known to be advantageous in terms of protein translation in the cell (data for the 3'-UTR derived from the albumin gene are presented in WO 2013/143700; for the 5'-TOP -UTRs are presented in WO 2013/143700). The present invention proposes a further improvement.

В некоторых вариантах осуществления изобретения ОРС искусственной молекулы нуклеиновой кислоты кодирует белок, который можно количественно оценивать, предпочтительно репортерный белок. Эти варианты осуществления изобретения являются предпочтительными для применения в способе сравнения эффективности трансляции, предлагаемом в настоящем изобретении. В других вариантах осуществления изобретения ОРС искусственной молекулы нуклеиновой кислоты не кодирует белок, который можно количественно оценивать, предпочтительно репортерный белок. Например, если с помощью способа, предлагаемого в изобретении, с использованием ОРС искусственной молекулы нуклеиновой кислоты, кодирующей белок, который можно количественно оценивать, определили конкретную 5'-UTR или 3'-UTR, обеспечивающую высокую эффективность трансляции, то указанную 5'-UTR или 3'-UTR можно рекомбинировать с любой ОРС. Например, когда в стандартизованном анализе для определения эффективность трансляции ОРС кодирует репортерный белок, то искусственные нуклеиновые кислоты, предлагаемые в настоящем изобретении, не ограничены ОРС, применяемой в стандартизованном анализе.In some embodiments, the ORF of the artificial nucleic acid molecule encodes a protein that can be quantified, preferably a reporter protein. These embodiments of the invention are preferred for use in the translation efficiency comparison method of the present invention. In other embodiments, the ORF of the artificial nucleic acid molecule does not encode a quantifiable protein, preferably a reporter protein. For example, if using the method of the invention, using the ORF of an artificial nucleic acid molecule encoding a protein that can be quantified, a specific 5'-UTR or 3'-UTR is determined that provides high translation efficiency, then the specified 5'-UTR or the 3'-UTR can be recombined with any ORF. For example, when an ORF encodes a reporter protein in a standardized assay for determining translation efficiency, the artificial nucleic acids of the present invention are not limited to the ORF used in the standardized assay.

Указанные способы можно применять итерационно; а именно, искусственную молекулу нуклеиновой кислоты, для которой с помощью способа, представленного в настоящем описании, было установлено, что она характеризуется высокой эффективностью трансляции, саму можно применять в качестве «референс-конструкции» для последующего раунда, представленного в настоящем описании способа. Это позволяет тестировать, характеризуется ли другая искусственная молекула нуклеиновой кислоты еще более высокой эффективностью трансляции (или то, обеспечивает ли UTR, содержащаяся в другой искусственной молекуле нуклеиновой кислоты, еще более высокую эффективность трансляции). Это позволяет идентифицировать еще более усовершенствованные искусственные молекулы нуклеиновой кислоты и UTR.These methods can be applied iteratively; namely, an artificial nucleic acid molecule found to have high translation efficiency by the method of the present specification can itself be used as a "reference construct" for the next round of the present method. This makes it possible to test whether another artificial nucleic acid molecule has even higher translation efficiency (or whether the UTR contained in another artificial nucleic acid molecule provides even higher translation efficiency). This allows the identification of even more advanced artificial nucleic acid molecules and UTRs.

Стабильная мРНКstable mRNA

В некоторых вариантах осуществления изобретения по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, получают из стабильной мРНК. В данном случае «полученный (имеющий происхождение)» из стабильной мРНК означает, что последовательность по меньшей мере одного 3'-UTR-элемента и/или по меньшей мере одного 5'-UTR-элемента идентична по меньшей мере на 50%, предпочтительно по меньшей мере на 60%, предпочтительно по меньшей мере на 70%, более предпочтительно по меньшей мере на 75%, более предпочтительно по меньшей мере на 80%, более предпочтительно по меньшей мере на 85%, еще более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, и наиболее предпочтительно по меньшей мере на 98% последовательности 3'-UTR-элемента и/или 5'-UTR-элемента стабильной мРНК. Предпочтительно стабильная мРНК представляет собой встречающуюся в естественных условиях мРНК и, таким образом, 3'-UTR-элемент и/или 5'-UTR-элемент стабильной мРНК относится к 3'-UTR и/или 5'-UTR встречающейся в естественных условиях мРНК, или их фрагментам или вариантам. Кроме того, 3'-UTR-элемент и/или 5'-UTR-элемент полученный из стабильной мРНК, предпочтительно относится также к 3'-UTR-элементу и/или 5'-UTR-элементу, который модифицирован по сравнению с встречающимся в естественных условиях 3'-UTR-элементом и/или 5'-UTR-элементом, например, для того, чтобы еще больше повышать стабильность РНК и/или для того, чтобы пролонгировать и/или увеличивать производство белка. Само собой разумеется, что предпочтительными являются такие модификации, которые не ухудшают стабильность РНК, например, по сравнению с встречающимся в естественных условиях (немодифицированным) 3'-UTR-элементом и/или 5'-UTR-элементом. В частности, понятие «мРНК» в контексте настоящего описания относится к молекуле мРНК, однако, оно может относиться также и к представленным в настоящем описании видам мРНК.In some embodiments, at least one 3'UTR element and/or at least one 5'UTR element in the artificial nucleic acid molecule of the present invention is derived from stable mRNA. In this case, "derived (derived from)" from a stable mRNA means that the sequence of at least one 3'-UTR element and/or at least one 5'-UTR element is at least 50% identical, preferably at least 60%, preferably at least 70%, more preferably at least 75%, more preferably at least 80%, more preferably at least 85%, even more preferably at least 90% , even more preferably at least 95%, and most preferably at least 98% of the sequence of the 3'-UTR element and/or 5'-UTR element of the stable mRNA. Preferably the stable mRNA is a naturally occurring mRNA and thus the 3'UTR element and/or the 5'UTR element of the stable mRNA refers to the 3'UTR and/or 5'UTR of the naturally occurring mRNA , or their fragments or variants. In addition, a 3'UTR element and/or a 5'UTR element derived from a stable mRNA preferably also refers to a 3'UTR element and/or a 5'UTR element that is modified from that found in natural conditions 3'-UTR element and/or 5'-UTR element, for example, in order to further improve the stability of the RNA and/or to prolong and/or increase protein production. It goes without saying that modifications are preferred which do not impair the stability of the RNA, eg compared to a naturally occurring (unmodified) 3'UTR element and/or a 5'UTR element. In particular, the term "mRNA" in the context of the present description refers to the mRNA molecule, however, it can also refer to the types of mRNA presented in the present description.

Предпочтительно стабильность мРНК, т.е. время расщепления и/или полужизни мРНК, оценивают в стандартных условиях, например, в стандартных условиях (стандартная среда, инкубация и т.д.) для определенной применяемой клеточной линии.Preferably the stability of the mRNA, ie. the cleavage time and/or half-life of the mRNA is evaluated under standard conditions, eg under standard conditions (standard medium, incubation, etc.) for the specific cell line used.

Понятие «стабильная мРНК» в контексте настоящего описания относится в целом к мРНК, характеризующейся медленным расщеплением мРНК. Таким образом, «стабильная мРНК», как правило, обладает продолжительным временем полужизни. Время полужизни мРНК представляет собой время, необходимое для расщепления 50% молекул мРНК, присутствующих в условиях in vivo или in vitro. Следовательно, стабильность мРНК, как правило, оценивают in vivo или in vitro. В данном случае in vitro относится, в частности, к («живым») клеткам и/или ткани, включая ткань живого индивидуума. Клетки включают, в частности, клеточные линии, первичные клетки, клетки в ткани или организме индивидуумов. В конкретных вариантах осуществления изобретения пригодными для применения согласно настоящему изобретению могут быть типы клеток, позволяющие осуществлять культивирование клеток. Наиболее предпочтительными являются клетки млекопитающих, например, человеческие клетки и мышиные клетки. В наиболее предпочтительных вариантах осуществления изобретения применяют человеческие клеточные линии HeLa, HEPG2 и U-937 и мышиные клеточные линии NIH3T3, JAWSII и L929. Кроме того, наиболее пригодными являются первичные клетки, в наиболее предпочтительных вариантах осуществления изобретения можно применять человеческие кожные фибробласты (HDF). В альтернативном варианте можно применять также ткань индивидуума.The term "stable mRNA" in the context of the present description refers generally to mRNA, characterized by slow cleavage of mRNA. Thus, "stable mRNA" typically has a long half-life. The half-life of an mRNA is the time required to cleave 50% of the mRNA molecules present under in vivo or in vitro conditions. Therefore, mRNA stability is generally assessed in vivo or in vitro. As used herein, in vitro refers specifically to (“live”) cells and/or tissues, including tissue from a living individual. Cells include, in particular, cell lines, primary cells, cells in a tissue or an individual's body. In specific embodiments of the invention suitable for use according to the present invention may be cell types that allow the cultivation of cells. Most preferred are mammalian cells, eg human cells and mouse cells. In the most preferred embodiments of the invention, human HeLa, HEPG2 and U-937 cell lines and mouse NIH3T3, JAWSII and L929 cell lines are used. In addition, primary cells are most suitable, in the most preferred embodiments of the invention, human dermal fibroblasts (HDF) can be used. Alternatively, tissue from the individual may also be used.

Предпочтительно время полужизни «стабильной мРНК» составляет по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч, по меньшей мере 12 ч, по меньшей мере 13 ч, по меньшей мере 14 ч, и/или по меньшей мере 15 ч. Время полужизни представляющей интерес мРНК можно определять различными методами, известными специалисту в данной области. Как правило, время полужизни представляющей интерес мРНК определяют путем определения константы расщепления, при этом, как правило, предполагается, что имеет место идеальная ситуация in vivo (или in vitro, как указано выше), в которой транскрипция представляющей интерес мРНК может быть полностью «выключена» (или снижена пo-меньшей мере до не поддающегося обнаружению уровня). В такой идеальной ситуации, как правило, предполагается, что такое расщепление мРНК происходит в соответствии с кинетикой первого порядка. Следовательно, расщепление мРНК, как правило, может быть описано следующим уравнением:Preferably, the "stable mRNA" half-life is at least 5 hours, at least 6 hours, at least 7 hours, at least 8 hours, at least 9 hours, at least 10 hours, at least 11 hours, at least 12 hours, at least 13 hours, at least 14 hours, and/or at least 15 hours. The half-life of an mRNA of interest can be determined by various methods known to one of skill in the art. Generally, the half-life of the mRNA of interest is determined by determining the cleavage constant, generally assuming that there is an ideal situation in vivo (or in vitro as above) in which transcription of the mRNA of interest can be completely "turned off". ” (or reduced to at least an undetectable level). In this ideal situation, it is generally assumed that such mRNA cleavage occurs according to first order kinetics. Therefore, mRNA cleavage can generally be described by the following equation:

Figure 00000002
Figure 00000002

где А0 представляет собой количество (или концентрацию) представляющей интерес мРНК в момент времени 0, т.е. перед началом расщепления, A(t) представляет собой количество (или концентрацию) представляющей интерес мРНК в момент времени t в процессе расщепления, а λ представляет собой константу расщепления. Таким образом, если известны количество (или концентрация) представляющей интерес мРНК в момент времени 0 (А0) и количество (или концентрацию) представляющей интерес мРНК в момент времени t в процессе расщепления (A(t) и t), то можно рассчитать константу расщепления λ. На основе константы расщепления λ можно рассчитать время полужизни t1/2 согласно следующему уравнению:where A 0 is the amount (or concentration) of mRNA of interest at time 0, i. before the start of cleavage, A(t) is the amount (or concentration) of mRNA of interest at time t in the cleavage process, and λ is the cleavage constant. Thus, if the amount (or concentration) of mRNA of interest at time 0 (A 0 ) and the amount (or concentration) of mRNA of interest at time t in the cleavage process (A(t) and t) are known, then the constant can be calculated splitting λ. Based on the splitting constant λ, the half-life t 1/2 can be calculated according to the following equation:

Figure 00000003
Figure 00000003

поскольку по определению A(t)/A0=1/2 при t1/2. Таким образом, для оценки времени полужизни представляющей интерес мРНК, как правило, определяют количество или концентрацию мРНК в процессе расщепления РНК in vivo (или in vitro, как указано выше).because by definition A(t)/A0=1/2 at t 1/2 . Thus, in order to estimate the half-life of an mRNA of interest, the amount or concentration of the mRNA is usually determined during in vivo (or in vitro, as above) cleavage of the RNA.

Для определения количества или концентрации мРНК в процессе расщепления РНК in vivo (или in vitro, как указано выше) можно применять различные методы, известные специалисту в данной области. Примеры таких методов включают (но, не ограничиваясь только ими) общее ингибирование транскрипции, например, с помощью ингибитора транскрипции, такого как актиномицин D, применение индуцибельных промоторов для специфического усиления кратковременной транскрипции, например, индуцируемая сывороткой промоторная система c-fos и регуляторная промоторная система Tet-off, и кинетические методы мечения, например, импульсного мечения, например, с использованием 4-тиоуридина (4sU), 5-этинилуридина (EU) или 5'-бромуридина (BrU). Другие подробности и предпочтительные варианты, касающиеся того, как определять количество или концентрацию мРНК в процессе расщепления РНК, описаны ниже в контексте способа идентификации 3'-UTR-элемента и/или по меньшей мере одного 5'-UTR-элемента, предлагаемого в настоящем изобретении. Соответствующее описание и предпочтительные варианты того, как определять количество или концентрацию мРНК в процессе расщепления РНК применимы также и в данном случае.To determine the amount or concentration of mRNA in the process of cleavage of RNA in vivo (or in vitro, as indicated above), you can use various methods known to the person skilled in the art. Examples of such methods include, but are not limited to, general transcription inhibition, e.g., with a transcription inhibitor such as actinomycin D, the use of inducible promoters to specifically enhance transient transcription, e.g., the serum inducible c-fos promoter system and the regulatory promoter system. Tet-off, and kinetic labeling methods, eg pulse labeling, eg using 4-thiouridine (4sU), 5-ethynyluridine (EU), or 5'-bromouridine (BrU). Other details and preferred options regarding how to determine the amount or concentration of mRNA during RNA cleavage are described below in the context of the method for identifying a 3'-UTR element and/or at least one 5'-UTR element of the present invention. . The corresponding description and preferred options for how to determine the amount or concentration of mRNA during RNA cleavage apply here as well.

Предпочтительно «стабильная мРНК» в контексте настоящего изобретения характеризуется более медленным расщеплением мРНК по сравнению с усредненной мРНК, которое предпочтительно оценивают in vivo (или in vitro, как указано выше). Например, «расщепление усредненной мРНК» можно оценивать путем исследования расщепления мРНК для множества видов мРНК, предпочтительно для 100, по меньшей мере 300, по меньшей мере 500, по меньшей мере 1000, по меньшей мере 2000, по меньшей мере 3000, по меньшей мере 4000, по меньшей мере 5000, по меньшей мере 6000, по меньшей мере 7000, по меньшей мере 8000, по меньшей мере 9000, по меньшей мере 10000, по меньшей мере 11000, по меньшей мере 12000, по меньшей мере 13000, по меньшей мере 14000, по меньшей мере 15000, по меньшей мере 16000, по меньшей мере 17000, по меньшей мере 18000, по меньшей мере 19000, по меньшей мере 20000, по меньшей мере 21000, по меньшей мере 22000, по меньшей мере 23000, по меньшей мере 24000, по меньшей мере 25000, по меньшей мере 26000, по меньшей мере 27000, по меньшей мере 28000, по меньшей мере 29000, по меньшей мере 30000 видов мРНК. Наиболее предпочтительно оценивать весь транскриптом или максимально возможное количество видов мРНК в транскриптоме. Это можно осуществлять, например, с использованием микромассива, обеспечивающего охват всех транскриптов.Preferably "stable mRNA" in the context of the present invention is characterized by slower cleavage of mRNA compared to average mRNA, which is preferably measured in vivo (or in vitro as above). For example, "average mRNA cleavage" can be assessed by examining mRNA cleavage for multiple mRNA species, preferably 100, at least 300, at least 500, at least 1000, at least 2000, at least 3000, at least 4000 at least 5000 at least 6000 at least 7000 at least 8000 at least 9000 at least 10000 at least 11000 at least 12000 at least 13000 at least 14000 at least 15000 at least 16000 at least 17000 at least 18000 at least 19000 at least 20000 at least 21000 at least 22000 at least 23000 at least 24,000, at least 25,000, at least 26,000, at least 27,000, at least 28,000, at least 29,000, at least 30,000 mRNA species. It is most preferable to evaluate the entire transcriptome or the maximum possible number of mRNA species in the transcriptome. This can be done, for example, using a microarray that covers all transcripts.

Понятие «виды мРНК» в контексте настоящего описания соответствует геномной транскрипционной единице, а именно, как правило, к гену. Так, в одном «виде мРНК» могут присутствовать различные транскрипты, например, обусловленные процессингом мРНК. Виды мРНК можно вносить в виде пятен на микромассив. Следовательно, микромассив представляет собой предпочтительный «инструмент» определения количества для множества видов мРНК, например, в определенный момент времени в процессе расщепления мРНК. Однако можно применять также и другие методы, известные специалисту в данной области, например, секвенирование РНК, количественную ПЦР и т.д.The concept of "types of mRNA" in the context of the present description corresponds to a genomic transcription unit, namely, as a rule, to a gene. Thus, in one "type of mRNA" there may be different transcripts, for example, due to the processing of mRNA. mRNA species can be introduced as spots on the microarray. Therefore, the microarray is the preferred quantification "tool" for multiple mRNA species, for example, at a specific point in time during mRNA cleavage. However, other methods known to the person skilled in the art, such as RNA sequencing, quantitative PCR, etc., can also be used.

Согласно настоящему изобретению наиболее предпочтительно, когда стабильная мРНК характеризуется таким расщеплением мРНК, при котором отношение количества указанной мРНК во второй момент времени к количеству указанной мРНК в первый момент времени составляет по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%), по меньшей мере 0,9 (90%) или по меньшей мере 0,95 (95%). При этом подразумевается, что второй момент времени наступает позднее первого момента времени в процессе расщепления.According to the present invention, it is most preferred that the stable mRNA is characterized by mRNA cleavage such that the ratio of the amount of said mRNA at the second time point to the amount of said mRNA at the first time point is at least 0.5 (50%), at least 0.6 (60%), at least 0.7 (70%), at least 0.75 (75%), at least 0.8 (80%), at least 0.85 (85%), by at least 0.9 (90%) or at least 0.95 (95%). This implies that the second time occurs later than the first time in the splitting process.

Предпочтительно первый момент времени выбирают таким образом, чтобы рассматривать только мРНК, которая подвергается процессу расщепления, т.е. чтобы не рассматривать мРНК, возникающую, например, в процессе транскрипции. Например, если применяют кинетические методы мечения, например, импульсное мечение, то первый момент времени предпочтительно выбирают таким образом, чтобы при этом было завершено включение метки в мРНК, т.е. не имело место продолжение включения метки в мРНК. Таким образом, если применяют кинетическое мечение, то первый момент времени может наступать по меньшей мере через 10 мин, по меньшей мере 20 мин, по меньшей мере через 30 мин, по меньшей мере 40 мин, по меньшей мере 50 мин, по меньшей мере 60 мин, по меньшей мере через 70 мин, по меньшей мере через 80 мин или по меньшей мере через 90 мин после завершения экспериментальной процедуры мечения, например, после завершения инкубации клеток с меткой.Preferably, the first time point is chosen such that only the mRNA that is undergoing the cleavage process is considered, i.e. so as not to consider mRNA that occurs, for example, during transcription. For example, if kinetic labeling methods are used, such as pulsed labeling, the first time point is preferably chosen such that incorporation of the label into the mRNA is completed, i.e. there was no continued incorporation of the label into the mRNA. Thus, if kinetic labeling is used, the first time point can be at least 10 minutes, at least 20 minutes, at least 30 minutes, at least 40 minutes, at least 50 minutes, at least 60 minutes, at least 70 minutes, at least 80 minutes, or at least 90 minutes after completion of the experimental labeling procedure, for example, after completion of incubation of the labeled cells.

Например, первый момент времени может наступать предпочтительно в период от 0 до 6 ч после прекращения транскрипции (например, с помощью ингибитора транскрипции), прекращения индукции промотора в случае индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания мечения. Более предпочтительно первый момент времени может наступать в период от 30 мин до 5 ч, еще более предпочтительно от 1 ч до 4 ч и наиболее предпочтительно примерно через 3 ч после прекращения транскрипции (например, с помощью ингибитора транскрипции), прекращения индукции промотора в случае индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания мечения.For example, the first time point may preferably occur between 0 and 6 hours after transcription has ceased (eg, with a transcription inhibitor), promoter induction has ceased for inducible promoters, or after the pulse or label has ceased, such as after labeling has ended. More preferably, the first time point may be between 30 minutes and 5 hours, even more preferably between 1 hour and 4 hours, and most preferably about 3 hours after transcription has ceased (e.g., with a transcription inhibitor), promoter induction has ceased in the case of inducible promoters or after the termination of the pulse or label, for example, after the end of labeling.

Предпочтительно, в качестве второго момента времени выбирают по возможности максимально поздний момент времени в процессе расщепления мРНК. Однако, если рассматривают множество видов мРНК, то второй момент времени предпочтительно выбирают таким образом, чтобы все еще присутствовало значительное количество из множества видов мРНК, предпочтительно по меньшей мере 10% видов мРНК, в поддающемся обнаружению количестве, т.е. в количестве, превышающем 0. Предпочтительно второй момент времени наступает по меньшей мере через 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч, по меньшей мере 12 ч, по меньшей мере 13 ч, по меньшей мере 14 ч или по меньшей мере 15 ч после окончания транскрипции или после окончания экспериментальной процедуры мечения.Preferably, the second time point is chosen as late as possible in the mRNA cleavage process. However, if multiple mRNA species are considered, the second time point is preferably chosen such that a significant amount of the plurality of mRNA species, preferably at least 10% of the mRNA species, is still present in a detectable amount, i. in an amount greater than 0. Preferably, the second time occurs after at least 5 hours, at least 6 hours, at least 7 hours, at least 8 hours, at least 9 hours, at least 10 hours, at least at least 11 hours, at least 12 hours, at least 13 hours, at least 14 hours, or at least 15 hours after the end of transcription or after the end of the experimental labeling procedure.

Таким образом, промежуток времени между первым моментом времени и вторым моментом времени предпочтительно является по возможности максимально большим в указанных выше пределах. Следовательно, промежуток времени между первым моментом времени и вторым моментом времени предпочтительно составляет по меньшей мере 4 ч по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч или по меньшей мере 12 ч.Thus, the time interval between the first time and the second time is preferably as long as possible within the above limits. Therefore, the time interval between the first time point and the second time point is preferably at least 4 hours, at least 5 hours, at least 6 hours, at least 7 hours, at least 8 hours, at least 9 hours, at least 10 hours, at least 11 hours, or at least 12 hours.

Кроме того, можно идентифицировать по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, с помощью способа идентификации 3'-UTR-элемента и/или 5'-UTR-элемента, предлагаемого в настоящем изобретении, который представлен в настоящем описании. Наиболее предпочтительно по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, идентифицировать с помощью представленного в настоящем описании способа идентификации 3'-UTR-элемента и/или 5'-UTR-элемента, который обеспечивает высокую эффективность трансляции искусственной молекулы нуклеиновой кислоты.In addition, at least one 3'UTR element and/or at least one 5'UTR element in the artificial nucleic acid molecule of the present invention can be identified using the 3'UTR element identification method, and /or 5'-UTR-element proposed in the present invention, which is presented in the present description. Most preferably, at least one 3'-UTR element and/or at least one 5'-UTR element in the artificial nucleic acid molecule of the present invention is identified using the 3'-UTR-identification method provided herein. element and/or 5'-UTR element, which provides high translation efficiency of the artificial nucleic acid molecule.

Предпочтительные варианты искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретенииPreferred embodiments of the artificial nucleic acid molecule of the present invention

Предпочтительно по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая получена из 3'-UTR и/или 5'-UTR гена, кодирующего эукариотический белок, предпочтительно из 3'-UTR и/или 5'-UTR гена, кодирующего белок позвоночного, более предпочтительно из 3'-UTR и/или 5'-UTR гена, кодирующего белок млекопитающего, например, из генов, кодирующих мышиный и человеческий белок, еще более предпочтительно из 3'-UTR и/или 5'-UTR гена, кодирующего белок примата или грызуна, прежде всего 3'-UTR и/или 5'-UTR гена, кодирующего человеческий или мышиный белок.Preferably, at least one 3'-UTR element and/or at least one 5'-UTR element in the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is derived from a 3'-UTR and /or the 5'-UTR of a gene encoding a eukaryotic protein, preferably from the 3'-UTR and/or 5'-UTR of a gene encoding a vertebrate protein, more preferably from the 3'-UTR and/or 5'-UTR of a gene encoding a mammalian protein , for example, from genes encoding mouse and human protein, even more preferably from the 3'-UTR and/or 5'-UTR of a gene encoding a primate or rodent protein, especially the 3'-UTR and/or 5'-UTR of the gene, encoding a human or mouse protein.

В целом, следует иметь в виду, что по меньшей мере один 3'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая предпочтительно получена из встречающейся в естественных условиях (в природе) 3'-UTR, в то время как по меньшей мере один 5'-UTR-элемент в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая предпочтительно получена из встречающейся в естественных условиях (в природе) 5'-UTR.In general, it should be understood that at least one 3'-UTR element in the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is preferably derived from naturally occurring 3 '-UTR, while at least one 5'-UTR element in the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is preferably derived from naturally occurring 5' -UTR.

Предпочтительно по меньшей мере одна открытая рамка считывания является гетерологичной по меньшей мере одному 3'-UTR-элементу и/или по меньшей мере одному 5'-UTR-элементу. Понятие «гетерологичный» в этом контексте означает, что два элемента последовательности, содержащиеся в искусственной молекуле нуклеиновой кислоты, такие как открытая рамка считывания и 3'-UTR-элемент и/или открытая рамка считывания и 5'-UTR-элемент, не встречаются в естественных условиях (в природе) в рассматриваемой комбинации. Как правило, они являются рекомбинантными. Предпочтительно 3'-UTR-элемент и/или 5'-UTR-элемент получены/получен из гена, отличного от того, из которого получена открытая рамка считывания. Например, ОРС может быть получена из гена, отличного от того, из которого получен 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент, например, кодирующего другой белок или такой же белок, но из другого вида и т.д. Т.е. открытая рамка считывания получена из гена, который отличен от гена, из которого получен 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент. В предпочтительном варианте осуществления изобретения ОРС не кодирует человеческий рибосомальный белок или растительный рибосомальный белок (например, из Arabidopsis), предпочтительно не кодирует человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 Arabidopsis (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16).Preferably, at least one open reading frame is heterologous to at least one 3'UTR element and/or at least one 5'UTR element. The term "heterologous" in this context means that two sequence elements contained in an artificial nucleic acid molecule, such as an open reading frame and a 3'-UTR element and/or an open reading frame and a 5'-UTR element, do not occur in natural conditions (in nature) in the considered combination. As a rule, they are recombinant. Preferably, the 3'UTR element and/or the 5'UTR element is/is derived from a different gene from that from which the open reading frame is derived. For example, the ORF may be derived from a different gene from which the 3'UTR element and/or at least one 5'UTR element is derived, such as encoding a different protein or the same protein from a different species. etc. Those. the open reading frame is derived from a gene that is different from the gene from which the 3'UTR element and/or at least one 5'UTR element is derived. In a preferred embodiment, the ORF does not encode human ribosomal protein or plant ribosomal protein (e.g. from Arabidopsis), preferably does not encode human ribosomal protein S6 (RPS6), human ribosomal protein L36a-like protein (RPL36AL) or Arabidopsis ribosomal protein S16 (RPS16). ). In another preferred embodiment of the invention, the open reading frame (ORF) does not encode ribosomal S6 protein (RPS6), ribosomal protein L36a like protein (RPL36AL) or ribosomal protein S16 (RPS16).

В конкретных вариантах осуществления изобретения предпочтительно открытая рамка считывания не кодирует репортерный белок, например, выбранный из группы, состоящей из белков глобина (прежде всего, бета-глобина), белка люциферазы, белков GFP или их вариантов, например, вариантов, последовательности которых идентичны по меньшей мере на 70% последовательности белка глобина, белка люциферазы или белка GFP. При этом наиболее предпочтительно, чтобы открытая рамка считывания (ОРС) не кодировала белок GFP. Наиболее предпочтительно также, чтобы открытая рамка считывания (ОРС) не кодировала репортерный ген или не происходила из репортерного гена, где репортерный ген предпочтительно не выбран из группы, состоящей из (генов) белков глобина (прежде всего бета-глобина), белка люциферазы, бета-глюкуронидазы (GUS) и белков GFP или их вариантов, предпочтительно не выбирают из EGFP или из вариантов любого из вышеуказанных генов, последовательности которых, как правило, идентичны по меньшей мере на 70% последовательности любого из вышеуказанных репортерных генов, предпочтительно генов белка глобина, белка люциферазы или белка GFP.In specific embodiments of the invention, preferably the open reading frame does not encode a reporter protein, for example, selected from the group consisting of globin proteins (primarily beta-globin), luciferase protein, GFP proteins, or variants thereof, for example, variants whose sequences are identical in at least 70% of the globin protein, luciferase protein or GFP protein sequence. Most preferably, the open reading frame (ORF) does not encode the GFP protein. It is also most preferred that the open reading frame (ORF) does not encode a reporter gene or is not derived from a reporter gene, where the reporter gene is preferably not selected from the group consisting of (genes) globin proteins (primarily beta-globin), luciferase protein, beta -glucuronidase (GUS) and GFP proteins or variants thereof, preferably not selected from EGFP or from variants of any of the above genes, the sequences of which are generally at least 70% identical to the sequence of any of the above reporter genes, preferably globin protein genes, luciferase protein or GFP protein.

Еще более предпочтительно 3'-UTR-элемент и/или 5'-UTR-элемент является гетерологичным относительно любого другого элемента, содержащегося в искусственной нуклеиновой кислоте, представленной в настоящем описании. Например, если искусственная нуклеиновая кислота, предлагаемая в изобретении, содержит 3'-UTR-элемент из рассматриваемого гена, то она предпочтительно не содержит никакой другой нуклеотидной последовательности, прежде всего никакой функциональной нуклеотидной последовательности (например, элемента кодирующей или регуляторной последовательности) из этого же гена, включая его регуляторные последовательности на 5'- и 3'-конце ОРС гена. Следовательно, например, если искусственная нуклеиновая кислота, предлагаемая в изобретении, содержит 5'-UTR-элемент из рассматриваемого гена, то она предпочтительно не содержит никакой другой нуклеотидной последовательности, прежде всего никакой функциональной нуклеотидной последовательности (например, элемента кодирующей или регуляторной последовательности) из этого же гена, включая его регуляторные последовательности на 5'- и 3'-конце ОРС гена.Even more preferably, the 3'UTR element and/or the 5'UTR element is heterologous with respect to any other element contained in the artificial nucleic acid provided herein. For example, if an artificial nucleic acid according to the invention contains a 3'-UTR element from the gene in question, then it preferably does not contain any other nucleotide sequence, in particular any functional nucleotide sequence (for example, a coding or regulatory sequence element) from the same gene, including its regulatory sequences at the 5'- and 3'-end of the ORF gene. Therefore, for example, if an artificial nucleic acid according to the invention contains a 5'-UTR element from the gene in question, then it preferably does not contain any other nucleotide sequence, in particular any functional nucleotide sequence (for example, a coding or regulatory sequence element) from of the same gene, including its regulatory sequences at the 5' and 3' ends of the ORF gene.

Кроме того, предпочтительно, когда искусственная нуклеиновая кислота, предлагаемая в настоящем изобретении, содержит по меньшей мере одну открытую рамку считывания, по меньшей мере одну 3'-UTR (элемент) и по меньшей мере одну 5'-UTR (элемент), при этом или по меньшей мере одна 3'-UTR (элемент) представляет собой 3'-UTR-элемент, предлагаемый в настоящем изобретении, и/или по меньшей мере одна 5'-UTR (элемент) представляет собой 5'-UTR-элемент, предлагаемый в настоящем изобретении. В такой предпочтительной искусственной нуклеиновой кислоте, предлагаемой в настоящем изобретении, которая содержит по меньшей мере одну открытую рамку считывания, по меньшей мере одна 3'-UTR (элемент) и по меньшей мере одна 5'-UTR (элемент), наиболее предпочтительно, когда каждая/каждый из по меньшей мере одной открытой рамки считывания, по меньшей мере одной 3'-UTR (элемента) и по меньшей мере одной 5'-UTR (элемента) являются гетерологичными, т.е. ни по меньшей мере одна 3'-UTR (элемент) и по меньшей мере одна 5'-UTR (элемент), ни открытая рамка считывания и 3'-UTR (элемент) или 5'-UTR (элемент) соответственно, не встречаются в естественных условиях (в природе) в рассматриваемой комбинации. Это означает, что искусственная молекула нуклеиновой кислоты содержит ОРС, 3'-UTR (элемент) и 5'-UTR (элемент), которые все являются гетерологичными друг другу, например, они являются рекомбинантными, поскольку каждый из указанных элементов происходит из различных генов (и их 5'- и 3'-UTR). В другом предпочтительном варианте осуществления изобретения 3'-UTR (элемент) не происходит из 3'-UTR (элемента) вирусного гена или не имеет происхождения из вируса.It is further preferred that the artificial nucleic acid of the present invention comprises at least one open reading frame, at least one 3'-UTR (element) and at least one 5'-UTR (element), wherein or at least one 3'-UTR (element) is a 3'-UTR element of the present invention, and/or at least one 5'-UTR (element) is a 5'-UTR element of the present invention in the present invention. In such a preferred artificial nucleic acid of the present invention, which contains at least one open reading frame, at least one 3'-UTR (element) and at least one 5'-UTR (element), most preferably when each of at least one open reading frame, at least one 3'-UTR (element) and at least one 5'-UTR (element) are heterologous, i. neither at least one 3'-UTR (element) and at least one 5'-UTR (element), nor an open reading frame and a 3'-UTR (element) or 5'-UTR (element), respectively, occur in natural conditions (in nature) in the considered combination. This means that an artificial nucleic acid molecule contains an ORF, a 3'-UTR (element) and a 5'-UTR (element), which are all heterologous to each other, for example, they are recombinant, since each of these elements comes from different genes ( and their 5'- and 3'-UTRs). In another preferred embodiment of the invention, the 3'-UTR (element) is not derived from the 3'-UTR (element) of a viral gene or is not derived from a virus.

Предпочтительно по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент функционально связан с ОРС. Это означает, что предпочтительно 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент ассоциирован с ОРС таким образом, что он может осуществлять функцию, такую как функция повышения или стабилизации экспрессии кодируемого пептида или белка, или функцию стабилизации искусственной молекулы нуклеиновой кислоты. Предпочтительно ОРС и 3'-UTR-элемент ассоциированы в направлении 5'→3' и/или 5'-UTR-элемент и ОРС ассоциированы в направлении 5'→3'. Таким образом, предпочтительно искусственная молекула нуклеиновой кислоты содержит, как правило, структуру 5'-[5'-UTR-элемент]-(необязательный)-линкер-ОРС-[3'-UTR-элемент]-3', при этом искусственная молекула нуклеиновой кислоты может содержать только 5'-UTR-элемент и не содержать 3'-UTR-элемент, только 3'-UTR-элемент и не содержать 5'-UTR-элемент, или оба, и 3'-UTR-элемент, и 5'-UTR-элемент. Кроме того, линкер может присутствовать или отсутствовать. Например, линкер может состоять из одного или нескольких нуклеотидов, например, представлять собой сегмент, состоящий из 1-50 или 1-20 нуклеотидов, например, содержащий или состоящий из одного или нескольких сайтов, распознаваемых рестриктазами (сайтов рестрикции).Preferably, at least one 3'UTR element and/or at least one 5'UTR element is operably linked to the ORF. This means that preferably the 3'UTR element and/or at least one 5'UTR element is associated with the ORF in such a way that it can perform a function, such as the function of increasing or stabilizing the expression of the encoded peptide or protein, or the function stabilization of an artificial nucleic acid molecule. Preferably, the ORF and the 3'UTR element are associated in the 5'→3' direction and/or the 5'UTR element and the ORF are associated in the 5'→3' direction. Thus, preferably, the artificial nucleic acid molecule contains, as a rule, the structure nucleic acid may contain only a 5'-UTR element and no 3'-UTR element, only a 3'-UTR element and no 5'-UTR element, or both and a 3'-UTR element, and 5'-UTR element. In addition, the linker may or may not be present. For example, the linker may consist of one or more nucleotides, for example, be a segment consisting of 1-50 or 1-20 nucleotides, for example, containing or consisting of one or more sites recognized by restriction enzymes (restriction sites).

Предпочтительно по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, которая получена из 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, которая состоит из ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, СВХ6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, ТМЕМ33, TUBA4A, ЕМР3, ТМЕМ201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3 5'-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (предпочтительно все человеческие) и Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyoxl1, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (предпочтительно все мышиные).Preferably, at least one 3'-UTR element and/or at least one 5'-UTR element contains or consists of a nucleotide sequence that is derived from the 3'-UTR and/or 5'-UTR of a gene transcript selected from group which consists of ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1 , TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3 5'-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1 , LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN , MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (preferably all human ) and Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22 , Pcyoxl1, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1 , Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra , Aarsd1, Kif22, Cth, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1 , Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (preferably all mouse).

Предпочтительно по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из «функционального фрагмента», «функционального варианта» или «функционального фрагмента варианта» 3'-UTR и/или 5'-UTR транскрипта гена.Preferably, at least one 3'-UTR element and/or at least one 5'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a "functional fragment", "functional variant" or "functional fragment of the variant" 3'-UTR and/or 5'-UTR of the gene transcript.

Предпочтительно по меньшей мере один 5'-UTR-элемент содержит нуклеотидную последовательность, которая получена из 5'-UTR транскрипта гена, выбранного из группы, которая состоит из ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB3 5'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR, (предпочтительно все человеческие) и Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (предпочтительно все мышиные).Preferably, at least one 5'-UTR element contains a nucleotide sequence that is derived from the 5'-UTR of a gene transcript selected from the group consisting of ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5' -UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'- UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR , EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2 -5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB3 5'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5 '-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5' -UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'- UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, RAVER1-5'-UTR, KP NA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1 -5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR, (preferred all human) and Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5' -UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'- UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR , Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph -5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1- 5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5 '-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR , 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (preferably all mouse).

Предпочтительно по меньшей мере один 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, которая получена из 3'-UTR транскрипта гена, выбранного из группы, которая состоит из NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (предпочтительно все человеческие) и Асох2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR (предпочтительно все мышиные).Preferably, at least one 3'-UTR element contains or consists of a nucleotide sequence that is derived from the 3'-UTR of a gene transcript selected from the group consisting of NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO -3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1- 3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3 '-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (preferably all human) and Acox2-3'-UTR , Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole -3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a- 3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3 '-UTR (preferably all mouse).

Предпочтительно также, чтобы искусственная нуклеиновая кислота, предлагаемая в изобретении, содержала и (I) по меньшей мере одну предпочтительную 5'-UTR, и (I) по меньшей мере одну предпочтительную 3'-UTR.It is also preferred that the artificial nucleic acid of the invention contains both (I) at least one preferred 5'-UTR and (I) at least one preferred 3'-UTR.

В наиболее предпочтительном варианте осуществления изобретения по меньшей мере один 5'-UTR-элемент содержит нуклеотидную последовательность, которая получена из 5'-UTR транскрипта гена, выбранного из группы, которая состоит из ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'-UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (все человеческие), Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (все мышиные).In the most preferred embodiment of the invention, at least one 5'-UTR element contains a nucleotide sequence that is derived from the 5'-UTR of a gene transcript selected from the group consisting of ZNF460-5'-UTR, TGM2-5'-UTR , IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'-UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2 -5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN- 5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5 '-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (all human), Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs -5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1- 5'-UTR, Osr1-5'-UTR, Lmnb1 -5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2- 5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5 '-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5' -UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'- UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR , Ms4a8a-5'-UTR (all murine).

Установлено, что такие UTR-элементы способствуют высокой эффективности трансляции.It has been found that such UTR elements contribute to high translation efficiency.

В наиболее предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент содержит нуклеотидную последовательность, которая получена из 3'-UTR транскрипта гена, выбранного из группы, которая состоит из NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (предпочтительно все человеческие) и Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR, (предпочтительно все мышиные). Установлено, что такие UTR-элементы способствуют высокой эффективности трансляции.In the most preferred embodiment of the invention, at least one 3'-UTR element contains a nucleotide sequence that is derived from the 3'-UTR of a gene transcript selected from the group consisting of NDUFS7-3'-UTR, PHGDH-3'-UTR , TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN -3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (preferably all human) and Acox2-3' -UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'- UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR , Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1 -3'-UTR, (preferably all mice). It has been found that such UTR elements contribute to high translation efficiency.

Указанные наиболее предпочтительные варианты осуществления изобретения можно комбинировать таким образом, чтобы искусственная нуклеиновая кислота, предлагаемая в изобретении, содержала и (I) по меньшей мере одну наиболее предпочтительную 5'-UTR, и (I) по меньшей мере одну наиболее предпочтительную 3'-UTR.These most preferred embodiments of the invention can be combined such that the artificial nucleic acid of the invention contains both (I) at least one most preferred 5'-UTR and (I) at least one most preferred 3'-UTR .

Фраза «нуклеотидная последовательность, которая получена из 3'-UTR и/или 5'-UTR транскрипта гена» предпочтительно относится к нуклеотидной последовательности, основой которой является последовательность 3'-UTR гена и/или последовательность 5'-UTR транскрипта гена или его фрагмента или участка, предпочтительно встречающегося в естественных условиях гена или его фрагмента или участка. В этом контексте понятие «встречающийся в естественных условиях» является синонимом понятию «дикий тип». Указанная фраза включает последовательности, соответствующие полной последовательности 3'-UTR и/или полной последовательности 5'-UTR, т.е. полноразмерной последовательности 3'-UTR и/или 5'-UTR транскрипта гена, и последовательности, соответствующие фрагменту последовательности 3'-UTR и/или последовательности 5'-UTR транскрипта гена. Предпочтительно фрагмент 3'-UTR и/или 5'-UTR транскрипта гена состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерной 3'-UTR и/или 5'-UTR транскрипта гена, который включает по меньшей мере 5%, 10%, 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90% полноразмерной 3'-UTR и/или 5'-UTR транскрипта гена. В контексте настоящего изобретения такой фрагмент предпочтительно представляет собой функциональный фрагмент, представленный в настоящем описании. Предпочтительно фрагмент сохраняет функцию регулирования трансляции ОРС, сцепленной с 3'-UTR и/или 5'-UTR или ее фрагментом.The phrase "a nucleotide sequence which is derived from the 3'-UTR and/or 5'-UTR of a gene transcript" preferably refers to a nucleotide sequence which is based on the 3'-UTR sequence of a gene and/or the 5'-UTR sequence of a gene transcript or a fragment thereof. or a region, preferably a naturally occurring gene or fragment or region thereof. In this context, "naturally occurring" is synonymous with "wild type". Said phrase includes sequences corresponding to the full 3'-UTR sequence and/or the full 5'-UTR sequence, i.e. a full-length 3'-UTR and/or 5'-UTR sequence of the gene transcript, and sequences corresponding to a fragment of the 3'-UTR sequence and/or 5'-UTR sequence of the gene transcript. Preferably, the 3'-UTR and/or 5'-UTR fragment of the gene transcript consists of a contiguous nucleotide segment corresponding to the nucleotide contiguous segment of the full-length 3'-UTR and/or 5'-UTR of the gene transcript, which includes at least 5%, 10% , 20%, preferably at least 30%, more preferably at least 40%, more preferably at least 50%, even more preferably at least 60%, still more preferably at least 70%, even more preferably at least at least 80% and most preferably at least 90% of the full length 3'UTR and/or 5'UTR of the gene transcript. In the context of the present invention, such a fragment is preferably a functional fragment presented in the present description. Preferably, the fragment retains the function of regulating translation of the ORF linked to the 3'-UTR and/or 5'-UTR, or a fragment thereof.

Понятия «вариант 3'-UTR и/или вариант 5'-UTR транскрипта гена и «его вариант» в контексте 3'-UTR и/или 5'-UTR транскрипта гена относятся к варианту 3'-UTR и/или 5'-UTR транскрипта встречающегося в естественных условиях гена, предпочтительно к варианту 3'-UTR и/или 5'-UTR транскрипта гена позвоночных, более предпочтительно к варианту 3'-UTR и/или 5'-UTR транскрипта гена млекопитающих, еще более предпочтительно к варианту 3'-UTR и/или 5'-UTR транскрипта гена приматов, прежде всего гена человека, представленного выше. Такой вариант может представлять собой модифицированную 3'-UTR и/или 5'-UTR транскрипта гена. Например, вариант 3'-UTR и/или вариант 5'-UTR может иметь одну или несколько делеций, инсерций, добавлений и/или замен нуклеотидов по сравнению с встречающейся в естественных условиях 3'-UTR и/или 5'-UTR, из которой получен вариант. Предпочтительно вариант 3'-UTR и/или вариант 5'-UTR транскрипта гена по меньшей мере на 40%, предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, более предпочтительно по меньшей мере на 70%, еще более предпочтительно по меньшей мере на 80%, еще более предпочтительно по меньшей мере на 90%, наиболее предпочтительно по меньшей мере на 95% идентичен встречающейся в естественных условиях 3'-UTR и/или 5'-UTR, из которой происходит вариант. Предпочтительно вариант представляет собой функциональный вариант, представленный в настоящем описании, из которой происходит вариант.The terms "3'-UTR variant and/or 5'-UTR variant of the gene transcript and" its variant" in the context of the 3'-UTR and/or 5'-UTR of the gene transcript refer to the 3'-UTR and/or 5'-UTR variant. UTR of a naturally occurring gene transcript, preferably a 3'-UTR and/or 5'-UTR variant of a vertebrate gene transcript, more preferably a 3'-UTR and/or 5'-UTR variant of a mammalian gene transcript, even more preferably a variant The 3'-UTR and/or 5'-UTR of a primate gene transcript, especially the human gene, as described above. Such a variant may be a modified 3'-UTR and/or 5'-UTR of the gene transcript. For example, a 3'-UTR variant and/or a 5'-UTR variant may have one or more deletions, insertions, additions, and/or substitutions of nucleotides compared to a naturally occurring 3'-UTR and/or 5'-UTR, of which the variant is received. Preferably the 3'-UTR variant and/or the 5'-UTR variant of the gene transcript by at least 40%, preferably at least 50%, more preferably at least 60%, more preferably at least 70%, more more preferably at least 80%, even more preferably at least 90%, most preferably at least 95% identical to the naturally occurring 3'-UTR and/or 5'-UTR from which the variant is derived. Preferably, the variant is the functional variant described herein from which the variant is derived.

Фраза «нуклеотидная последовательность, которая получена из варианта 3'-UTR и/или из варианта 5'-UTR транскрипта гена» предпочтительно относится к нуклеотидной последовательности, основой которой является вариант последовательности 3'-UTR и/или 5'-UTR транскрипта гена или его фрагмент или участок, представленный выше. Эта фраза включает последовательности, соответствующие полной последовательности варианта 3'-UTR и/или 5'-UTR транскрипта гена, т.е. полноразмерной последовательности варианта 3'-UTR и/или полноразмерной последовательности варианта 5'-UTR транскрипта гена, и последовательности, соответствующие фрагменту варианта последовательности 3'-UTR и/или фрагменту варианта последовательности 5'-UTR транскрипта гена. Предпочтительно фрагмент варианта 3'-UTR и/или 5'-UTR транскрипта гена состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерного варианта 3'-UTR и/или 5'-UTR транскрипта гена, который включает по меньшей мере 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, и наиболее предпочтительно по меньшей мере 90% полноразмерного варианта 3'-UTR и/или 5'-UTR транскрипта гена. В контексте настоящего изобретения такой фрагмент варианта предпочтительно представляет собой функциональный фрагмент варианта, представленного в настоящем описании.The phrase "a nucleotide sequence that is derived from a 3'-UTR variant and/or a 5'-UTR variant of a gene transcript" preferably refers to a nucleotide sequence based on a 3'-UTR and/or 5'-UTR sequence variant of a gene transcript or its fragment or section presented above. This phrase includes sequences corresponding to the complete sequence of the 3'-UTR variant and/or 5'-UTR of the gene transcript, i.e. the full-length sequence of the 3'-UTR variant and/or the full-length sequence of the 5'-UTR variant of the gene transcript, and sequences corresponding to a fragment of the 3'-UTR sequence variant and/or a fragment of the 5'-UTR sequence variant of the gene transcript. Preferably, the 3'-UTR and/or 5'-UTR variant fragment of the gene transcript consists of a contiguous nucleotide segment corresponding to the nucleotide contiguous segment of the full-length 3'-UTR and/or 5'-UTR variant of the gene transcript, which includes at least 20%, preferably at least 30%, more preferably at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80%, and most preferably at least 90% of the full length variant of the 3'-UTR and/or 5'-UTR of the gene transcript. In the context of the present invention, such a variant fragment is preferably a functional fragment of the variant presented in the present description.

В контексте настоящего описания понятия «функциональный вариант» «функциональный фрагмент» и «функциональный фрагмент варианта» (который обозначают также как «функциональный вариантный фрагмент») означают, что фрагмент 3'-UTR и/или 5'-UTR, вариант 3'-UTR и/или 5'-UTR или фрагмент варианта 3'-UTR и/или 5'-UTR транскрипта гена выполняет по меньшей мере одну, предпочтительно более чем одну функцию встречающейся в естественных условиях 3'-UTR и/или 5'-UTR транскрипта гена, из которой получен вариант, фрагмент или фрагмент варианта. Такая функция может заключаться, например, в стабилизации мРНК и/или увеличении, стабилизации и/или пролонгировании производства белка с мРНК, и/или увеличении экспрессии белка или общего производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Предпочтительно функция 3'-UTR и/или 5'-UTR касается трансляции белка, кодируемого ОРС. Более предпочтительно функция включает повышение эффективности трансляции ОРС, связанной с 3'-UTR и/или 5'-UTR, или ее фрагментом или вариантом. В контексте настоящего изобретения наиболее предпочтительно, чтобы вариант, фрагмент и вариант фрагмента выполнял функцию стабилизации мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR и/или референс-5'-UTR, или в которой отсутствует 3'-UTR и/или 5'-UTR, и/или функцию повышения, стабилизации и/или пролонгирования производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR и/или референс-5'-UTR, или в которой отсутствует 3'-UTR и/или 5'-UTR, и/или функцию увеличения производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR и/или референс-5'-UTR, или в которой отсутствует 3'-UTR и/или 5'-UTR. Референс-3'-UTR и/или референс-5'-UTR может представлять собой, например, 3'-UTR и/или 5'-UTR, встречающуюся в естественных условиях в комбинации с ОРС. Кроме того, функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента 3'-UTR и/или 5'-UTR транскрипта гена предпочтительно не оказывает существенного понижающего действия на эффективность трансляции мРНК, которая содержит такой вариант, фрагмент или вариант фрагмента 3'-UTR и/или 5'-UTR, по сравнению с 3'-UTR дикого типа и/или 5'-UTR дикого типа, из которой получен вариант, фрагмент или вариант фрагмента. В контексте настоящего изобретения наиболее предпочтительная функция «функционального фрагмента», «функционального варианта» или «функционального варианта фрагмента» 3'-UTR и/или 5'-UTR транскрипта гена заключается в увеличении, стабилизации и/или пролонгировании производства белка посредством экспрессии мРНК, несущей функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента, представленный выше.In the context of the present description, the terms "functional variant" "functional fragment" and "functional fragment of the variant" (which is also referred to as "functional variant fragment") mean that the fragment 3'-UTR and/or 5'-UTR, variant 3'- UTR and/or 5'-UTR or a fragment of a 3'-UTR and/or 5'-UTR variant of a gene transcript performs at least one, preferably more than one, function of a naturally occurring 3'-UTR and/or 5'-UTR the gene transcript from which the variant, fragment, or fragment of the variant is derived. Such a function may be, for example, to stabilize the mRNA and/or increase, stabilize and/or prolong protein production from mRNA and/or increase protein expression or total protein production from mRNA, preferably in a mammalian cell such as a human cell. Preferably, the function of the 3'-UTR and/or 5'-UTR is to translate the protein encoded by the ORF. More preferably, the function includes increasing the efficiency of translation of the ORF associated with the 3'-UTR and/or 5'-UTR, or a fragment or variant thereof. In the context of the present invention, it is most preferred that the variant, fragment and fragment variant have the function of stabilizing the mRNA, preferably in a mammalian cell such as a human cell, compared to an mRNA that contains a reference-3'-UTR and/or a reference-5'- UTR, or lacking a 3'-UTR and/or 5'-UTR, and/or the function of increasing, stabilizing and/or prolonging protein production with an mRNA, preferably in a mammalian cell such as a human cell, compared to an mRNA that contains a reference 3'-UTR and/or a reference-5'-UTR, or which lacks a 3'-UTR and/or a 5'-UTR, and/or has the function of increasing protein production from mRNA, preferably in a mammalian cell, such as a human cell, compared to an mRNA that contains a reference 3'-UTR and/or a reference 5'-UTR, or lacks a 3'-UTR and/or a 5'-UTR. The reference 3'-UTR and/or the reference-5'-UTR may be, for example, a 3'-UTR and/or a 5'-UTR occurring naturally in combination with an ORF. In addition, the functional variant, functional fragment or functional variant of the 3'-UTR fragment and/or 5'-UTR of the gene transcript preferably does not significantly reduce the efficiency of translation of the mRNA that contains such a variant, fragment or variant of the 3'-UTR fragment and /or 5'-UTR, compared with the wild-type 3'-UTR and/or wild-type 5'-UTR from which the variant, fragment or fragment variant is derived. In the context of the present invention, the most preferred function of a "functional fragment", "functional variant" or "functional fragment variant" of the 3'-UTR and/or 5'-UTR of a gene transcript is to increase, stabilize and/or prolong the production of a protein through the expression of mRNA, carrying the functional variant, the functional fragment or the functional variant of the fragment presented above.

Предпочтительно эффективность одной или нескольких функций, осуществляемых функциональным вариантом, функциональным фрагментом или функциональным вариантом фрагмента, такую как обеспечение эффективности трансляции, повышают по меньшей мере на 5%, более предпочтительно по меньшей мере на 10%, более предпочтительно по меньшей мере на 20%, более предпочтительно по меньшей мере на 30%, более предпочтительно по меньшей мере на 40%, более предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере на 90% по сравнению с эффективностью трансляции, обеспечиваемой встречающейся в естественных условиях 3'-UTR и/или 5'-UTR транскрипта гена, из которого получен вариант, фрагмент или вариант фрагмента.Preferably, the efficiency of one or more functions performed by the functional variant, functional fragment, or functional fragment variant, such as providing translation efficiency, is increased by at least 5%, more preferably at least 10%, more preferably at least 20%, more preferably at least 30%, more preferably at least 40%, more preferably at least 50%, more preferably at least 60%, even more preferably at least 70%, even more preferably at least at least 80%, most preferably at least 90% of the translation efficiency provided by the naturally occurring 3'-UTR and/or 5'-UTR of the gene transcript from which the variant, fragment or fragment variant is derived.

В контексте настоящего изобретения фрагмент 3'-UTR и/или 5'-UTR транскрипта гена или вариант 3'-UTR и/или 5'-UTR транскрипта гена предпочтительно имеет длину по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Предпочтительно такой фрагмент 3'-UTR и/или 5'-UTR транскрипта гена или вариант 3'-UTR и/или 5'-UTR транскрипта гена представляет собой функциональный фрагмент, описанный выше. В предпочтительном варианте осуществления изобретения 3'-UTR и/или 5'-UTR транскрипта гена или его фрагмент или вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов. Как правило, 3'-UTR-элемент и/или 5'-UTR-элемент отличается тем, что содержит менее чем 500, 400, 300, 200, 150 или менее чем 100 нуклеотидов.In the context of the present invention, a fragment of the 3'-UTR and/or 5'-UTR of a gene transcript or a variant of the 3'-UTR and/or 5'-UTR of a gene transcript is preferably at least about 3 nucleotides in length, preferably at least about 5 nucleotides , more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. Preferably, such a 3'-UTR and/or 5'-UTR fragment of a gene transcript, or a 3'-UTR and/or 5'-UTR variant of a gene transcript, is a functional fragment as described above. In a preferred embodiment, the 3'-UTR and/or 5'-UTR of the gene transcript, or fragment or variant thereof, is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides. Typically, a 3'UTR element and/or a 5'UTR element is characterized by being less than 500, 400, 300, 200, 150, or less than 100 nucleotides.

5'-UTR-элементы5'-UTR elements

Предпочтительно по меньшей мере один 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, выбранной из группы, которая состоит из SEQ ID NO: 1-151, или соответствующей последовательности РНК соответственно, или по меньшей мере один 5'-UTR-элемент содержит или состоит из фрагмента нуклеотидной последовательности, который идентичен по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, выбранной из группы, которая состоит из SEQ ID NO: 1-151, или соответствующей последовательности РНК соответственно.Preferably, at least one 5'-UTR element contains or consists of a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30, or 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of a nucleotide sequence selected from the group consisting of SEQ ID NOs: 1-151, or the corresponding RNA sequence, respectively, or at least one 5'-UTR element contains or consists of a fragment of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence, selected from the group consisting of SEQ ID NO: 1-151, or the corresponding RNA sequence, respectively.

Среди последовательностей, подробно описанных ниже, SEQ ID NO: 1-136 можно рассматривать как последовательности 5'-UTR дикого типа, a SEQ ID NO: 136-151 можно рассматривать как искусственные последовательности 5'-UTR.Among the sequences detailed below, SEQ ID NOs: 1-136 can be considered as wild-type 5'-UTR sequences, and SEQ ID NOs: 136-151 can be considered as artificial 5'-UTR sequences.

SEQ ID NO: 1 - 5'-UTR ZNF460 Homo sapiensSEQ ID NO: 1 - 5'-UTR ZNF460 Homo sapiens

NM_006635.3NM_006635.3

Figure 00000004
Figure 00000004

SEQ ID NO: 2 - 5'-UTR TGM2 Homo sapiensSEQ ID NO: 2 - 5'-UTR TGM2 Homo sapiens

NM_004613.2NM_004613.2

Figure 00000005
Figure 00000005

SEQ ID NO: 3 - 5'-UTR IL7R Homo sapiensSEQ ID NO: 3-5'-UTR IL7R Homo sapiens

NM_002185.3NM_002185.3

Figure 00000006
Figure 00000006

SEQ ID NO: 4 - 5'-UTR BGN Homo sapiensSEQ ID NO: 4-5'-UTR BGN Homo sapiens

NM_001711.4NM_001711.4

Figure 00000007
Figure 00000007

SEQ ID NO: 5 - 5'-UTR TK1 Homo sapiensSEQ ID NO: 5 - 5'-UTR TK1 Homo sapiens

NM_003258.4NM_003258.4

Figure 00000008
Figure 00000008

SEQ ID NO: 6 - 5'-UTR RAB3B Homo sapiensSEQ ID NO: 6-5'-UTR RAB3B Homo sapiens

NM_002867.3

Figure 00000009
NM_002867.3
Figure 00000009

SEQ ID NO: 7 - 5'-UTR CBX6 Homo sapiensSEQ ID NO: 7-5'-UTR CBX6 Homo sapiens

NM_014292.3NM_014292.3

Figure 00000010
Figure 00000010

SEQ ID NO: 8 - 5'-UTR FZD2 Homo sapiensSEQ ID NO: 8-5'-UTR FZD2 Homo sapiens

NM_001466.3NM_001466.3

Figure 00000011
Figure 00000011

SEQ ID NO: 9 - 5'-UTR COL8A1 Homo sapiensSEQ ID NO: 9-5'-UTR COL8A1 Homo sapiens

NM_001850.4NM_001850.4

Figure 00000012
Figure 00000012

SEQ ID NO: 10 - 5'-UTR NDUFS7 Homo sapiensSEQ ID NO: 10-5'-UTR NDUFS7 Homo sapiens

NM_024407.4NM_024407.4

Figure 00000013
Figure 00000013

SEQ ID NO: 11 - 5'-UTR PHGDH Homo sapiensSEQ ID NO: 11 - 5'-UTR PHGDH Homo sapiens

NM_006623.3

Figure 00000014
NM_006623.3
Figure 00000014

Figure 00000015
Figure 00000015

SEQ ID NO: 12 - 5'-UTR PLK2 Homo sapiensSEQ ID NO: 12 - 5'-UTR PLK2 Homo sapiens

NM_006622.3NM_006622.3

Figure 00000016
Figure 00000016

SEQ ID NO: 13 - 5'-UTR TSPO Homo sapiensSEQ ID NO: 13 - 5'-UTR TSPO Homo sapiens

NM_000714.5NM_000714.5

Figure 00000017
Figure 00000017

SEQ ID NO: 14 - 5'-UTR PTGS1 Homo sapiensSEQ ID NO: 14 - 5'-UTR PTGS1 Homo sapiens

NM_000962.3NM_000962.3

Figure 00000018
Figure 00000018

SEQ ID NO: 15 - 5'-UTR FBXO32 Homo sapiensSEQ ID NO: 15-5'-UTR FBXO32 Homo sapiens

NM_058229.3NM_058229.3

Figure 00000019
Figure 00000019

SEQ ID NO: 16 - 5'-UTR NID2 Homo sapiensSEQ ID NO: 16-5'-UTR NID2 Homo sapiens

NM_007361.3

Figure 00000020
NM_007361.3
Figure 00000020

Figure 00000021
Figure 00000021

SEQ ID NO: 17 - 5'-UTR ATP5D Homo sapiensSEQ ID NO: 17 - 5'-UTR ATP5D Homo sapiens

NM_001687.4NM_001687.4

Figure 00000022
Figure 00000022

SEQ ID NO: 18 - 5'-UTR EXOSC4 Homo sapiensSEQ ID NO: 18-5'-UTR EXOSC4 Homo sapiens

NM_019037.2NM_019037.2

Figure 00000023
Figure 00000023

SEQ ID NO: 19 - 5'-UTR NOL9 Homo sapiensSEQ ID NO: 19-5'-UTR NOL9 Homo sapiens

NM_024654.4NM_024654.4

Figure 00000024
Figure 00000024

SEQ ID NO: 20 - 5'-UTR TUBB4B Homo sapiensSEQ ID NO: 20 - 5'-UTR TUBB4B Homo sapiens

NM_006088.5NM_006088.5

Figure 00000025
Figure 00000025

SEQ ID NO: 21 - 5'-UTR VPS18 Homo sapiensSEQ ID NO: 21 - 5'-UTR VPS18 Homo sapiens

NM_020857.2

Figure 00000026
NM_020857.2
Figure 00000026

Figure 00000027
Figure 00000027

SEQ ID NO: 22 - 5'-UTR ORMDL2 Homo sapiensSEQ ID NO: 22 - 5'-UTR ORMDL2 Homo sapiens

NM_014182NM_014182

Figure 00000028
Figure 00000028

SEQ ID NO: 23 - 5'-UTR FSCN1 Homo sapiensSEQ ID NO: 23 - 5'-UTR FSCN1 Homo sapiens

NM_003088.3NM_003088.3

Figure 00000029
Figure 00000029

SEQ ID NO: 24 - 5'-UTR TMEM33 Homo sapiensSEQ ID NO: 24-5'-UTR TMEM33 Homo sapiens

NM_018126.2NM_018126.2

Figure 00000030
Figure 00000030

SEQ ID NO: 25 - 5'-UTR TUBA4A Homo sapiensSEQ ID NO: 25 - 5'-UTR TUBA4A Homo sapiens

NM_006000.2NM_006000.2

Figure 00000031
Figure 00000031

SEQ ID NO: 26 - 5'-UTR EMP3 Homo sapiensSEQ ID NO: 26 - 5'-UTR EMP3 Homo sapiens

NM_001425.2

Figure 00000032
NM_001425.2
Figure 00000032

Figure 00000033
Figure 00000033

SEQ ID NO: 27 - 5'-UTR TMEM201 Homo sapiensSEQ ID NO: 27 - 5'-UTR TMEM201 Homo sapiens

NM_001010866.3NM_001010866.3

Figure 00000034
Figure 00000034

SEQ ID NO: 28 - 5'-UTR CRIP2 Homo sapiensSEQ ID NO: 28 - 5'-UTR CRIP2 Homo sapiens

NM_001312.3NM_001312.3

Figure 00000035
Figure 00000035

SEQ ID NO: 29 - 5'-UTR BRAT1 Homo sapiensSEQ ID NO: 29 - 5'-UTR BRAT1 Homo sapiens

NM_152743.3NM_152743.3

Figure 00000036
Figure 00000036

SEQ ID NO: 30 - 5'-UTR SERPINH1 Homo sapiensSEQ ID NO: 30 - 5'-UTR SERPINH1 Homo sapiens

NM_001235.3

Figure 00000037
NM_001235.3
Figure 00000037

SEQ ID NO: 31 - 5'-UTR CD9 Homo sapiensSEQ ID NO: 31 - 5'-UTR CD9 Homo sapiens

NM_001769.3NM_001769.3

Figure 00000038
Figure 00000038

SEQ ID NO: 32 - 5'-UTR DPYSL2 Homo sapiensSEQ ID NO: 32 - 5'-UTR DPYSL2 Homo sapiens

NM_001386.5NM_001386.5

Figure 00000039
Figure 00000039

SEQ ID NO: 33 - 5'-UTR CDK9 Homo sapiensSEQ ID NO: 33-5'-UTR CDK9 Homo sapiens

NM_001261.3NM_001261.3

Figure 00000040
Figure 00000040

SEQ ID NO: 34 - 5'-UTR SSSCA1 Homo sapiensSEQ ID NO: 34 - 5'-UTR SSSCA1 Homo sapiens

NM_006396.1NM_006396.1

Figure 00000041
Figure 00000041

SEQ ID NO: 35 - 5'-UTR POLR2L Homo sapiensSEQ ID NO: 35-5'-UTR POLR2L Homo sapiens

NM_021128.4NM_021128.4

Figure 00000042
Figure 00000042

SEQ ID NO: 36 - 5'-UTR LIN7C Homo sapiensSEQ ID NO: 36 - 5'-UTR LIN7C Homo sapiens

NM_018362NM_018362

Figure 00000043
Figure 00000043

SEQ ID NO: 37 - 5'-UTR UQCR10 Homo sapiensSEQ ID NO: 37 - 5'-UTR UQCR10 Homo sapiens

NM_001003684.1NM_001003684.1

Figure 00000044
Figure 00000044

SEQ ID NO: 38 - 5'-UTR TFRC Homo sapiensSEQ ID NO: 38 - 5'-UTR TFRC Homo sapiens

NM_001128148.1NM_001128148.1

Figure 00000045
Figure 00000045

SEQ ID NO: 39 - 5'-UTR PSMB3 Homo sapiensSEQ ID NO: 39 - 5'-UTR PSMB3 Homo sapiens

NM_002795.2NM_002795.2

Figure 00000046
Figure 00000046

SEQ ID NO: 40 - 5'-UTR FASN Homo sapiensSEQ ID NO: 40 - 5'-UTR FASN Homo sapiens

NM_004104.4NM_004104.4

Figure 00000047
Figure 00000047

SEQ ID NO: 41 - 5'-UTR PSMB6 Homo sapiensSEQ ID NO: 41 - 5'-UTR PSMB6 Homo sapiens

NM_002798.2NM_002798.2

Figure 00000048
Figure 00000048

SEQ ID NO: 42 - 5'-UTR PYCRL Homo sapiensSEQ ID NO: 42 - 5'-UTR PYCRL Homo sapiens

NM_023078.3NM_023078.3

Figure 00000049
Figure 00000049

SEQ ID NO: 43 - 5'-UTR PRSS56 Homo sapiensSEQ ID NO: 43 - 5'-UTR PRSS56 Homo sapiens

NM_001195129.1NM_001195129.1

Figure 00000050
Figure 00000050

SEQ ID NO: 44 - 5'-UTR KPNA6 Homo sapiensSEQ ID NO: 44 - 5'-UTR KPNA6 Homo sapiens

NM_012316.4NM_012316.4

Figure 00000051
Figure 00000051

SEQ ID NO: 45 - 5'-UTR SFT2D2 Homo sapiensSEQ ID NO: 45 - 5'-UTR SFT2D2 Homo sapiens

NM_199344.2NM_199344.2

Figure 00000052
Figure 00000052

SEQ ID NO: 46 - 5'-UTR PARD6B Homo sapiensSEQ ID NO: 46 - 5'-UTR PARD6B Homo sapiens

NM_032521.2NM_032521.2

Figure 00000053
Figure 00000053

SEQ ID NO: 47 - 5'-UTR LPP Homo sapiensSEQ ID NO: 47 - 5'-UTR LPP Homo sapiens

Figure 00000054
Figure 00000054

SEQ ID NO: 48 - 5'-UTR SPARC Homo sapiensSEQ ID NO: 48 - 5'-UTR SPARC Homo sapiens

NM_003118.3NM_003118.3

Figure 00000055
Figure 00000055

SEQ ID NO: 49 - 5'-UTR SCAND1 Homo sapiensSEQ ID NO: 49 - 5'-UTR SCAND1 Homo sapiens

Figure 00000056
Figure 00000056

SEQ ID NO: 50 - 5'-UTR VASN Homo sapiensSEQ ID NO: 50 - 5'-UTR VASN Homo sapiens

NM_138440.2NM_138440.2

Figure 00000057
Figure 00000057

SEQ ID NO: 51 - 5'-UTR SLC26A1 Homo sapiensSEQ ID NO: 51 - 5'-UTR SLC26A1 Homo sapiens

NM_022042.3NM_022042.3

Figure 00000058
Figure 00000058

SEQ ID NO: 52 - 5'-UTR LCLAT1 Homo sapiensSEQ ID NO: 52 - 5'-UTR LCLAT1 Homo sapiens

NM_182551.3

Figure 00000059
NM_182551.3
Figure 00000059

Figure 00000060
Figure 00000060

SEQ ID NO: 53 - 5'-UTR FBXL18 Homo sapiensSEQ ID NO: 53 - 5'-UTR FBXL18 Homo sapiens

NM_024963.4NM_024963.4

Figure 00000061
Figure 00000061

SEQ ID NO: 54 - 5'-UTR SLC35F6 Homo sapiensSEQ ID NO: 54 - 5'-UTR SLC35F6 Homo sapiens

NM_017877.3NM_017877.3

Figure 00000062
Figure 00000062

SEQ ID NO: 55 - 5'-UTR RAB3D Homo sapiensSEQ ID NO: 55 - 5'-UTR RAB3D Homo sapiens

NM_004283.3NM_004283.3

Figure 00000063
Figure 00000063

SEQ ID NO: 56 - 5'-UTR MAP1B Homo sapiensSEQ ID NO: 56 - 5'-UTR MAP1B Homo sapiens

NM_005909.3NM_005909.3

Figure 00000064
Figure 00000064

SEQ ID NO: 57 - 5'-UTR VMA21 Homo sapiensSEQ ID NO: 57 - 5'-UTR VMA21 Homo sapiens

NM_001017980.3NM_001017980.3

Figure 00000065
Figure 00000065

SEQ ID NO: 58 - 5'-UTR AMN Homo sapiensSEQ ID NO: 58 - 5'-UTR AMN Homo sapiens

NM_030943.3NM_030943.3

Figure 00000066
Figure 00000066

SEQ ID NO: 59 - 5'-UTR CYBA Homo sapiensSEQ ID NO: 59 - 5'-UTR CYBA Homo sapiens

NM_000101.3NM_000101.3

Figure 00000067
Figure 00000067

SEQ ID NO: 60 - 5'-UTR SEZ6L2 Homo sapiensSEQ ID NO: 60 - 5'-UTR SEZ6L2 Homo sapiens

NM_012410.3NM_012410.3

Figure 00000068
Figure 00000068

SEQ ID NO: 61 - 5'-UTR PCOLCE Homo sapiensSEQ ID NO: 61 - 5'-UTR PCOLCE Homo sapiens

NM_002593.3NM_002593.3

Figure 00000069
Figure 00000069

SEQ ID NO: 62 - 5'-UTR MAP1S Homo sapiensSEQ ID NO: 62 - 5'-UTR MAP1S Homo sapiens

NM_018174.4NM_018174.4

Figure 00000070
Figure 00000070

SEQ ID NO: 63 - 5'-UTR VTN Homo sapiensSEQ ID NO: 63 - 5'-UTR VTN Homo sapiens

NM_000638.3NM_000638.3

Figure 00000071
Figure 00000071

SEQ ID NO: 64 - 5'-UTR ALDH16A1 Homo sapiensSEQ ID NO: 64 - 5'-UTR ALDH16A1 Homo sapiens

NM_001145396.1NM_001145396.1

Figure 00000072
Figure 00000072

SEQ ID NO: 65 - 5'-UTR RAVER1 Homo sapiensSEQ ID NO: 65 - 5'-UTR RAVER1 Homo sapiens

NM_133452.2NM_133452.2

Figure 00000073
Figure 00000073

SEQ ID NO: 66 - 5'-UTR KPNA6 Homo sapiens (идентична SEQ ID NO: 44)SEQ ID NO: 66 - 5'-UTR KPNA6 Homo sapiens (identical to SEQ ID NO: 44)

NM_012316.4NM_012316.4

Figure 00000074
Figure 00000074

SEQ ID NO: 67 - 5'-UTR SERINC5 Homo sapiensSEQ ID NO: 67 - 5'-UTR SERINC5 Homo sapiens

NM_178276.5NM_178276.5

Figure 00000075
Figure 00000075

SEQ ID NO: 68 - 5'-UTR JUP Homo sapiensSEQ ID NO: 68 - 5'-UTR JUP Homo sapiens

NM_002230.2

Figure 00000076
NM_002230.2
Figure 00000076

SEQ ID NO: 69 - 5'-UTR CPN2 Homo sapiensSEQ ID NO: 69 - 5'-UTR CPN2 Homo sapiens

NM_001080513.2NM_001080513.2

Figure 00000077
Figure 00000077

SEQ ID NO: 70 - 5'-UTR CRIP2 Homo sapiensSEQ ID NO: 70 - 5'-UTR CRIP2 Homo sapiens

NM_001312.3NM_001312.3

Figure 00000078
Figure 00000078

SEQ ID NO: 71 - 5'-UTR EPT1 Homo sapiensSEQ ID NO: 71 - 5'-UTR EPT1 Homo sapiens

NM_033505.2NM_033505.2

Figure 00000079
Figure 00000079

SEQ ID NO: 72 - 5'-UTR PNPO Homo sapiensSEQ ID NO: 72 - 5'-UTR PNPO Homo sapiens

NM_018129.3NM_018129.3

Figure 00000080
Figure 00000080

SEQ ID NO: 73 - 5'-UTR Dpysl2 Mus musculusSEQ ID NO: 73 - 5'-UTR Dpysl2 Mus musculus

NM_009955.3NM_009955.3

Figure 00000081
Figure 00000081

SEQ ID NO: 74 - 5'-UTR Ccnd1 Mus musculusSEQ ID NO: 74 - 5'-UTR Ccnd1 Mus musculus

NM_007631.2NM_007631.2

Figure 00000082
Figure 00000082

SEQ ID NO: 75 - 5'-UTR Acox2 Mus musculusSEQ ID NO: 75 - 5'-UTR Acox2 Mus musculus

NM_001161667.1NM_001161667.1

Figure 00000083
Figure 00000083

SEQ ID NO: 76 - 5'-UTR Cbx6 (Npcd) Mus musculusSEQ ID NO: 76 - 5'-UTR Cbx6 (Npcd) Mus musculus

NM_001013360.2NM_001013360.2

Figure 00000084
Figure 00000084

SEQ ID NO: 77 - 5'-UTR Ubc Mus musculusSEQ ID NO: 77 - 5'-UTR Ubc Mus musculus

Figure 00000085
Figure 00000085

SEQ ID NO: 78 - 5'-UTR Ldlr Mus musculusSEQ ID NO: 78 - 5'-UTR Ldlr Mus musculus

NM_001252659.1NM_001252659.1

Figure 00000086
Figure 00000086

SEQ ID NO: 79 - 5'UTR Nudt22 Mus musculusSEQ ID NO: 79 - 5'UTR Nudt22 Mus musculus

Figure 00000087
Figure 00000087

SEQ ID NO: 80 - 5'-UTR Pcyox11 Mus musculusSEQ ID NO: 80 - 5'-UTR Pcyox11 Mus musculus

NM_172832.4NM_172832.4

Figure 00000088
Figure 00000088

SEQ ID NO: 81 - 5'-UTR Ankrdl Mus musculusSEQ ID NO: 81 - 5'-UTR Ankrdl Mus musculus

NM_013468.3NM_013468.3

Figure 00000089
Figure 00000089

SEQ ID NO: 82 - 5'-UTR Tmem37 Mus musculusSEQ ID NO: 82 - 5'-UTR Tmem37 Mus musculus

NM_019432.2NM_019432.2

Figure 00000090
Figure 00000090

SEQ ID NO: 83 - 5'-UTR Tspyl4 Mus musculusSEQ ID NO: 83 - 5'-UTR Tspyl4 Mus musculus

NM_030203.2NM_030203.2

Figure 00000091
Figure 00000091

SEQ ID NO: 84 - 5'-UTR Slc7a3 Mus musculusSEQ ID NO: 84 - 5'-UTR Slc7a3 Mus musculus

Figure 00000092
Figure 00000092

SEQ ID NO: 85 - 5'-UTR Cst6 Mus musculusSEQ ID NO: 85 - 5'-UTR Cst6 Mus musculus

Figure 00000093
Figure 00000093

SEQ ID NO: 86 - 5'-UTR Aacs Mus musculusSEQ ID NO: 86 - 5'-UTR Aacs Mus musculus

NM_030210.1NM_030210.1

Figure 00000094
Figure 00000094

SEQ ID NO: 87 - 5'-UTR Nosip Mus musculusSEQ ID NO: 87 - 5'-UTR Nosip Mus musculus

NM_001163684.1NM_001163684.1

Figure 00000095
Figure 00000095

SEQ ID NO: 88 - 5'-UTR Itga7 Mus musculusSEQ ID NO: 88 - 5'UTR Itga7 Mus musculus

NM_008398.2NM_008398.2

Figure 00000096
Figure 00000096

SEQ ID NO: 89 - 5'-UTR Ccnd2 Mus musculusSEQ ID NO: 89 - 5'-UTR Ccnd2 Mus musculus

NM_009829.3NM_009829.3

Figure 00000097
Figure 00000097

SEQ ID NO: 90 - 5'-UTR Ebp Mus musculusSEQ ID NO: 90 - 5'-UTR Ebp Mus musculus

Figure 00000098
Figure 00000098

SEQ ID NO: 91 - 5'-UTR Sf3b5 Mus musculusSEQ ID NO: 91 - 5'-UTR Sf3b5 Mus musculus

NM_009829.3NM_009829.3

Figure 00000099
Figure 00000099

SEQ ID NO: 92 - 5'-UTR Fasn Mus musculusSEQ ID NO: 92 - 5'-UTR Fasn Mus musculus

Figure 00000100
Figure 00000100

SEQ ID NO: 93 - 5'-UTR Hmgcs1 Mus musculusSEQ ID NO: 93 - 5'-UTR Hmgcs1 Mus musculus

Figure 00000101
Figure 00000101

SEQ ID NO: 94 - 5'-UTR Osr1 Mus musculusSEQ ID NO: 94 - 5'-UTR Osr1 Mus musculus

NM_011859.3NM_011859.3

Figure 00000102
Figure 00000102

SEQ ID NO: 95 - 5'-UTR Lmnb1 Mus musculusSEQ ID NO: 95 - 5'-UTR Lmnb1 Mus musculus

NM_011121.3NM_011121.3

Figure 00000103
Figure 00000103

SEQ ID NO: 96 - 5'-UTR Aarsd1 Mus musculusSEQ ID NO: 96 - 5'-UTR Aarsd1 Mus musculus

NM_144829.1NM_144829.1

Figure 00000104
Figure 00000104

SEQ ID NO: 97 - 5'-UTR Vma21 Mus musculusSEQ ID NO: 97 - 5'-UTR Vma21 Mus musculus

NM_001081356.2NM_001081356.2

Figure 00000105
Figure 00000105

SEQ ID NO: 98 - 5'-UTR Kif20a Mus musculusSEQ ID NO: 98 - 5'-UTR Kif20a Mus musculus

Figure 00000106
Figure 00000106

SEQ ID NO: 99 - 5'-UTR Cdca8 Mus musculusSEQ ID NO: 99 - 5'-UTR Cdca8 Mus musculus

NM_026560.4NM_026560.4

Figure 00000107
Figure 00000107

SEQ ID NO: 100 - 5'-UTR Slc7a1 Mus musculusSEQ ID NO: 100 - 5'-UTR Slc7a1 Mus musculus

NM_007513.4

Figure 00000108
NM_007513.4
Figure 00000108

SEQ ID NO: 101 - 5'-UTR Ubqln2 Mus musculusSEQ ID NO: 101 - 5'-UTR Ubqln2 Mus musculus

NM_018798.2NM_018798.2

Figure 00000109
Figure 00000109

SEQ ID NO: 102 - 5'-UTR Prps2 Mus musculusSEQ ID NO: 102 - 5'-UTR Prps2 Mus musculus

NM_026662.4NM_026662.4

Figure 00000110
Figure 00000110

SEQ ID NO: 103 - 5'-UTR Shmt2 Mus musculusSEQ ID NO: 103 - 5'-UTR Shmt2 Mus musculus

NM_026662.4NM_026662.4

Figure 00000111
Figure 00000111

SEQ ID NO: 104 - 5'-UTR Kif22 Mus musculusSEQ ID NO: 104 - 5'-UTR Kif22 Mus musculus

NM_145588.1NM_145588.1

Figure 00000112
Figure 00000112

SEQ ID NO: 105 - 5'-UTR Aurkb Mus musculusSEQ ID NO: 105 - 5'-UTR Aurkb Mus musculus

NM_011496.1

Figure 00000113
NM_011496.1
Figure 00000113

SEQ ID NO: 106 - 5'-UTR Fign11 Mus musculusSEQ ID NO: 106 - 5'-UTR Fign11 Mus musculus

Figure 00000114
Figure 00000114

SEQ ID NO: 107 - 5'-UTR Cad Mus musculusSEQ ID NO: 107 - 5'-UTR Cad Mus musculus

NM_023525.2NM_023525.2

Figure 00000115
Figure 00000115

SEQ ID NO: 108 - 5'-UTR Anln Mus musculusSEQ ID NO: 108 - 5'-UTR Anln Mus musculus

NM_028390.3NM_028390.3

Figure 00000116
Figure 00000116

SEQ ID NO: 109 - 5'-UTR Slfn9 Mus musculusSEQ ID NO: 109 - 5'-UTR Slfn9 Mus musculus

Figure 00000117
Figure 00000117

SEQ ID NO: 110 - 5'-UTR Ncaph Mus musculusSEQ ID NO: 110 - 5'-UTR Ncaph Mus musculus

NM_144818.3

Figure 00000118
NM_144818.3
Figure 00000118

SEQ ID NO: 111 - 5'-UTR Cth Mus musculusSEQ ID NO: 111 - 5'-UTR Cth Mus musculus

NM_145953.2NM_145953.2

Figure 00000119
Figure 00000119

SEQ ID NO: 112 - 5'-UTR Pole Mus musculusSEQ ID NO: 112 - 5'-UTR Pole Mus musculus

NM_011132.2NM_011132.2

Figure 00000120
Figure 00000120

SEQ ID NO: 113 - 5'-UTR Uhrf1 Mus musculusSEQ ID NO: 113 - 5'-UTR Uhrf1 Mus musculus

NM_001111079.1NM_001111079.1

Figure 00000121
Figure 00000121

SEQ ID NO: 114 - 5'-UTR Gja1 Mus musculusSEQ ID NO: 114 - 5'-UTR Gja1 Mus musculus

NM_010288.3NM_010288.3

Figure 00000122
Figure 00000122

SEQ ID NO: 115 - 5'-UTR Fam64a Mus musculusSEQ ID NO: 115 - 5'-UTR Fam64a Mus musculus

Figure 00000123
Figure 00000123

SEQ ID NO: 116 - 5'-UTR Kif2c Mus musculusSEQ ID NO: 116 - 5'-UTR Kif2c Mus musculus

NM_134471.4NM_134471.4

Figure 00000124
Figure 00000124

SEQ ID NO: 117 - 5'-UTR Tspan10 Mus musculusSEQ ID NO: 117 - 5'-UTR Tspan10 Mus musculus

NM_145363.2NM_145363.2

Figure 00000125
Figure 00000125

SEQ ID NO: 118 - 5'-UTR Scand1 Mus musculusSEQ ID NO: 118 - 5'-UTR Scand1 Mus musculus

Figure 00000126
Figure 00000126

SEQ ID NO: 119 - 5'-UTR Gpr84 Mus musculusSEQ ID NO: 119 - 5'-UTR Gpr84 Mus musculus

NM_030720.1NM_030720.1

Figure 00000127
Figure 00000127

SEQ ID NO: 120 - 5'-UTR Tpgs1 Mus musculusSEQ ID NO: 120 - 5'-UTR Tpgs1 Mus musculus

BC138516.1BC138516.1

Figure 00000128
Figure 00000128

SEQ ID NO: 121 - 5'-UTR Ccl17 Mus musculusSEQ ID NO: 121 - 5'-UTR Ccl17 Mus musculus

NM_011332.3NM_011332.3

Figure 00000129
Figure 00000129

SEQ ID NO: 122 - 5'-UTR Fads3 Mus musculusSEQ ID NO: 122 - 5'-UTR Fads3 Mus musculus

NM_021890.3

Figure 00000130
NM_021890.3
Figure 00000130

Figure 00000131
Figure 00000131

SEQ ID NO: 123 - 5'-UTR Cers6 Mus musculusSEQ ID NO: 123 - 5'-UTR Cers6 Mus musculus

NM_172856.3NM_172856.3

Figure 00000132
Figure 00000132

SEQ ID NO: 124 - 5'-UTR Alkbh7 Mus musculusSEQ ID NO: 124 - 5'-UTR Alkbh7 Mus musculus

NM_027372.1NM_027372.1

Figure 00000133
Figure 00000133

SEQ ID NO: 125 - 5'-UTR Ms4a8a Mus musculusSEQ ID NO: 125 - 5'-UTR Ms4a8a Mus musculus

Figure 00000134
Figure 00000134

SEQ ID NO: 126 - 5'-UTR Cxcr4 Mus musculusSEQ ID NO: 126 - 5'-UTR Cxcr4 Mus musculus

NM_009911.3NM_009911.3

Figure 00000135
Figure 00000135

SEQ ID NO: 127 - 5'-UTR Gprc5c Mus musculusSEQ ID NO: 127 - 5'-UTR Gprc5c Mus musculus

Figure 00000136
Figure 00000136

SEQ ID NO: 128 - 5'-UTR Fen1 Mus musculusSEQ ID NO: 128 - 5'-UTR Fen1 Mus musculus

NM_007999.4

Figure 00000137
NM_007999.4
Figure 00000137

SEQ ID NO: 129 - 5'-UTR Cspg4 Mus musculusSEQ ID NO: 129 - 5'-UTR Cspg4 Mus musculus

NM_139001.2NM_139001.2

Figure 00000138
Figure 00000138

SEQ ID NO: 130 - 5'-UTR Mrpl34 Mus musculusSEQ ID NO: 130 - 5'-UTR Mrpl34 Mus musculus

NM_053162.2NM_053162.2

Figure 00000139
Figure 00000139

SEQ ID NO: 131 - 5'-UTR Comtd1 Mus musculusSEQ ID NO: 131 - 5'-UTR Comtd1 Mus musculus

Figure 00000140
Figure 00000140

SEQ ID NO: 132 - 5'-UTR Armc6 Mus musculusSEQ ID NO: 132 - 5'-UTR Armc6 Mus musculus

NM_133972.2NM_133972.2

Figure 00000141
Figure 00000141

SEQ ID NO: 133 - 5'-UTR Emr4 Mus musculusSEQ ID NO: 133 - 5'-UTR Emr4 Mus musculus

NM_139138.3NM_139138.3

Figure 00000142
Figure 00000142

SEQ ID NO: 134 - 5'-UTR Atp5d Mus musculusSEQ ID NO: 134 - 5'-UTR Atp5d Mus musculus

NM_025313.2NM_025313.2

Figure 00000143
Figure 00000143

SEQ ID NO: 135 - 5'-UTR 1110001J03Rik Mus musculusSEQ ID NO: 135-5'-UTR 1110001J03 Rik Mus musculus

Figure 00000144
Figure 00000144

SEQ ID NO: 136 - 5'-UTR Csf2ra Mus musculusSEQ ID NO: 136 - 5'-UTR Csf2ra Mus musculus

Figure 00000145
Figure 00000145

Некоторые из указанных 5'-UTR-элементов дикого типа имеют последовательности, которые отличаются от публично доступных последовательностей 5'-UTR, представленных в GenBank NCBI, см. таблицу 1 (пример 1). В этой таблице отражены результаты секвенирования, полученные при создании настоящего изобретения.Some of these wild-type 5'-UTR elements have sequences that differ from the publicly available 5'-UTR sequences presented in GenBank NCBI, see Table 1 (Example 1). This table reflects the sequencing results obtained in the creation of the present invention.

Так, 5'-UTR-элементы, выбранные из группы, которая состоит из SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO:98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135, представляют собой элементы, предлагаемые в настоящем изобретении, и их можно применять в любом из объектов настоящего изобретения.Thus, 5'UTR elements selected from the group consisting of SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135 are elements of the present invention and may be used in any aspect of the present invention.

Примеры искусственных 5'-UTR-элементов, которые можно применять согласно настоящему изобретениюExamples of artificial 5'-UTR elements that can be used according to the present invention

В некоторых вариантах осуществления изобретения 5'-UTR-элемент, предлагаемой в настоящем изобретении, отличается от 5'-UTR-элемента дикого типа. Такие 5'-UTR-элементы обозначают как «искусственные 5'-UTR-элементы».In some embodiments, the 5' UTR element of the present invention is different from the wild-type 5' UTR element. Such 5'-UTR elements are referred to as "artificial 5'-UTR elements".

Предпочтительно, чтобы искусственный 5'-UTR-элемент обладал степенью идентичности последовательности с 5'-UTR-элементом дикого типа, составляющей (а) менее 100%, и чтобы, в то же самое время, она составляла (б) более чем 10%, более чем 20%, более чем 30%, более чем 40%, более чем 50%, более чем 60%, более чем 70%, более чем 80%, более чем 90%, более чем 95%, такой 5'-UTR-элемент дикого типа выбирают из группы, которая состоит из SEQ ID NO: 1-136. Как правило, искусственный 5'-UTR-элемент отличается от 5'-UTR-элемента дикого типа тем, что в нем заменен(ы) по меньшей мере один нуклеотид, например, два нуклеотида, три нуклеотида, четыре нуклеотида, пять нуклеотидов, шесть нуклеотидов, семь нуклеотидов, восемь нуклеотидов, девять нуклеотидов, десять нуклеотидов или более чем десять нуклеотидов. Например, такую замену нуклеотидов можно рекомендовать в том случае, когда 5'-UTR-элемент дикого типа содержит нуклеотидный элемент, который рассматривается как «невыгодный». Например, в некоторых вариантах осуществления изобретения нуклеотидный элемент, который рассматривается как «невыгодный», выбирают из (I) внутреннего триплета ATG (т.е. триплета ATG, отличного от стартового кодона открытой рамки считывания нуклеиновой кислоты, предлагаемой в изобретении) или (II) сайта, распознаваемого рестриктазой (сайт расщепления), прежде всего сайта, распознаваемого рестриктазой (сайт расщепления), который распознается (может расщепляться) рестриктазой, применяемой в процессе создания (клонирования) искусственной нуклеиновой кислоты, предлагаемой в настоящем изобретении. Таким образом, можно специально интродуцировать определенное(ые) основание(я) (для обмена, предпочтительно замены, соответствующего(их) основания(й) дикого типа), так чтобы искусственный 5'-UTR-элемент не содержал нуклеотидный элемент, который рассматривается как «невыгодный». В конкретных вариантах осуществления изобретения искусственные 5'-UTR-элементы выбирают из группы, которая состоит из SEQ ID NO: 137-151:Preferably, the artificial 5'-UTR element has a degree of sequence identity with the wild-type 5'-UTR element of (a) less than 100%, and that, at the same time, it is (b) more than 10% , more than 20%, more than 30%, more than 40%, more than 50%, more than 60%, more than 70%, more than 80%, more than 90%, more than 95%, such 5'- The wild-type UTR element is selected from the group consisting of SEQ ID NOs: 1-136. Generally, an artificial 5'-UTR element differs from a wild-type 5'-UTR element in that at least one nucleotide(s) has been replaced, e.g., two nucleotides, three nucleotides, four nucleotides, five nucleotides, six nucleotides, seven nucleotides, eight nucleotides, nine nucleotides, ten nucleotides, or more than ten nucleotides. For example, such a nucleotide substitution may be recommended when the wild-type 5' UTR element contains a nucleotide element that is considered "unfavorable". For example, in some embodiments, the nucleotide element that is considered "unfavorable" is selected from (I) an internal ATG triplet (i.e., an ATG triplet other than the start codon of the nucleic acid open reading frame of the invention) or (II ) a restriction enzyme recognition site (cleavage site), especially a restriction enzyme recognition site (cleavage site) that is recognized (can be cleaved) by a restriction enzyme used in the process of creating (cloning) an artificial nucleic acid of the present invention. Thus, it is possible to deliberately introduce certain base(s) (to exchange, preferably replace, the corresponding wild-type base(s)), so that the artificial 5'-UTR element does not contain a nucleotide element that is considered as "disadvantageous". In particular embodiments, the artificial 5'UTR elements are selected from the group consisting of SEQ ID NOs: 137-151:

SEQ ID NO: 137 - Искусственная последовательность (на основе SEQ ID NO: 3)SEQ ID NO: 137 - Artificial sequence (based on SEQ ID NO: 3)

Figure 00000146
Figure 00000146

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000147
заменен на
Figure 00000148
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000147
replaced by
Figure 00000148
underlined above for emphasis]

SEQ ID NO: 138 - Искусственная последовательность (на основе SEQ ID NO: 9)SEQ ID NO: 138 - Artificial sequence (based on SEQ ID NO: 9)

Figure 00000149
Figure 00000149

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000150
заменен на
Figure 00000151
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000150
replaced by
Figure 00000151
underlined above for emphasis]

SEQ ID NO: 139 - Искусственная последовательность (на основе SEQ ID NO: 14)SEQ ID NO: 139 - Artificial sequence (based on SEQ ID NO: 14)

Figure 00000152
Figure 00000152

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000150
заменен на
Figure 00000151
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000150
replaced by
Figure 00000151
underlined above for emphasis]

SEQ ID NO: 140 - Искусственная последовательность (на основе SEQ ID NO: 17)SEQ ID NO: 140 - Artificial sequence (based on SEQ ID NO: 17)

Figure 00000153
Figure 00000153

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000154
заменен на
Figure 00000155
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000154
replaced by
Figure 00000155
underlined above for emphasis]

SEQ ID NO: 141 - Искусственная последовательность (на основе SEQ ID NO: 18)SEQ ID NO: 141 - Artificial sequence (based on SEQ ID NO: 18)

Figure 00000156
Figure 00000156

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000150
заменен на
Figure 00000151
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000150
replaced by
Figure 00000151
underlined above for emphasis]

SEQ ID NO: 142 - Искусственная последовательность (на основе SEQ ID NO: 29)SEQ ID NO: 142 - Artificial sequence (based on SEQ ID NO: 29)

Figure 00000157
Figure 00000157

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что два

Figure 00000150
заменены на два
Figure 00000151
оба подчеркнуты выше для большей выразительности][This sequence corresponds to its underlying wild-type sequence, except that two
Figure 00000150
replaced by two
Figure 00000151
both underlined above for emphasis]

SEQ ID NO: 143 - Искусственная последовательность (на основе SEQ ID NO: 31)SEQ ID NO: 143 - Artificial sequence (based on SEQ ID NO: 31)

Figure 00000158
Figure 00000158

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000150
заменен на
Figure 00000151
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000150
replaced by
Figure 00000151
underlined above for emphasis]

SEQ ID NO: 144 - Искусственная последовательность (на основе SEQ ID NO: 42)SEQ ID NO: 144 - Artificial sequence (based on SEQ ID NO: 42)

Figure 00000159
Figure 00000159

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000160
заменен на
Figure 00000161
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000160
replaced by
Figure 00000161
underlined above for emphasis]

SEQ ID NO: 145 - Искусственная последовательность (на основе SEQ ID NO: 43)SEQ ID NO: 145 - Artificial sequence (based on SEQ ID NO: 43)

Figure 00000162
Figure 00000162

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что (I)

Figure 00000150
заменен на
Figure 00000151
и что (II)
Figure 00000163
заменен на
Figure 00000164
каждый подчеркнут выше для большей выразительности][The indicated sequence corresponds to its underlying wild-type sequence, except that (I)
Figure 00000150
replaced by
Figure 00000151
and what (II)
Figure 00000163
replaced by
Figure 00000164
each underlined above for emphasis]

SEQ ID NO: 146 - Искусственная последовательность (на основе SEQ ID NO: 52)SEQ ID NO: 146 - Artificial sequence (based on SEQ ID NO: 52)

Figure 00000165
Figure 00000165

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что каждый из трех

Figure 00000150
заменен на
Figure 00000151
каждый подчеркнут выше для большей выразительности][This sequence corresponds to its underlying wild-type sequence, except that each of the three
Figure 00000150
replaced by
Figure 00000151
each underlined above for emphasis]

SEQ ID NO: 147 - Искусственная последовательность (на основе SEQ ID NO: 109)SEQ ID NO: 147 - Artificial sequence (based on SEQ ID NO: 109)

Figure 00000166
Figure 00000166

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000163
заменен на
Figure 00000164
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000163
replaced by
Figure 00000164
underlined above for emphasis]

SEQ ID NO: 148 - Искусственная последовательность (на основе SEQ ID NO: 110)SEQ ID NO: 148 - Artificial sequence (based on SEQ ID NO: 110)

Figure 00000167
Figure 00000167

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000168
заменен на
Figure 00000169
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000168
replaced by
Figure 00000169
underlined above for emphasis]

SEQ ID NO: 149 - Искусственная последовательность (на основе SEQ ID NO: 119)SEQ ID NO: 149 - Artificial sequence (based on SEQ ID NO: 119)

Figure 00000170
Figure 00000170

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000150
заменен на
Figure 00000151
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000150
replaced by
Figure 00000151
underlined above for emphasis]

SEQ ID NO: 150 - Искусственная последовательность (на основе SEQ ID NO: 120)SEQ ID NO: 150 - Artificial sequence (based on SEQ ID NO: 120)

Figure 00000171
Figure 00000171

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000150
заменен на
Figure 00000151
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000150
replaced by
Figure 00000151
underlined above for emphasis]

SEQ ID NO: 151 - Искусственная последовательность (на основе SEQ ID NO: 136)SEQ ID NO: 151 - Artificial sequence (based on SEQ ID NO: 136)

Figure 00000172
Figure 00000172

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что

Figure 00000150
заменен на
Figure 00000151
подчеркнут выше для большей выразительности][The specified sequence corresponds to its underlying wild-type sequence, except that
Figure 00000150
replaced by
Figure 00000151
underlined above for emphasis]

3'-UTR-элементы3'-UTR elements

Предпочтительно по меньшей мере один 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, выбранной из группы, которая состоит из SEQ ID NO: 152-204, или соответствующей последовательности ДНК или РНК соответственно, или по меньшей мере один 3'-UTR-элемент содержит или состоит из фрагмента нуклеотидной последовательности, который идентичен по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, выбранной из группы, которая состоит из SEQ ID NO: 152-204, или соответствующей последовательности ДНК или РНК соответственно.Preferably, at least one 3'-UTR element contains or consists of a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30, or 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of a nucleotide sequence selected from the group consisting of SEQ ID NOs: 152-204, or the corresponding DNA or RNA sequence, respectively, or at least one 3'-UTR- the element contains or consists of a nucleotide sequence fragment that is at least about 40% identical, preferably at least about 50% identical, preferably at least about 60% identical, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide a sequence selected from the group consisting of SEQ ID NO: 152-204, or the corresponding DNA or RNA sequence, respectively.

Среди последовательностей, подробно описанных ниже, SEQ ID NO: 152-203 можно рассматривать как последовательности 3'-UTR дикого типа, a SEQ ID NO: 204 можно рассматривать как искусственную последовательность 3'-UTR.Among the sequences detailed below, SEQ ID NO: 152-203 can be considered wild-type 3'-UTR sequences, and SEQ ID NO: 204 can be considered an artificial 3'-UTR sequence.

SEQ ID NO: 152 - 3'-UTR NDUFS7 Homo sapiensSEQ ID NO: 152 - 3'-UTR NDUFS7 Homo sapiens

NM_024407.4

Figure 00000173
NM_024407.4
Figure 00000173

SEQ ID NO: 153 - 3'-UTR PHGDH Homo sapiensSEQ ID NO: 153 - 3'-UTR PHGDH Homo sapiens

NM_006623.3NM_006623.3

Figure 00000174
Figure 00000174

SEQ ID NO: 154 - 3'-UTR TSPO Homo sapiensSEQ ID NO: 154 - 3'-UTR TSPO Homo sapiens

NM_000714.5NM_000714.5

Figure 00000175
Figure 00000175

SEQ ID NO: 155 - 3'-UTR ATP5D Homo sapiensSEQ ID NO: 155 - 3'-UTR ATP5D Homo sapiens

NM_001687.4NM_001687.4

Figure 00000176
Figure 00000176

SEQ ID NO: 156 - 3'-UTR EXOSC4 Homo sapiensSEQ ID NO: 156 - 3'-UTR EXOSC4 Homo sapiens

NM_019037.2

Figure 00000177
NM_019037.2
Figure 00000177

SEQ ID NO: 157 - 3'-UTR TUBB4B Homo sapiensSEQ ID NO: 157 - 3'-UTR TUBB4B Homo sapiens

NM_006088.5NM_006088.5

Figure 00000178
Figure 00000178

SEQ ID NO: 158 - 3' -UTR TUBA4A Homo sapiensSEQ ID NO: 158-3'-UTR TUBA4A Homo sapiens

NM_006000.1NM_006000.1

Figure 00000179
Figure 00000179

SEQ ID NO: 159 - 3'-UTR EMP3 Homo sapiensSEQ ID NO: 159 - 3'-UTR EMP3 Homo sapiens

Figure 00000180
Figure 00000180

SEQ ID NO: 160 - 3'-UTR CRIP2 Homo sapiensSEQ ID NO: 160 - 3'-UTR CRIP2 Homo sapiens

NM_001312.3NM_001312.3

Figure 00000181
Figure 00000181

SEQ ID NO: 161 - 3'-UTR BRAT1 Homo sapiensSEQ ID NO: 161 - 3'-UTR BRAT1 Homo sapiens

NM_152743.3

Figure 00000182
NM_152743.3
Figure 00000182

Figure 00000183
Figure 00000183

SEQ ID NO: 162 - 3'-UTR CD9 Homo sapiensSEQ ID NO: 162 - 3'-UTR CD9 Homo sapiens

NM_001769.3NM_001769.3

Figure 00000184
Figure 00000184

SEQ ID NO: 163 - 3'-UTR CDK9 Homo sapiensSEQ ID NO: 163 - 3'-UTR CDK9 Homo sapiens

NM_001261.3NM_001261.3

Figure 00000185
Figure 00000185

SEQ ID NO: 164 - 3'-UTR PSMB3 Homo sapiensSEQ ID NO: 164 - 3'-UTR PSMB3 Homo sapiens

NM_002795.2

Figure 00000186
NM_002795.2
Figure 00000186

SEQ ID NO: 165 - 3'-UTR PSMB6 Homo sapiensSEQ ID NO: 165 - 3'-UTR PSMB6 Homo sapiens

NM_002798.2NM_002798.2

Figure 00000187
Figure 00000187

SEQ ID NO: 166 - 3'-UTR PRSS56 Homo sapiensSEQ ID NO: 166 - 3'-UTR PRSS56 Homo sapiens

NM_001195129.1NM_001195129.1

Figure 00000188
Figure 00000188

SEQ ID NO: 167 - 3'-UTR SCAND1 Homo sapiensSEQ ID NO: 167 - 3'-UTR SCAND1 Homo sapiens

NM_016558NM_016558

Figure 00000189
Figure 00000189

SEQ ID NO: 168 - 3'-UTR AMN Homo sapiensSEQ ID NO: 168 - 3'-UTR AMN Homo sapiens

NM_030943.3NM_030943.3

Figure 00000190
Figure 00000190

SEQ ID NO: 169 - 3'-UTR CYBA Homo sapiensSEQ ID NO: 169 - 3'-UTR CYBA Homo sapiens

NM_000101.3

Figure 00000191
NM_000101.3
Figure 00000191

SEQ ID NO: 170 - 3'-UTR PCOLCE Homo sapiensSEQ ID NO: 170 - 3'-UTR PCOLCE Homo sapiens

NM_002593.3NM_002593.3

Figure 00000192
Figure 00000192

SEQ ID NO: 171 - 3'-UTR MAP1S Homo sapiensSEQ ID NO: 171 - 3'-UTR MAP1S Homo sapiens

NM_018174.4NM_018174.4

Figure 00000193
Figure 00000193

SEQ ID NO: 172 - 3'-UTR VTN Homo sapiensSEQ ID NO: 172 - 3'-UTR VTN Homo sapiens

NM_000638.3NM_000638.3

Figure 00000194
Figure 00000194

SEQ ID NO: 173 - 3'-UTR ALDH16A1 Homo sapiensSEQ ID NO: 173 - 3'-UTR ALDH16A1 Homo sapiens

NM_001145396.1

Figure 00000195
NM_001145396.1
Figure 00000195

SEQ ID NO: 174 - 3'-UTR Acox2 Mus musculusSEQ ID NO: 174 - 3'-UTR Acox2 Mus musculus

NM_001161667.1NM_001161667.1

Figure 00000196
Figure 00000196

SEQ ID NO: 175 - 3'-UTR Ubc Mus musculusSEQ ID NO: 175 - 3'-UTR Ubc Mus musculus

BC006680.1BC006680.1

Figure 00000197
Figure 00000197

SEQ ID NO: 176 - 3'-UTR Slpi Mus musculusSEQ ID NO: 176 - 3'-UTR Slpi Mus musculus

NM_011414.3NM_011414.3

Figure 00000198
Figure 00000198

SEQ ID NO: 177 - 3'-UTR Nudt22 Mus musculusSEQ ID NO: 177 - 3'-UTR Nudt22 Mus musculus

NM_026675.2NM_026675.2

Figure 00000199
Figure 00000199

SEQ ID NO: 178 - 3'-UTR Pcyox11 Mus musculusSEQ ID NO: 178 - 3'-UTR Pcyox11 Mus musculus

NM_172832.4

Figure 00000200
NM_172832.4
Figure 00000200

Figure 00000201
Figure 00000201

SEQ ID NO: 179 - 3'-UTR Igf2bp1 Mus musculusSEQ ID NO: 179 - 3'-UTR Igf2bp1 Mus musculus

Figure 00000202
Figure 00000202

SEQ ID NO: 180 - 3'-UTR Tmem37 Mus musculusSEQ ID NO: 180 - 3'-UTR Tmem37 Mus musculus

Figure 00000203
Figure 00000203

SEQ ID NO: 181 - 3'-UTR (240) Slc7a3 Mus musculusSEQ ID NO: 181 - 3'-UTR (240) Slc7a3 Mus musculus

NM_007515NM_007515

Figure 00000204
Figure 00000204

SEQ ID NO: 182 - 3'-UTR Cst6 Mus musculusSEQ ID NO: 182 - 3'-UTR Cst6 Mus musculus

Figure 00000205
Figure 00000205

SEQ ID NO: 183 - 3'-UTR Ebp Mus musculusSEQ ID NO: 183 - 3'-UTR Ebp Mus musculus

Figure 00000206
Figure 00000206

SEQ ID NO: 184 - 3'-UTR Sf3b5 Mus musculusSEQ ID NO: 184 - 3'-UTR Sf3b5 Mus musculus

NM_009829.3NM_009829.3

Figure 00000207
Figure 00000207

SEQ ID NO: 185 - 3'-UTR Plk1 Mus musculusSEQ ID NO: 185 - 3'-UTR Plk1 Mus musculus

NM_011121.3NM_011121.3

Figure 00000208
Figure 00000208

SEQ ID NO: 186 - 3'-UTR Aarsd1 Mus musculusSEQ ID NO: 186 - 3'-UTR Aarsd1 Mus musculus

NM_144829.1NM_144829.1

Figure 00000209
Figure 00000209

SEQ ID NO: 187 - 3'-UTR Cdca8 Mus musculusSEQ ID NO: 187 - 3'-UTR Cdca8 Mus musculus

NM_026560.4NM_026560.4

Figure 00000210
Figure 00000210

Figure 00000211
Figure 00000211

SEQ ID NO: 188 - 3'-UTR Kif22 Mus musculusSEQ ID NO: 188 - 3'-UTR Kif22 Mus musculus

NM_145588.1NM_145588.1

Figure 00000212
Figure 00000212

SEQ ID NO: 189 - 3'-UTR Cad Mus musculusSEQ ID NO: 189 - 3'-UTR Cad Mus musculus

NM_023525.2NM_023525.2

Figure 00000213
Figure 00000213

SEQ ID NO: 190 - 3'-UTR Cth Mus musculusSEQ ID NO: 190 - 3'-UTR Cth Mus musculus

NM_145953.2NM_145953.2

Figure 00000214
Figure 00000214

Figure 00000215
Figure 00000215

SEQ ID NO: 191 - 3'-UTR Pole Mus musculusSEQ ID NO: 191 - 3'-UTR Pole Mus musculus

NM_011132.2NM_011132.2

Figure 00000216
Figure 00000216

SEQ ID NO: 192 - 3'-UTR Kif2cSEQ ID NO: 192 - 3'-UTR Kif2c

Mus musculus NM_134471.4Mus musculus NM_134471.4

Figure 00000217
Figure 00000217

SEQ ID NO: 193 - 3'-UTR Scand1 Mus musculusSEQ ID NO: 193 - 3'-UTR Scand1 Mus musculus

NM_020255.3NM_020255.3

Figure 00000218
Figure 00000218

SEQ ID NO: 194 - 3'-UTR Gpr84 Mus musculusSEQ ID NO: 194 - 3'-UTR Gpr84 Mus musculus

NM_030720.1NM_030720.1

Figure 00000219
Figure 00000219

SEQ ID NO: 195 - 3'-UTR Tpgs1 Mus musculusSEQ ID NO: 195 - 3'-UTR Tpgs1 Mus musculus

NM_148934.2NM_148934.2

Figure 00000220
Figure 00000220

SEQ ID NO: 196 - 3'-UTR Cel17 Mus musculusSEQ ID NO: 196 - 3'-UTR Cel17 Mus musculus

NM_011332.3NM_011332.3

Figure 00000221
Figure 00000221

SEQ ID NO: 197 - 3'-UTR Alkbh7 Mus musculusSEQ ID NO: 197 - 3'-UTR Alkbh7 Mus musculus

Figure 00000222
Figure 00000222

SEQ ID NO: 198 - 3'-UTR Ms4a8a Mus musculusSEQ ID NO: 198 - 3'-UTR Ms4a8a Mus musculus

NM_022430.2NM_022430.2

Figure 00000223
Figure 00000223

SEQ ID NO: 199 - 3'-UTR Mrp134 Mus musculusSEQ ID NO: 199 - 3'-UTR Mrp134 Mus musculus

NM_053162.2NM_053162.2

Figure 00000224
Figure 00000224

SEQ ID NO: 200 - 3'-UTR Comtd1 Mus musculusSEQ ID NO: 200 - 3'-UTR Comtd1 Mus musculus

Figure 00000225
Figure 00000225

SEQ ID NO: 201 - 3'-UTR Armc6 Mus musculusSEQ ID NO: 201 - 3'-UTR Armc6 Mus musculus

NM_133972.2NM_133972.2

Figure 00000226
Figure 00000226

SEQ ID NO: 202 - 3'-UTR Atp5d Mus musculusSEQ ID NO: 202 - 3'-UTR Atp5d Mus musculus

NM_025313.2NM_025313.2

Figure 00000227
Figure 00000227

Figure 00000228
Figure 00000228

SEQ ID NO: 203 - 3'-UTR 1110001J03Rik Mus musculusSEQ ID NO: 203 - 3'-UTR 1110001J03 Rik Mus musculus

NM_025363.3NM_025363.3

Figure 00000229
Figure 00000229

Некоторые из указанных 3'-UTR-элементов дикого типа отличаются от публично доступных последовательностей 3'-UTR, представленных в GenBank NCBI, см. таблицу 2 (пример 1). В указанной таблице отражены результаты секвенирования, полученные при создании настоящего изобретения.Some of these wild-type 3'-UTR elements differ from the publicly available 3'-UTR sequences presented in GenBank NCBI, see Table 2 (Example 1). This table reflects the results of sequencing obtained during the creation of the present invention.

Так, 3'-UTR-элементы, выбранные из группы, которая состоит из SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200, представляют собой элементы, предлагаемые в настоящем изобретении, и их можно применять в любом из объектов настоящего изобретения.Thus, 3'UTR elements selected from the group consisting of SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200 are the elements proposed in the present invention, and they can be used in any of the objects of the present invention.

Пример искусственных 3'-UTR-элементов, которые можно применять согласно настоящему изобретениюAn example of artificial 3'-UTR elements that can be used according to the present invention

В некоторых вариантах осуществления изобретения 3'-UTR-элемент, предлагаемой в настоящем изобретении, отличается от 3'-UTR-элемента дикого типа. Такие 3'-UTR-элементы обозначены как «искусственные 3'-UTR-элементы».In some embodiments, the 3'UTR element of the present invention is different from the wild-type 3'UTR element. Such 3'UTR elements are referred to as "artificial 3'UTR elements".

Предпочтительно, чтобы искусственный 3'-UTR-элемент обладал степенью идентичности с 3'-UTR-элементом дикого типа, составляющей (а) менее 100%, и чтобы, в то же самое время, она составляла (В) более чем 10%, более чем 20%, более чем 30%, более чем 40%, более чем 50%, более чем 60%, более чем 70%, более чем 80%, более чем 90%, более чем 95%, такой 3'-UTR-элемент дикого типа выбирают из группы, которая состоит из SEQ ID NO: 152-203. Как правило, искусственный 3'-UTR-элемент отличается от 3'-UTR-элемента дикого типа тем, что в нем заменен(ы) по меньшей мере один нуклеотид, например, два нуклеотида, три нуклеотида, четыре нуклеотида, пять нуклеотидов, шесть нуклеотидов, семь нуклеотидов, восемь нуклеотидов, девять нуклеотидов, десять нуклеотидов или более чем десять нуклеотидов. Например, такую замену нуклеотидов можно рекомендовать в том случае, когда 3'-UTR-элемент дикого типа содержит нуклеотидный элемент, который рассматривается как невыгодный. Например, в некоторых вариантах осуществления изобретения нуклеотидный элемент, который рассматривается как невыгодный, представляет собой сайт, распознаваемый рестриктазой (сайт расщепления), прежде всего сайт, распознаваемый рестриктазой (сайт расщепления), который распознается (может расщепляться) рестриктазой, применяемой в процессе создания (клонирования) искусственной нуклеиновой кислоты, предлагаемой в настоящем изобретении. Таким образом, можно специально интродуцировать определенное(ые) основание(я) (для обмена, предпочтительно замены, соответствующего(их) основания(й) дикого типа), так чтобы искусственный 3'-UTR-элемент не содержал нуклеотидный элемент, который рассматривается как невыгодный. В конкретных вариантах осуществления изобретения искусственные 3'-UTR-элементы имеют последовательность SEQ ID NO: 204:Preferably, the artificial 3'-UTR element has a degree of identity with the wild-type 3'-UTR element of (a) less than 100%, and that, at the same time, it is (B) more than 10%, more than 20%, more than 30%, more than 40%, more than 50%, more than 60%, more than 70%, more than 80%, more than 90%, more than 95%, such a 3'-UTR the wild-type element is selected from the group consisting of SEQ ID NOs: 152-203. Generally, an artificial 3'-UTR element differs from a wild-type 3'-UTR element in that at least one nucleotide(s) has been replaced, e.g., two nucleotides, three nucleotides, four nucleotides, five nucleotides, six nucleotides, seven nucleotides, eight nucleotides, nine nucleotides, ten nucleotides, or more than ten nucleotides. For example, such a nucleotide substitution may be recommended when the wild-type 3' UTR element contains a nucleotide element that is considered disadvantageous. For example, in some embodiments of the invention, the nucleotide element that is considered disadvantageous is a site recognized by a restriction enzyme (cleavage site), primarily a site recognized by a restriction enzyme (cleavage site), which is recognized (may be cleaved) by a restriction enzyme used in the creation process ( cloning) of the artificial nucleic acid of the present invention. Thus, it is possible to deliberately introduce certain base(s) (to exchange, preferably replace, the corresponding wild-type base(s)), so that the artificial 3'-UTR element does not contain a nucleotide element that is considered as disadvantageous. In specific embodiments, the artificial 3'-UTR elements have the sequence of SEQ ID NO: 204:

SEQ ID NO: 204 - Искусственная последовательность (на основе SEQ ID NO: 192)SEQ ID NO: 204 - Artificial sequence (based on SEQ ID NO: 192)

Figure 00000230
Figure 00000230

[Указанная последовательность соответствует служащей для нее основой последовательности дикого типа, за исключением того, что AGATCT заменен TGATCT, подчеркнут выше для большей выразительности][The indicated sequence corresponds to its underlying wild-type sequence, except that AGATCT is replaced by TGATCT , underlined above for emphasis]

Новые 5'-UTR-элементы и новые 3'-UTR-элементыNew 5'-UTR elements and new 3'-UTR elements

В настоящем изобретении предложены также новые 5'-UTR-элементы и новые 3'-UTR-элементы, т.е. 5'-UTR-элементы и 3'-UTR-элементы, которые были обнаружены при создании настоящего изобретения в человеческих клетках и мышиных клетках соответственно, но которые не представлены в публичных базах данных (см. пример 1). Любая 5'-UTR, выбранная из группы, которая состоит из SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, может являться предпочтительной в некоторых вариантах осуществления настоящего изобретения. Любая 5'-UTR, выбранная из группы, которая состоит из SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135, может являться предпочтительной в некоторых вариантах осуществления настоящего изобретения. Любая 3'-UTR, выбранная из группы, которая состоит из SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200, может являться предпочтительной в некоторых вариантах осуществления настоящего изобретения.The present invention also provides new 5'UTR elements and new 3'UTR elements, i.e. 5'-UTR elements and 3'-UTR elements, which were found during the creation of the present invention in human cells and mouse cells, respectively, but which are not presented in public databases (see example 1). Any 5'-UTR selected from the group consisting of SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49 may be preferred in some embodiments of the present invention. Any 5'UTR selected from the group consisting of SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO : 131, SEQ ID NO: 135, may be preferred in some embodiments of the present invention. Any 3'-UTR selected from the group consisting of SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200 may be preferred in some embodiments of the present invention.

Описание 5'-UTR-элементов и предпочтительных 3'-UTR-элементовDescription of 5'UTR Elements and Preferred 3'UTR Elements

Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% последовательности 3'-UTR транскрипта гена, выбранного из группы, которая состоит из NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (все человеческие), Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001 J03Rik-3'-UTR, Nudt22-3'-UTR (все мышиные). Наиболее предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% последовательности, выбранной из группы, которая состоит из SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (в альтернативном варианте SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, или соответствующих последовательностей РНК соответственно.Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the sequence of the 3'-UTR of a gene transcript selected from the group consisting of NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D- 3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, PSMB3-3 '-UTR, PSMB6-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3' -UTR, ALDH16A1-3'-UT R (all human), Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6- 3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Pole-3'-UTR, Kif2c-3 '-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3' -UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001 J03Rik-3'-UTR, Nudt22-3'-UTR (all murine). Most preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of a sequence selected from the group consisting of SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO : 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternatively SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, or corresponding RNA sequences, respectively.

Предпочтительно по меньшей мере один 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% последовательности 5'-UTR транскрипта ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'-UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (все человеческие), Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (все мышиные). Наиболее предпочтительно по меньшей мере один 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% последовательности, представленной в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (в альтернативном варианте SEQ ID NO: 3), SEQ ID NO: 138 (в альтернативном варианте SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (в альтернативном варианте SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (в альтернативном варианте SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (в альтернативном варианте SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (в альтернативном варианте SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (в альтернативном варианте SEQ ID NO: 109), SEQ ID NO: 148 (в альтернативном варианте SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (в альтернативном варианте SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (в альтернативном варианте SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125 или соответствующей последовательности РНК соответственно.Preferably, at least one 5'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the 5'-UTR sequence of the transcript ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5' -UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'- UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR , SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UT R, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR , SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR ( all human), Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tspyl4-5' -UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'- UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR , Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1 -5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34- 5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5 '-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (all murine). Most preferably, at least one 5'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the sequence shown in SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternatively, SEQ ID NO: 3), SEQ ID NO: 138 (alternatively SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternatively SEQ ID NO: 17), SEQ ID NO: 20 , SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternatively SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternatively SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO : 144 (alternatively SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternatively SEQ ID NO: 109), SEQ ID NO: 148 (alternatively SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119 ), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternatively SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125 or the corresponding RNA sequence, respectively.

По меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, может также содержать или состоять из фрагмента нуклеотидной последовательности, идентичного по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR транскрипта гена, такой как последовательность 3'-UTR, представленная в SEQ ID NO: 152-204, при этом фрагмент предпочтительно представляет собой функциональный фрагмент или функциональный вариант фрагмента, описанный выше. Такой фрагмент предпочтительно имеет длину по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. В предпочтительном варианте осуществления изобретения фрагмент или его вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов. Предпочтительно указанные варианты, фрагменты или варианты фрагментов представляют собой функциональные варианты, функциональные фрагменты или функциональные варианты фрагментов 3'-UTR, которые пролонгируют производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, с эффективностью, составляющей по меньшей мере 30%, предпочтительно с эффективностью, составляющей по меньшей мере 40%, более предпочтительно по меньшей мере 50%, более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере 90% от эффективности пролонгирования производства белка, обеспечиваемой искусственной молекулой нуклеиновой кислоты, которая содержит нуклеотидную последовательность, выбранную из группы, которая состоит из SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (в альтернативном варианте SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177.At least one 3'-UTR element of the artificial nucleic acid molecule of the present invention may also contain or consist of a nucleotide sequence fragment that is at least about 40% identical, preferably at least about 50% identical, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'UTR of the gene transcript, such as the 3'UTR sequence shown in SEQ ID NOs: 152-204, wherein the fragment is preferably a functional fragment or a functional variant of the fragment described above. Such a fragment is preferably at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. In a preferred embodiment, the fragment or variant thereof is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides. Preferably, said variants, fragments, or fragment variants are functional variants, functional fragments, or functional variants of 3'-UTR fragments that prolong protein production from the artificial nucleic acid molecule of the invention with an efficiency of at least 30%, preferably with an efficiency of at least 40%, more preferably at least 50%, more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80%, most preferably at least 90% on the efficiency of protein production prolongation provided by an artificial nucleic acid molecule that contains a nucleotide sequence selected from the group consisting of SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID N O: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternatively SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177.

По меньшей мере один 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, может также содержать или состоять из фрагмента нуклеотидной последовательности, идентичного по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 5'-UTR транскрипта гена, такой как последовательность 5'-UTR, представленная в SEQ ID NO: 1-151, при этом фрагмент предпочтительно представляет собой функциональный фрагмент или функциональный вариант фрагмента, описанный выше. Такой фрагмент предпочтительно имеет длину по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. В предпочтительном варианте осуществления изобретения фрагмент или его вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов. Предпочтительно указанные варианты, фрагменты или варианты фрагментов представляют собой функциональные варианты, функциональные фрагменты или функциональные варианты фрагментов 3'-UTR, которые пролонгируют производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, с эффективностью, составляющей по меньшей мере 30%, предпочтительно с эффективностью, составляющей по меньшей мере 40%, более предпочтительно по меньшей мере 50%, более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере 90% от эффективности пролонгирования производства белка, обеспечиваемой искусственной молекулой нуклеиновой кислоты, которая содержит нуклеотидную последовательность, выбранную из группы, которая состоит из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (в альтернативном варианте SEQ ID NO: 3), SEQ ID NO: 138 (в альтернативном варианте SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (в альтернативном варианте SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (в альтернативном варианте SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (в альтернативном варианте SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (в альтернативном варианте SEQ ID NO: 42), SEQ ID N0:58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (в альтернативном варианте SEQ ID NO: 109), SEQ ID NO: 148 (в альтернативном варианте SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (в альтернативном варианте SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (в альтернативном варианте SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125.At least one 5'-UTR element of the artificial nucleic acid molecule of the present invention may also contain or consist of a nucleotide sequence fragment that is at least about 40% identical, preferably at least about 50% identical, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 5'UTR of the gene transcript, such as the 5'UTR sequence shown in SEQ ID NOs: 1-151, wherein the fragment is preferably a functional fragment or a functional variant of the fragment described above. Such a fragment is preferably at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. In a preferred embodiment, the fragment or variant thereof is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides. Preferably, said variants, fragments, or fragment variants are functional variants, functional fragments, or functional variants of 3'-UTR fragments that prolong protein production from the artificial nucleic acid molecule of the invention with an efficiency of at least 30%, preferably with an efficiency of at least 40%, more preferably at least 50%, more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80%, most preferably at least 90% from the efficiency of protein production prolongation provided by an artificial nucleic acid molecule that contains a nucleotide sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternatively, SEQ ID NO: 3 ), SEQ ID NO: 138 (alternatively SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternatively SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternatively SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 ( alternatively SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternatively SEQ ID NO: 42), SEQ ID N0:58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternatively SEQ ID NO: 109), SEQ ID NO: 148 (alternatively SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119 ), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternatively SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125.

Другие предпочтительные варианты осуществления изобретенияOther preferred embodiments of the invention

Предпочтительно по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, имеет длину по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидовв, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Верхний предел длины по меньшей мере одного 3'-UTR-элемента и/или по меньшей мере одного 5'-UTR-элемента может составлять 500 нуклеотидов или менее, например, 400, 300, 200, 150 или 100 нуклеотидов. В других вариантах осуществления изобретения верхний предел можно выбирать в диапазоне от 50 до 100 нуклеотидов. Например, его фрагмент или вариант может иметь длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.Preferably, at least one 3'-UTR element and/or at least one 5'-UTR element of the artificial nucleic acid molecule of the present invention is at least about 3 nucleotides in length, preferably at least about 5 nucleotides. , more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. The upper limit of the length of at least one 3'UTR element and/or at least one 5'UTR element may be 500 nucleotides or less, such as 400, 300, 200, 150 or 100 nucleotides. In other embodiments of the invention, the upper limit can be selected in the range from 50 to 100 nucleotides. For example, a fragment or variant thereof may be from 3 to about 500 nucleotides in length, preferably from 5 to about 150 nucleotides, more preferably from 10 to 100 nucleotides, even more preferably from 15 to 90, most preferably from 20 to 70 nucleotides.

Может оказаться предпочтительным также, чтобы UTR-элемент, содержащийся в искусственной молекуле нуклеиновой кислоты, содержал (или состоял из) непрерывной последовательности, которая короче любой последовательности, выбранной из SEQ ID NO: 1-204, представленных в настоящем описании, при условии, что она все еще идентична на 70% или более, 80% или более, 90% или более или 95% или более соответствующей последовательности любой последовательности, выбранной из SEQ ID NO: 1-204. В таком случае предпочтительно замещающий UTR-элемент содержит непрерывную последовательность, которая по всей длине идентична любой последовательности, выбранной из SEQ ID NO: 1-204; однако, замещающий UTR-элемент является более коротким, например, имеет длину, составляющую 70% или более, 80% или более, 90% или более или 95% или более по сравнению со всей длиной последовательности, а в остальном является идентичным указанной последовательности, которая выбрана из SEQ ID NO: 1-204.It may also be preferred that the UTR element contained in the artificial nucleic acid molecule contains (or consists of) a contiguous sequence that is shorter than any sequence selected from SEQ ID NOs: 1-204 provided herein, provided that it is still 70% or more, 80% or more, 90% or more, or 95% or more identical to the corresponding sequence of any sequence selected from SEQ ID NO: 1-204. In such a case, preferably, the replacement UTR element contains a contiguous sequence that is identical throughout its length to any sequence selected from SEQ ID NOs: 1-204; however, the replacement UTR element is shorter, for example, has a length of 70% or more, 80% or more, 90% or more, or 95% or more of the entire length of the sequence, and is otherwise identical to the specified sequence, which is selected from SEQ ID NO: 1-204.

Кроме того, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать более одного 3'-UTR-элемента и/или более одного 5'-UTR-элемента, описанного выше. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать один, два, три, четыре или большее количество 3'-UTR-элементов, и/или один, два, три, четыре или большее количество 5'-UTR-элементов, при этом индивидуальные 5'-UTR-элементы могут быть одинаковыми или они могут быть различными, и аналогично этому индивидуальные 5'-UTR-элементы могут быть одинаковыми или они могут быть различными. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать два практически идентичных 3'-UTR-элемента, описанные выше, например, два 3'-UTR-элемента, содержащие или состоящие из нуклеотидной последовательности, которая получена из 3'-UTR транскрипта гена, например, из последовательности, представленной в SEQ ID NO: 152-204, или из фрагмента или варианта 3'-UTR транскрипта гена, его функциональных вариантов, его функциональных фрагментов или его функциональных вариантов фрагментов, описанных выше. Следовательно, например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать два практически идентичных 5'-UTR-элемента, описанных выше, например, два 5'-UTR-элемента, содержащие или состоящие из нуклеотидной последовательности, которая получена из 5'-UTR транскрипта гена, such например, из последовательности, представленной в SEQ ID NO: 1-151, или из фрагмента или варианта 5'-UTR транскрипта гена, его функциональных вариантов, его функциональных фрагментов или его функциональных вариантов фрагментов, описанных выше.In addition, the artificial nucleic acid molecule of the present invention may contain more than one 3'UTR element and/or more than one 5'UTR element as described above. For example, an artificial nucleic acid molecule of the present invention may contain one, two, three, four or more 3'-UTR elements, and/or one, two, three, four or more 5'-UTR elements. , while the individual 5'-UTR elements may be the same or they may be different, and similarly, the individual 5'-UTR elements may be the same or they may be different. For example, an artificial nucleic acid molecule of the present invention may contain two substantially identical 3'-UTR elements as described above, for example, two 3'-UTR elements containing or consisting of a nucleotide sequence that is derived from a 3'- The UTR of the gene transcript, for example, from the sequence shown in SEQ ID NO: 152-204, or from a fragment or variant of the 3'-UTR of the gene transcript, its functional variants, its functional fragments or its functional variants of the fragments described above. Therefore, for example, an artificial nucleic acid molecule of the present invention may contain two substantially identical 5'-UTR elements as described above, for example, two 5'-UTR elements containing or consisting of a nucleotide sequence that is derived from 5 The '-UTR of a gene transcript, such as, for example, from the sequence shown in SEQ ID NO: 1-151, or from a fragment or variant of the 5'-UTR of a gene transcript, its functional variants, its functional fragments or its functional variants of the fragments described above.

При создании изобретения неожиданно было установлено, что искусственная молекула нуклеиновой кислоты, содержащая 3'-UTR-элемент, описанный выше, и/или 5'-UTR-элемент, описанный выше, может представлять собой или может позволять создавать молекулу мРНК, которая обеспечивает высокую эффективность трансляции. Так, 3'-UTR-элемент, представленный в настоящем описании, и/или 5'-UTR-элемент, представленный в настоящем описании, может повышать эффективность трансляции молекулы мРНК.In the course of the invention, it has surprisingly been found that an artificial nucleic acid molecule containing a 3'UTR element as described above and/or a 5'UTR element as described above may be, or may allow the creation of, an mRNA molecule that provides a high translation efficiency. Thus, a 3'-UTR element as provided herein and/or a 5'-UTR element as provided herein can increase the efficiency of translation of an mRNA molecule.

В частности, искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, может содержать (I) по меньшей мере один 3'-UTR-элемент и по меньшей мере один 5'-UTR-элемент, которые обеспечивают высокую эффективность трансляции; (II) по меньшей мере один 3'-UTR-элемент, который обеспечивает высокую эффективность трансляции, но не содержать 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции; или (III) по меньшей мере один 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции, но не содержать 3'-UTR-элемент, который обеспечивает высокую эффективность трансляции.In particular, an artificial nucleic acid molecule according to the invention may contain (i) at least one 3'-UTR element and at least one 5'-UTR element, which provide high translation efficiency; (II) at least one 3'UTR element that provides high translation efficiency, but does not contain a 5'UTR element that provides high translation efficiency; or (iii) at least one 5'UTR element that provides high translation efficiency, but does not contain a 3'UTR element that provides high translation efficiency.

Однако, прежде всего, в случаях (II) и (III), но, возможно, также и в случае (I), искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать дополнительно один или большее количество «дополнительных 3'-UTR-элементов и/или 5'-UTR-элементов», т.е. 3'-UTR-элементов и/или 5'-UTR-элементов, которые не удовлетворяют описанным выше требованиям. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, которая содержит 3'-UTR-элемент, предлагаемый в настоящем изобретении, т.е. 3'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, может дополнительно содержать любую дополнительную 3'-UTR и/или любую дополнительную 5'-UTR, в частности, дополнительную 5'-UTR, например, 5'-ТОР UTR, или любую другую 5'-UTR или другой 5'-UTR-элемент. Аналогично этому, например, искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, которая содержит 5'-UTR-элемент, предлагаемый в настоящем изобретении, т.е. 5'-UTR-элемент, который обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, может дополнительно содержать любую дополнительную 3'-UTR и/или любую дополнительную 5'-UTR, в частности, дополнительную 3'-UTR, например, 3'-UTR, полученную из 3'-UTR гена альбумина, наиболее предпочтительно 3'-UTR, содержащую последовательность, представленную в SEQ ID NO: 206 или 207, прежде всего SEQ ID NO: 207, или любую другую 3'-UTR или другой 3'-UTR-элемент.However, primarily in cases (II) and (III), but possibly also in case (I), the artificial nucleic acid molecule of the present invention may additionally contain one or more "additional 3'-UTRs -elements and/or 5'-UTR-elements", i. e. 3'UTR elements and/or 5'UTR elements that do not meet the requirements described above. For example, an artificial nucleic acid molecule of the invention that contains a 3'-UTR element of the invention, i.e. The 3'-UTR element that provides high translation efficiency of said artificial nucleic acid molecule may further comprise any additional 3'-UTR and/or any additional 5'-UTR, in particular an additional 5'-UTR, for example, 5' -TOP UTR, or any other 5'-UTR or other 5'-UTR element. Similarly, for example, an artificial nucleic acid molecule according to the invention, which contains a 5'-UTR element according to the present invention, ie. The 5'-UTR element that provides high translation efficiency of said artificial nucleic acid molecule may further comprise any additional 3'-UTR and/or any additional 5'-UTR, in particular an additional 3'-UTR, for example, 3' -UTR derived from the 3'-UTR of the albumin gene, most preferably a 3'-UTR containing the sequence shown in SEQ ID NO: 206 or 207, especially SEQ ID NO: 207, or any other 3'-UTR or other 3 '-UTR element.

Если помимо предлагаемого в изобретении по меньшей мере одного 5'-UTR-элемента и/или предлагаемого в изобретении по меньшей мере одного 3'-UTR-элемента, который обеспечивает высокую эффективность трансляции, в искусственной молекуле нуклеиновой кислоты, предлагаемой в изобретении, присутствуют дополнительная 3'-UTR (элемент) и/или дополнительная 5'-UTR (элемент), то дополнительная 5'-UTR (элемент) и/или дополнительная 3'-UTR (элемент) могут взаимодействовать с предлагаемым в изобретении 3'-UTR-элементом и/или предлагаемым в изобретении 5'-UTR-элементом и, таким образом, поддерживать воздействие на эффективность трансляции предлагаемого в изобретении 3'-UTR-элемента и/или предлагаемого в изобретении 5'-UTR-элемента соответственно. Такие дополнительная 3'-UTR и/или 5'-UTR (элементы) могут дополнительно поддерживать стабильность и эффективность трансляции. Кроме того, если в искусственной молекуле нуклеиновой кислоты, предлагаемой в изобретении, присутствуют оба, и предлагаемый в изобретении 3'-UTR-элемент, и предлагаемый в изобретении 5'-UTR-элемент, то предпочтительно имеет место синергетический эффект на воздействие предлагаемого в изобретении 3'-UTR-элемента и/или предлагаемого в изобретении 5'-UTR-элемента в отношении обеспечения эффективности трансляции.If, in addition to the inventive at least one 5'-UTR element and/or the inventive at least one 3'-UTR element that provides high translation efficiency, an additional 3'-UTR (element) and/or additional 5'-UTR (element), then additional 5'-UTR (element) and/or additional 3'-UTR (element) can interact with the inventive 3'-UTR- element and/or inventive 5'-UTR element and thus maintain an impact on translation efficiency of the inventive 3'-UTR element and/or inventive 5'-UTR element, respectively. Such additional 3'-UTR and/or 5'-UTR (elements) may further support translational stability and efficiency. In addition, if both the inventive 3'-UTR element and the inventive 5'-UTR element are present in the artificial nucleic acid molecule of the invention, there is preferably a synergistic effect on the effect of the inventive 3'UTR element and/or proposed in the invention 5'UTR element in terms of ensuring translation efficiency.

Предпочтительно дополнительная 3'-UTR содержит или состоит из нуклеотидной последовательности, которая получена из 3'-UTR гена, выбранного из группы, которая состоит из гена альбумина, гена α-глобина, гена β-глобина, гена тирозингидроксилазы, гена липоксигеназы и гена коллагена альфа, такого как ген коллагена альфа 1(I), или из варианта 3'-UTR гена, выбранного из группы, которая состоит из гена альбумина, гена α-глобина, гена β-глобина, гена тирозингидроксилазы, гена липоксигеназы и гена коллагена альфа, такого как ген коллагена альфа 1(I), представленных в SEQ ID NO: 1369-1390 заявки на патент WO 2013/143700, содержание которой включено в настоящее описание в качестве ссылки. В наиболее предпочтительном варианте осуществления изобретения другая 3'-UTR содержит или состоит из нуклеотидной последовательности, которая получена из 3'-UTR гена альбумина, предпочтительно гена альбумина позвоночного, более предпочтительно гена альбумина млекопитающего, наиболее предпочтительно человеческого гена альбумина, имеющего SEQ ID NO: 206:Preferably, the additional 3'-UTR contains or consists of a nucleotide sequence that is derived from the 3'-UTR of a gene selected from the group consisting of an albumin gene, an α-globin gene, a β-globin gene, a tyrosine hydroxylase gene, a lipoxygenase gene, and a collagen gene. alpha, such as the alpha 1(I) collagen gene, or from a 3'-UTR variant of a gene selected from the group consisting of an albumin gene, an α-globin gene, a β-globin gene, a tyrosine hydroxylase gene, a lipoxygenase gene, and a collagen alpha gene such as the alpha 1(I) collagen gene shown in SEQ ID NO: 1369-1390 of patent application WO 2013/143700, the contents of which are incorporated herein by reference. In a most preferred embodiment, the other 3'UTR comprises or consists of a nucleotide sequence that is derived from the 3'UTR of an albumin gene, preferably a vertebrate albumin gene, more preferably a mammalian albumin gene, most preferably a human albumin gene, having SEQ ID NO: 206:

SEQ ID NO: 206:SEQ ID NO: 206:

Figure 00000231
Figure 00000231

Figure 00000232
Figure 00000232

(3'-UTR человеческого альбумина; соответствующая SEQ ID NO: 1369, представленной в заявке на патент WO 2013/143700).(3'-UTR of human albumin; corresponding to SEQ ID NO: 1369 presented in patent application WO 2013/143700).

В другом наиболее предпочтительном варианте осуществления изобретения другая 3'-UTR содержит или состоит из нуклеотидной последовательности, которая получена из 3'-UTR гена α-глобина, предпочтительно гена α- или β-глобина позвоночного, более предпочтительно гена α- или β-глобина млекопитающего, наиболее предпочтительно человеческого гена α- или β-глобина, имеющего SEQ ID NO: 1370, представленную в заявке на патент WO 2013/143700 (3'-UTR гемоглобина альфа 1 (НВА1) Homo sapiens), или SEQ ID NO: 1371, представленную в заявке на патент WO 2013/143700 (3'-UTR гемоглобина альфа 2 (НВА2) Homo sapiens), и/или SEQ ID NO: 1372, представленную в заявке на патент WO 2013/143700 (3'-UTR гемоглобина бета (НВВ) Homo sapiens).In another most preferred embodiment of the invention, the other 3'UTR comprises or consists of a nucleotide sequence that is derived from the 3'UTR of an α-globin gene, preferably a vertebrate α- or β-globin gene, more preferably an α- or β-globin gene. a mammalian, most preferably a human α- or β-globin gene having SEQ ID NO: 1370 of patent application WO 2013/143700 (Hemoglobin alpha 1 (HBA1) 3'UTR of Homo sapiens), or SEQ ID NO: 1371 , presented in patent application WO 2013/143700 (3'-UTR of hemoglobin alpha 2 (HBA2) Homo sapiens), and/or SEQ ID NO: 1372, presented in patent application WO 2013/143700 (3'-UTR of hemoglobin beta (NVV) Homo sapiens).

Например, дополнительная 3'-UTR может содержать или состоять из центрального, α-комплекс-связывающего фрагмента 3'-UTR гена α-глобина, имеющего SEQ ID NO: 1393, представленную в заявке на патент WO 2013/143700.For example, the additional 3'-UTR may contain or consist of the central, α-complex-binding fragment of the 3'-UTR of the α-globin gene having SEQ ID NO: 1393, presented in patent application WO 2013/143700.

В этом контексте наиболее предпочтительно, когда предлагаемая в изобретении молекула нуклеиновой кислоты содержит дополнительный 3'-UTR-элемент, полученный из нуклеиновых кислот, имеющих SEQ ID NO: 1369-1390, которые представлены в заявке на патент WO 2013/143700, или их фрагментов, гомологов или вариантов.In this context, it is most preferred that the nucleic acid molecule according to the invention contains an additional 3'-UTR element derived from nucleic acids having SEQ ID NO: 1369-1390, which are presented in patent application WO 2013/143700, or fragments thereof. , homologues or variants.

Наиболее предпочтительно дополнительная 3'-UTR содержит нуклеотидную последовательность, полученную из фрагмента человеческого гена альбумина, имеющего SEQ ID NO: 207:Most preferably, the additional 3'-UTR contains a nucleotide sequence derived from the human albumin gene fragment having SEQ ID NO: 207:

SEQ ID NO: 207:SEQ ID NO: 207:

Figure 00000233
Figure 00000233

Figure 00000234
Figure 00000234

(3'-UTR. альбумина7; соответствующая SEQ ID NO: 1376, представленной в заявке на патент WO 2013/143700)(3'-UTR. albumin7; corresponding to SEQ ID NO: 1376 of patent application WO 2013/143700)

В этом контексте наиболее предпочтительно, когда дополнительная 3'-UTR предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты содержит или состоит из нуклеотидной последовательности, имеющей SEQ ID NO: 207, или соответствующей последовательности РНК.In this context, it is most preferred that the additional 3'-UTR of the artificial nucleic acid molecule of the invention comprises or consists of a nucleotide sequence having SEQ ID NO: 207 or a corresponding RNA sequence.

В некоторых вариантах осуществления изобретения дополнительная 3'-UTR содержит или состоит из нуклеотидной последовательности, полученной из гена, кодирующего рибосомальный белок, предпочтительно описанного в международных заявках на патент WO 2015/101414 или WO 2015/101415, содержание которых включено в настоящее описание в качестве ссылки.In some embodiments, the additional 3'-UTR comprises or consists of a nucleotide sequence derived from a gene encoding a ribosomal protein, preferably described in International Patent Applications WO 2015/101414 or WO 2015/101415, the content of which is incorporated herein as links.

Дополнительная 3'-UTR может также содержать или состоять из нуклеотидной последовательности, полученной из гена, кодирующего рибосомальный белок, где гены, кодирующие рибосомальный белок, из которых можно получать дополнительную 3'-UTR, включают (но, не ограничиваясь только ими) гены рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка, большой субъединицы, Р0 (RPLP0), рибосомального белка, большой субъединицы, P1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S4, Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15a (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка L10a (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA), продукта 1 слияния: остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли, белка 1, подобного рибосомальному белку L22 (RPL22L1), белка, подобного рибосомальному белку L39 (RPL39L), белка, подобного рибосомальному белку L10 (RPL10L), белка, подобного рибосомальному белку L36a (RPL36AL), белка, подобного рибосомальному белку L3 (RPL3L), белка, подобного рибосомальному белку S27 (RPS27L), белка 1, подобного рибосомальному белку L26 1 (RPL26L1), белка 1, подобного рибосомальному белку L7 (RPL7L1), псевдогена рибосомального белка L13a (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена 11 рибосомального белка S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка, большой субъединицы, Р0 (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14).The additional 3'-UTR may also comprise or consist of a nucleotide sequence derived from a gene encoding a ribosomal protein, wherein the genes encoding the ribosomal protein from which the additional 3'-UTR can be derived include, but are not limited to, ribosomal protein genes. protein L9 (RPL9), ribosomal protein L3 (RPL3), ribosomal protein L4 (RPL4), ribosomal protein L5 (RPL5), ribosomal protein L6 (RPL6), ribosomal protein L7 (RPL7), ribosomal protein L7a (RPL7A), ribosomal protein L11 (RPL11), ribosomal protein L12 (RPL12), ribosomal protein L13 (RPL13), ribosomal protein L23 (RPL23), ribosomal protein L18 (RPL18), ribosomal protein L18a (RPL18A), ribosomal protein L19 (RPL19), ribosomal protein L21 (RPL21), ribosomal protein L22 (RPL22), ribosomal protein L23a (RPL23A), ribosomal protein L17 (RPL17), ribosomal protein L24 (RPL24), ribosomal protein L26 (RPL26), ribosomal protein L27 (RPL27), ribosomal ribosomal protein L30 (RPL30), ribosomal protein L27a (RPL27A), ribosomal protein L28 (RPL28), ribosomal protein L29 (RPL29), ribosomal protein L31 (RPL31), ribosomal protein L32 (RPL32), ribosomal protein L35a (RPL35A), ribosomal protein L37 (RPL37), ribosomal protein L37a (RPL37A), ribosomal protein L38 (RPL38), ribosomal protein L39 (RPL39), ribosomal protein, large subunit, P0 (RPLP0), ribosomal protein, large subunit, P1 (RPLP1), ribosomal protein, large subunit, P2 (RPLP2), ribosomal protein S3 (RPS3), ribosomal protein S3A (RPS3A), ribosomal protein S4, X-linked (RPS4X), ribosomal protein S4, Y-linked 1 (RPS4Y1), ribosomal protein S5 (RPS5), ribosomal protein S6 (RPS6), ribosomal protein S7 (RPS7), ribosomal protein S8 (RPS8), ribosomal protein S9 (RPS9), ribosomal protein S10 (RPS10), ribosomal protein S11 (RPS11), ribosomal protein S12 ( RPS12), ribosomal protein S13 (RPS13), rib osomal protein S15 (RPS15), ribosomal protein S15a (RPS15A), ribosomal protein S16 (RPS16), ribosomal protein S19 (RPS19), ribosomal protein S20 (RPS20), ribosomal protein S21 (RPS21), ribosomal protein S23 (RPS23), ribosomal ribosomal protein S25 (RPS25), ribosomal protein S26 (RPS26), ribosomal protein S27 (RPS27), ribosomal protein S27a (RPS27a), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29), ribosomal protein L15 (RPL15), ribosomal protein S2 (RPS2), ribosomal protein L14 (RPL14), ribosomal protein S14 (RPS14), ribosomal protein L10 (RPL10), ribosomal protein L10a (RPL10A), ribosomal protein L35 (RPL35), ribosomal protein L13a (RPL13A), ribosomal protein L36 (RPL36), ribosomal protein L36a (RPL36A), ribosomal protein L41 (RPL41), ribosomal protein S18 (RPS18), ribosomal protein S24 (RPS24), ribosomal protein L8 (RPL8), ribosomal protein L34 (RPL34), ribosomal protein S17 ( RPS17), ribosomal th protein SA (RPSA), fusion product 1: ubiquitin residue A-52-ribosomal protein (UBA52), ubiquitously expressed (FAU) mouse Finkel-Biskeys-Reilly sarcoma virus, protein 1, like ribosomal protein L22 (RPL22L1), protein, ribosomal L39-like protein (RPL39L), ribosomal protein L10-like protein (RPL10L), ribosomal protein L36a-like protein (RPL36AL), ribosomal protein L3-like protein (RPL3L), ribosomal protein S27-like protein (RPS27L), protein 1 ribosomal protein L26-like 1 (RPL26L1), ribosomal protein L7-like protein 1 (RPL7L1), ribosomal protein L13a pseudogene (RPL13AP), ribosomal protein L37a pseudogene 8 (RPL37AP8), ribosomal protein S10 pseudogene 5 (RPS10P5), ribosomal pseudogene 11 protein S26 (RPS26P11), pseudogene 5 ribosomal protein L39 (RPL39P5), pseudogene 6 ribosomal protein, large subunit, P0 (RPLP0P6) and pseudogene 14 ribosomal protein L36 (RPL36P14).

Предпочтительно, дополнительная 5'-UTR содержит или состоит из нуклеотидной последовательности, которая получена из 5'-UTR ТОР-гена, или которая получена из фрагмента, гомолога или варианта 5'-UTR ТОР-гена.Preferably, the additional 5'UTR contains or consists of a nucleotide sequence that is derived from the 5'UTR of the TOP gene, or that is derived from a fragment, homologue or variant of the 5'UTR of the TOP gene.

Наиболее предпочтительно, чтобы 5'-UTR-элемент не содержал ТОР-мотив или 5'-ТОР, указанный выше. В частности, предпочтительно, чтобы 5'-UTR ТОР-гена представляла собой 5'-UTR ТОР-гена без ТОР-мотива.Most preferably, the 5'UTR element does not contain the TOP motif or 5'TOP as defined above. In particular, it is preferred that the 5'UTR of the TOP gene is the 5'UTR of the TOP gene without a TOP motif.

Нуклеотидную последовательность, которая происходит из 5'UTR ТОР-гена, получают из эукариотического ТОР-гена, предпочтительно ТОР-гена растения или животного, более предпочтительно ТОР-гена хордовых, еще более предпочтительно ТОР-гена позвоночных, наиболее предпочтительно ТОР-гена млекопитающих, такого как человеческий ТОР-ген.The nucleotide sequence which is derived from the 5'UTR of the TOP gene is derived from a eukaryotic TOP gene, preferably a plant or animal TOP gene, more preferably a chordate TOP gene, even more preferably a vertebrate TOP gene, most preferably a mammalian TOP gene, such as the human TOR gene.

Например, дополнительный 5'UTR-элемент предпочтительно выбирают из 5'-UTR-элементов, содержащих или состоящих из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, выбранной из группы, состоящей из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, описание которой включено в настоящее описание в качестве ссылки, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта или предпочтительно из соответствующей последовательности РНК. Понятие «гомологи SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленные в заявке на патент WO 2013/143700» относится к последовательностям из видов кроме Homo sapiens, которые гомологичны последовательностям SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленным в заявке на патент WO 2013/143700.For example, the additional 5'UTR element is preferably selected from 5'UTR elements containing or consisting of a nucleotide sequence that is derived from a nucleotide sequence selected from the group consisting of SEQ ID NO: 1-1363, SEQ ID NO: 1395 , SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, the description of which is incorporated herein by reference, from the homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from its variant or preferably from the corresponding RNA sequence. The term "homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700" refers to sequences from species other than Homo sapiens that are homologous the sequences SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700.

В предпочтительном варианте осуществления изобретения дополнительная 5'UTR содержит или состоит из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, простирающейся от нуклеотидного положения 5 (т.е. нуклеотида, находящегося в последовательности в положении 5) до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности, выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК. Наиболее предпочтительно дополнительную 5' UTR получают из нуклеотидной последовательности, простирающейся от нуклеотидного положения, непосредственно примыкающего с 3'-стороны к 5'-ТОР, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК.In a preferred embodiment of the invention, the additional 5'UTR contains or consists of a nucleotide sequence that is derived from a nucleotide sequence extending from nucleotide position 5 (i.e., the nucleotide located in position 5 in the sequence) to the nucleotide position immediately adjacent to 5' - side to the start codon (located at the 3' end of the sequences), for example, to the nucleotide position immediately adjacent on the 5' side to the ATG sequence of the nucleotide sequence selected from SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 of patent application WO 2013/143700 from homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from its variant, or the corresponding RNA sequence. Most preferably, the additional 5' UTR is derived from a nucleotide sequence extending from the nucleotide position immediately 3'-side of the 5'-TOP to the nucleotide position immediately 5'-side of the start codon (located at the 3'-end sequences), for example, to the nucleotide position immediately adjacent on the 5' side to the ATG sequence of the nucleotide sequence selected from SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from the homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700, from its variant , or the corresponding RNA sequence.

В наиболее предпочтительном варианте осуществления изобретения дополнительная 5'-UTR содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена, кодирующего рибосомальный белок, или из варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок. Например, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, полученной из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359 или 1360, представленных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива. Как описано выше, последовательность, простирающаяся от положения 5 до нуклеотида, непосредственно примыкающего с 5'-стороны к ATG (который находится на 3'-конце последовательностей), соответствует 5'-UTR указанных последовательностей.In the most preferred embodiment of the invention, the additional 5'-UTR contains or consists of a nucleotide sequence derived from the 5'-UTR of the TOP gene encoding the ribosomal protein, or from the variant 5'-UTR of the TOP gene encoding the ribosomal protein. For example, the 5'-UTR element contains or consists of a nucleotide sequence derived from the 5'-UTR nucleotide sequence shown in any of SEQ ID NOs: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1313, 1313. 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1338, 1338, 1338. 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359, or 1360 patent application20 143700 corresponding to the RNA sequence, its homologue or its variant presented in the present description, preferably without the 5'-TOP motif. As described above, the sequence extending from position 5 to the nucleotide immediately adjacent 5' to the ATG (which is at the 3' end of the sequences) corresponds to the 5' UTR of the indicated sequences.

Предпочтительно дополнительная 5'UTR содержит или состоит из нуклеотидной последовательности, которая происходит из 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL), или из гомолога или варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL). Например, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 и 1422, описанных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива.Preferably, the additional 5'UTR contains or consists of a nucleotide sequence that is derived from the 5'UTR of the TOP gene encoding the ribosomal large subunit protein (RPL) or from a homologue or variant of the 5'UTR of the TOP gene encoding the ribosomal large subunit protein (RPL). For example, the 5'-UTR element contains or consists of a nucleotide sequence derived from the 5'-UTR nucleotide sequence shown in any of SEQ ID NOs: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 and 1422 described in patent application WO 2013/143700 corresponding to the RNA sequence, its homologue or its variant presented in the present description, preferably without a 5'-TOP motif.

В наиболее предпочтительном варианте осуществления изобретения 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, или из варианта 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, где предпочтительно дополнительная 5'-UTR не содержит 5'-ТОР указанного гена.In a most preferred embodiment, the 5'-UTR element comprises or consists of a nucleotide sequence derived from the 5'-UTR of the large subunit 32 ribosomal protein gene, preferably from the vertebrate large subunit 32 ribosomal protein (L32) gene, more preferably the ribosomal protein gene mammalian 32 large subunit (L32) ribosomal protein gene, most preferably from the human 32 large subunit ribosomal protein (L32) protein gene, or from the 5'-UTR variant of the 32 large subunit ribosomal protein gene, preferably from the vertebrate 32 large subunit ribosomal protein (L32) protein gene, more preferably from a mammalian 32 large subunit ribosomal protein (L32) gene, most preferably from a human 32 large subunit ribosomal protein (L32) gene, where preferably the additional 5'-UTR does not contain the 5'-TOP of said gene.

Следовательно, в наиболее предпочтительном варианте осуществления изобретения, дополнительная 5'-UTR содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 208 (5'-UTR рибосомального белка большой субъединицы 32 человека без 5'-концевого олигопиримидинового тракта:Therefore, in the most preferred embodiment of the invention, the additional 5'-UTR contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 208 (5'-UTR of human large subunit 32 ribosomal protein without 5'-oligopyrimidine tract:

Figure 00000235
(SEQ ID NO: 208); соответствующая SEQ ID NO: 1368, указанной в заявке на патент WO 2013/143700) или предпочтительно соответствующей последовательности РНК, или где по меньшей мере одна дополнительная 5'UTR содержит или состоит из фрагмента нуклеотидной последовательности, идентичного по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 208, или более предпочтительно соответствующей последовательности РНК, где предпочтительно фрагмент представляет собой описанный выше фрагмент, непрерывный сегмент нуклеотидов, представляющий собой по меньшей мере 20% и т.д. полноразмерной 5'-UTR. Предпочтительно фрагмент имеет длину по меньшей мере примерно 20 нуклеотидов или более, предпочтительно по меньшей мере примерно 30 нуклеотидов или более, более предпочтительно по меньшей мере примерно 40 нуклеотидов или более. Предпочтительно фрагмент представляет собой функциональный фрагмент, представленный в настоящем описании.
Figure 00000235
(SEQ ID NO: 208); corresponding to SEQ ID NO: 1368 specified in patent application WO 2013/143700) or preferably the corresponding RNA sequence, or where at least one additional 5'UTR contains or consists of a fragment of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 208, or more preferably the corresponding RNA sequence, where preferably the fragment is the fragment described above, a continuous segment of nucleotides representing at least 20%, etc. full-length 5'-UTR. Preferably, the fragment is at least about 20 nucleotides or more in length, preferably at least about 30 nucleotides or more, more preferably at least about 40 nucleotides or more. Preferably the fragment is a functional fragment, presented in the present description.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит дополнительную 5'-UTR, которая содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена позвоночных, например, млекопитающих, например, ТОР-гена человека, выбранного из RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLP0, RPLP1, RPLP2, RPLP3, RPLP0, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, РАВРС1, HNRNPA1, ТРТ1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB или из его гомолога или варианта, где предпочтительно дополнительная 5'-UTR не содержит ТОР-мотив или 5'-ТОР указанных генов, и где необязательно 5'-UTR-элемент начинается на своем 5'-конце с нуклеотида, находящегося в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 по ходу транскрипции относительно 5'-концевого олигопиримидинового тракта (ТОР), и где необязательно также дополнительная 5'-UTR, происходящая из 5'-UTR ТОР-гена, заканчивается на своем 3'-конце нуклеотидом, находящимся в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 в обратном направлении относительно стартового кодона (A(U/T)G) гена, из которого она происходит.In some embodiments, the artificial nucleic acid molecule comprises an additional 5'-UTR that contains or consists of a nucleotide sequence derived from the 5'-UTR of a vertebrate, e.g., mammalian TOP gene, e.g., a human TOP gene selected from RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL41, RPL40 RPLP0, RPLP1, RPLP2, RPLP3, RPLP0, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, TUBB1 , UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB, or from a homologue or variant thereof, where preferably the additional 5'-UTR does not contain the TOP motif or 5'-TOP of these genes, and where optionally the 5'-UTR element begins with at its 5' end from a nucleotide at position 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 downstream of the 5' oligopyrimidine tract (TOP), and where optionally also an additional 5 '-UTR, derived from the 5'-UTR of the TOP gene, ends at its 3'-end with a nucleotide located at position 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 in the opposite direction from the start codon (A(U/T)G) of the gene from which it originates.

В конкретных вариантах осуществления изобретения дополнительная 5'-UTR содержит или состоит из нуклеотидной последовательности, которая получена из 5'-UTR, описанной в международной заявке на патент WO 2016/107877, содержание которой включено в настоящее описание в качестве ссылки.In specific embodiments, the additional 5'-UTR comprises or consists of a nucleotide sequence that is derived from the 5'-UTR described in International Patent Application WO 2016/107877, the contents of which are incorporated herein by reference.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может представлять собой РНК, такую как мРНК или вирусная РНК, или репликон, ДНК, такую как плазмидная ДНК или вирусная ДНК, или может представлять собой модифицированную молекулу РНК или ДНК. Она может представлять собой двухцепочечную молекулу, имеющую смысловую цепь и антисмысловую цепь, например, молекулу ДНК, имеющую смысловую цепь и антисмысловую цепь.The artificial nucleic acid molecule of the present invention may be RNA such as mRNA or viral RNA or replicon, DNA such as plasmid DNA or viral DNA, or may be a modified RNA or DNA molecule. It may be a double-stranded molecule having a sense strand and an antisense strand, such as a DNA molecule having a sense strand and an antisense strand.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, необязательно может содержать также 5'-кэп. Необязательный 5'-кэп предпочтительно локализован с 5'-стороны относительно ОРС, более предпочтительно с 5'-стороны относительно по меньшей мере одной 5'-UTR или любой дополнительной 5'-UTR в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении.The artificial nucleic acid molecule of the present invention may optionally also contain a 5' cap. The optional 5' cap is preferably located 5' to the ORF, more preferably 5' to at least one 5'UTR or any additional 5'UTR in the artificial nucleic acid molecule of the present invention.

Предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность и/или сигнал полиаденилирования. Предпочтительно необязательная поли(А)-последовательность локализована с 3'-стороны относительно по меньшей мере одного 3'-UTR-элемента или любой дополнительной 3'-UTR, более предпочтительно необязательная поли(А)-последовательность соединена с 3'-концом 3'-UTR-элемента. Соединение может быть непосредственным или косвенным, например, с помощью сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, например, с помощью линкера, состоящего из 1-50, предпочтительно 1-20 нуклеотидов, например, содержащего или состоящего из одного или большего количества сайтов рестрикции. Однако, даже если искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, не содержит 3'-UTR, например, если она содержит только по меньшей мере один 5'-UTR-элемент, то предпочтительно она все же содержит поли(А)-последовательность и/или сигнал полиаденилирования.Preferably, the artificial nucleic acid molecule of the present invention also contains a poly(A) sequence and/or a polyadenylation signal. Preferably the optional poly(A) sequence is located 3' to at least one 3' UTR element or any additional 3' UTR, more preferably the optional poly(A) sequence is fused to the 3' end of the 3' -UTR element. The connection can be direct or indirect, for example, using a segment consisting of 2, 4, 6, 8, 10, 20, etc. nucleotides, for example, using a linker consisting of 1-50, preferably 1-20 nucleotides, for example, containing or consisting of one or more restriction sites. However, even if the artificial nucleic acid molecule of the present invention does not contain a 3'-UTR, for example, if it contains only at least one 5'-UTR element, it preferably still contains the poly(A) sequence and/or a polyadenylation signal.

В одном из вариантов осуществления изобретения необязательный сигнал полиаденилирования расположен по ходу транскипции с 3'-стороны 3'-UTR-элемента. Предпочтительно сигнал полиаденилирования содержит консенсусную последовательность NN(U/T)ANA, в которой N = А или U, предпочтительно AA(U/T)AAA или A(U/T)(U/T)AAA. Такая консенсусная последовательность может распознаваться большинством клеточных систем животных и бактериальных клеточных систем, например, факторами полиаденилирования, такими как фактор специфичности расщепления/полиаденилирования (CPSF), в сочетании с CstF, PAP, РАВ2, CFI и/или CFII. Предпочтительно сигнал полиаденилирования, предпочтительно представляющий собой консенсусную последовательность NNUANA, расположен на расстоянии менее чем примерно 50 нуклеотидов, более предпочтительно менее чем примерно 30 оснований, наиболее предпочтительно менее чем примерно 25 оснований, например, на расстоянии 21 основания, по ходу транскрипции относительно 3'-конца 3'-UTR-элемента или ОРС, если не присутствует 3'-UTR-элемент.In one embodiment of the invention, the optional polyadenylation signal is located downstream of the transcription from the 3' side of the 3' UTR element. Preferably, the polyadenylation signal contains the NN(U/T)ANA consensus sequence in which N=A or U, preferably AA(U/T)AAA or A(U/T)(U/T)AAA. Such a consensus sequence can be recognized by most animal cell systems and bacterial cell systems, for example, polyadenylation factors such as cleavage/polyadenylation specificity factor (CPSF) in combination with CstF, PAP, PAB2, CFI and/or CFII. Preferably, the polyadenylation signal, preferably the NNUANA consensus sequence, is less than about 50 nucleotides away, more preferably less than about 30 bases, most preferably less than about 25 bases, e.g., 21 bases downstream of transcription from 3'- the end of the 3'UTR element, or ORF if no 3'UTR element is present.

Транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, содержащей сигнал полиаденилирования, расположенный по ходу транскрипции относительно 3'-UTR-элемента (или ОРС), должна приводить к получению незрелой РНК, содержащей сигнал полиаденилирования, по ходу транскрипции относительно ее 3'-UTR-элемента (или ОРС).Transcription of an artificial nucleic acid molecule of the present invention, for example, an artificial DNA molecule containing a polyadenylation signal downstream of the 3'UTR element (or ORF), should result in an immature RNA containing a polyadenylation signal downstream. transcription relative to its 3'-UTR element (or ORF).

Затем при использовании соответствующей системы транскрипции должно происходить присоединение поли(А)-последовательности к незрелой РНК. Например, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, содержащую 3'-UTR-элемент, описанный выше, и сигнал полиаденилирования, который может приводить к полиаденилированию РНК после транскрипции указанной молекулы ДНК. Следовательно, образовавшаяся РНК может содержать комбинацию предлагаемого в изобретении 3'-UTR-элемента, за которым располагается поли(А)-последовательность.The addition of the poly(A) sequence to the immature RNA must then occur using an appropriate transcription system. For example, an artificial nucleic acid molecule according to the invention may be a DNA molecule containing a 3'-UTR element as described above and a polyadenylation signal that can lead to RNA polyadenylation after transcription of said DNA molecule. Therefore, the resulting RNA may contain a combination of the 3'UTR element of the invention followed by the poly(A) sequence.

Возможными системами транскрипции являются системы транскрипции in vitro или клеточные системы транскрипции и т.д. Таким образом, транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, например, транскрипция искусственной молекулы нуклеиновой кислоты, содержащей открытую рамку считывания, 3'-UTR-элемент и/или 5'-UTR-элемент и необязательно сигнал полиаденилирования, может приводить к получению молекулы мРНК, содержащей открытую рамку считывания, 3'-UTR-элемент и необязательно поли(А)-последовательность.Possible transcription systems are in vitro transcription systems or cellular transcription systems, etc. Thus, transcription of an artificial nucleic acid molecule of the invention, for example, transcription of an artificial nucleic acid molecule containing an open reading frame, a 3'-UTR element and/or a 5'-UTR element, and optionally a polyadenylation signal, can result in an mRNA molecule containing an open reading frame, a 3'-UTR element, and optionally a poly(A) sequence.

Таким образом, в изобретении предложена также искусственная молекула нуклеиновой кислоты, которая представляет собой молекулу мРНК, содержащую открытую рамку считывания, 3'-UTR-элемент, описанный выше, и/или 5'-UTR-элемент, описанный выше, и необязательно поли(А)-последовательность.Thus, the invention also provides an artificial nucleic acid molecule, which is an mRNA molecule containing an open reading frame, a 3'-UTR element as described above, and/or a 5'-UTR element as described above, and optionally a poly( A) is a sequence.

В другом варианте осуществления изобретения 3'-UTR искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Кроме того, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Более предпочтительно 3'-UTR искусственной молекулы нуклеиновой кислоты или сама предлагаемая в изобретении искусственная молекула нуклеиновой кислоты не содержит сигнал полиаденилирования, прежде всего не содержит сигнал полиаденилирования AAU/TAAA.In another embodiment, the 3'UTR of the artificial nucleic acid molecule of the invention does not contain a polyadenylation signal or a poly(A) sequence. In addition, preferably the artificial nucleic acid molecule of the invention does not contain a polyadenylation signal or a poly(A) sequence. More preferably, the 3'-UTR of the artificial nucleic acid molecule, or the artificial nucleic acid molecule itself according to the invention, does not contain a polyadenylation signal, in particular does not contain an AAU/TAAA polyadenylation signal.

В предпочтительном варианте осуществления изобретения предложена искусственная молекула нуклеиновой кислоты, которая представляет собой искусственную молекулу РНК, содержащую открытую рамку считывания и последовательность РНК, соответствующую последовательности ДНК, выбранной из группы, которая состоит из последовательностей, представленных в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (в альтернативном варианте SEQ ID NO: 3), SEQ ID NO: 138 (в альтернативном варианте SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (в альтернативном варианте SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (в альтернативном варианте SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (в альтернативном варианте SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (в альтернативном варианте SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (в альтернативном варианте SEQ ID NO: 109), SEQ ID NO: 148 (в альтернативном варианте SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (в альтернативном варианте SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (в альтернативном варианте SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125 или ее фрагмент, описанный выше. Кроме того, предложена соответствующая искусственная молекула ДНК.In a preferred embodiment, the invention provides an artificial nucleic acid molecule, which is an artificial RNA molecule containing an open reading frame and an RNA sequence corresponding to a DNA sequence selected from the group consisting of the sequences shown in SEQ ID NO: 1, SEQ ID NO : 2, SEQ ID NO: 137 (alternatively SEQ ID NO: 3), SEQ ID NO: 138 (alternatively SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO : 15, SEQ ID NO: 140 (alternatively SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternatively SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternatively SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO : 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO : 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternatively SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternatively SEQ ID NO: 109), SEQ ID NO: 148 (alternatively SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119 ), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternatively SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125 or a fragment thereof as described above. In addition, a corresponding artificial DNA molecule has been proposed.

В другом предпочтительном варианте осуществления изобретения предложена искусственная молекула нуклеиновой кислоты, которая представляет собой искусственную молекулу ДНК, содержащую открытую рамку считывания и последовательность, выбранную из группы, которая состоит из последовательностей, представленных в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (в альтернативном варианте SEQ ID NO: 3), SEQ ID NO: 138 (в альтернативном варианте SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (в альтернативном варианте SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (в альтернативном варианте SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (в альтернативном варианте SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (в альтернативном варианте SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (в альтернативном варианте SEQ ID NO: 109), SEQ ID NO: 148 (в альтернативном варианте SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (в альтернативном варианте SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (в альтернативном варианте SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125.In another preferred embodiment, the invention provides an artificial nucleic acid molecule, which is an artificial DNA molecule containing an open reading frame and a sequence selected from the group consisting of the sequences shown in SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternatively SEQ ID NO: 3), SEQ ID NO: 138 (alternatively SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternatively SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternatively SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternatively SEQ ID NO: 52), SEQ ID NO: 53 , SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, S EQ ID NO: 37, SEQ ID NO: 144 (alternatively SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternatively SEQ ID NO: 109), SEQ ID NO: 148 (alternatively SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119 ), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternatively SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125.

Таким образом, в изобретении предложена искусственная молекула нуклеиновой кислоты, которая может служить в качестве матрицы для молекулы РНК, предпочтительно для молекулы мРНК, которая характеризуется высокой эффективностью трансляции. Иными словами, искусственная молекула нуклеиновой кислоты может представлять собой ДНК, которую можно применять в качестве матрицы для получения мРНК. мРНК, которую можно получать таким путем, может, в свою очередь, транслироваться с получением требуемого пептида или белка, кодируемого открытой рамкой считывания. Если искусственная молекула нуклеиновой кислоты представляет собой ДНК, то ее можно, например, использовать в качестве двухцепочечной формы хранения для продолжения и повторения производства мРНК in vitro или in vivo. В данном случае in vitro относится, в частности, к («живым») клеткам и/или ткани, включая ткань живого индивидуума. Клетки включают, в частности, клеточные линии, первичные клетки, клетки в ткани или организме индивидуумов. В конкретных вариантах осуществления изобретения пригодными для применения согласно настоящему изобретению могут быть типы клеток, позволяющие осуществлять культивирование клеток. Наиболее предпочтительными являются клетки млекопитающих, например, человеческие клетки и мышиные клетки. В наиболее предпочтительных вариантах осуществления изобретения применяют человеческие клеточные линии HeLa, HEPG2 и U-937 и мышиные клеточные линии NIH3T3, JAWSII и L929. Кроме того, наиболее предпочтительными являются первичные клетки, в наиболее предпочтительных вариантах осуществления изобретения можно применять человеческие кожные фибробласты (HDF). В альтернативном варианте можно применять также ткань индивидуума.Thus, the invention provides an artificial nucleic acid molecule that can serve as a template for an RNA molecule, preferably an mRNA molecule, which has a high translation efficiency. In other words, the artificial nucleic acid molecule may be DNA, which can be used as a template to obtain mRNA. mRNA that can be obtained in this way can, in turn, be translated to obtain the desired peptide or protein encoded by the open reading frame. If the artificial nucleic acid molecule is DNA, then it can, for example, be used as a double-stranded storage form to continue and repeat the production of mRNA in vitro or in vivo. As used herein, in vitro refers specifically to (“live”) cells and/or tissues, including tissue from a living individual. Cells include, in particular, cell lines, primary cells, cells in a tissue or an individual's body. In specific embodiments of the invention suitable for use according to the present invention may be cell types that allow the cultivation of cells. Most preferred are mammalian cells, eg human cells and mouse cells. In the most preferred embodiments of the invention, human HeLa, HEPG2 and U-937 cell lines and mouse NIH3T3, JAWSII and L929 cell lines are used. In addition, most preferred are primary cells, in the most preferred embodiments of the invention, human dermal fibroblasts (HDF) can be used. Alternatively, tissue from the individual may also be used.

В одном из вариантов осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность. Например, молекула ДНК, содержащая ОРС, за которой необязательно следует 3'-UTR, может содержать состоящий из тимидиновых нуклеотидов сегмент, который может транскрибироваться в поли(А)-последовательность в образующейся мРНК. Длина поли(А)-последовательности может варьироваться. Например, поли(А)-последовательность может иметь длину от примерно 20 адениновых нуклеотидов вплоть до 300 адениновых нуклеотидов, предпочтительно от примерно 40 до примерно 200 адениновых нуклеотидов, более предпочтительно от примерно 50 до примерно 100 адениновых нуклеотидов, например, примерно 60, 70, 80, 90 или 100 адениновых нуклеотидов. Наиболее предпочтительно предлагаемая в изобретении нуклеиновая кислота содержит поли(А)-последовательность, содержащую от примерно 60 до примерно 70 нуклеотидов, наиболее предпочтительно 64 адениновых нуклеотида.In one embodiment, the artificial nucleic acid molecule of the present invention also contains a poly(A) sequence. For example, a DNA molecule containing an ORF, optionally followed by a 3'UTR, may contain a thymidine nucleotide segment that can be transcribed into a poly(A) sequence in the resulting mRNA. The length of the poly(A) sequence may vary. For example, the poly(A) sequence may be from about 20 adenine nucleotides up to 300 adenine nucleotides in length, preferably from about 40 to about 200 adenine nucleotides, more preferably from about 50 to about 100 adenine nucleotides, for example, about 60, 70, 80, 90 or 100 adenine nucleotides. Most preferably, the inventive nucleic acid comprises a poly(A) sequence of about 60 to about 70 nucleotides, most preferably 64 adenine nucleotides.

Искусственные молекулы РНК можно также получать in vitro с помощью обычных методов химического синтеза, при этом не требуется осуществлять транскрипцию с ДНК-предшественника.Artificial RNA molecules can also be produced in vitro using conventional chemical synthesis without the need for transcription from a precursor DNA.

В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляет собой молекулу РНК, предпочтительно молекулу РНК, содержащую в 5'→3'-направлении открытую рамку считывания, 3'-UTR-элемент, описанный выше, и поли(А)-последовательность, или содержащую в 5'→3'-направлении 5'-UTR-элемент, описанный выше, открытую рамку считывания и поли(А)-последовательность.In the most preferred embodiment of the invention, the artificial nucleic acid molecule of the present invention is an RNA molecule, preferably an RNA molecule containing in the 5'→3' direction an open reading frame, a 3'-UTR element as described above, and a poly (A)-sequence, or containing in the 5'→3'-direction 5'-UTR element described above, an open reading frame and poly(A)-sequence.

В предпочтительном варианте осуществления изобретения открытую рамку считывания получают из гена, отличного от гена, из которого получают 3'-UTR-элемент и/или 5'-UTR-элемент предлагаемой в изобретении искусственной нуклеиновой кислоты. В некоторых других предпочтительных вариантах осуществления изобретения открытая рамка считывания не кодирует ген, выбранный из группы, которая состоит из ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, СВХ6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, ЕМР3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (предпочтительно все человеческие) и Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Cel17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (предпочтительно все мышиные), или их вариантов, при условии, что 3'-UTR-элемент и/или 5'-UTR-элемент имеет последовательность, выбранную из группы, которая состоит из последовательностей, представленных в SEQ ID NO: 1-204.In a preferred embodiment of the invention, the open reading frame is derived from a gene other than the gene from which the 3'UTR element and/or the 5'UTR element of the artificial nucleic acid of the invention is derived. In some other preferred embodiments, the open reading frame does not encode a gene selected from the group that consists of ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32 , NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3, FASN, PSMB6, PRSS56, KPNA6, SFT2D2 , PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO , SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA , PCOLCE, MAP1S, VTN, ALDH16A1 (preferably all human) and Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Cel17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (preferably all mice) , or variants thereof, provided that the 3'-UTR element and/or 5'-UTR element has a sequence selected from the group which consists of the sequences shown in SEQ ID NO: 1-204.

В предпочтительном варианте осуществления изобретения ОРС не кодирует рибосомальные белки человека или растения, прежде всего Arabidopsis, прежде всего не кодирует человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL), или рибосомальный белок Arabidopsis S16 (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16) вне зависимости от его происхождения.In a preferred embodiment of the invention, the ORF does not encode human or plant ribosomal proteins, especially Arabidopsis, primarily does not encode human ribosomal protein S6 (RPS6), human ribosomal protein L36a like protein (RPL36AL), or Arabidopsis ribosomal protein S16 (RPS16). In another preferred embodiment, the open reading frame (ORF) does not encode ribosomal protein S6 (RPS6), ribosomal protein L36a (RPL36AL) or ribosomal protein S16 (RPS16), regardless of its origin.

В одном из вариантов осуществления изобретения предложена искусственная молекула ДНК, содержащая открытую рамку считывания, предпочтительно открытую рамку, полученную из гена, отличного от гена, из которого получен 3'-UTR-элемент и/или 5'-UTR-элемент; при этом 3'-UTR-элемент содержит или состоит из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности ДНК, выбранной из группы, которая состоит из последовательностей, представленных в SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (в альтернативном варианте SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, и/или 5'-UTR-элемент содержит или состоит из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности ДНК, выбранной из группы, которая состоит из последовательностей, представленных в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (в альтернативном варианте SEQ ID NO: 3), SEQ ID NO: 138 (в альтернативном варианте SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (в альтернативном варианте SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (в альтернативном варианте SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (в альтернативном варианте SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (в альтернативном варианте SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (в альтернативном варианте SEQ ID NO: 109), SEQ ID NO: 148 (в альтернативном варианте SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (в альтернативном варианте SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (в альтернативном варианте SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125; и сигнал полиаденилирования и/или поли(А)-последовательность.In one embodiment, the invention provides an artificial DNA molecule comprising an open reading frame, preferably an open reading frame, derived from a gene other than the gene from which the 3'-UTR element and/or 5'-UTR element is derived; wherein the 3'-UTR element contains or consists of a sequence identical to at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90 %, even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of a DNA sequence selected from the group consisting of the sequences shown in SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternatively SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, and/or the 5'-UTR element contains or consists of a sequence identity of at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of a DNA sequence selected from the group consisting of the sequences shown in SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternatively SEQ ID NO: 3), SEQ ID NO: 138 (alternatively SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternatively SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternatively SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternatively SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternatively SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternatively SEQ ID NO: 109), SEQ ID NO: 148 (alternatively SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119 ), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternatively SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125; and a polyadenylation signal and/or a poly(A) sequence.

Кроме того, в изобретении предложена искусственная молекула РНК, предпочтительно искусственная молекула мРНК или искусственная молекула вирусной РНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, полученную из гена, отличного от гена, из которого получен 3'-UTR-элемент и/или 5'-UTR-элемент; при этом 3'-UTR-элемент содержит или состоит из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности РНК, которая соответствует последовательности ДНК, выбранной из группы, которая состоит из последовательностей, представленных в SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (в альтернативном варианте SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, и/или 5'-UTR-элемент содержит или состоит из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности РНК, которая соответствует последовательности ДНК, выбранной из группы, которая состоит из последовательностей, представленных в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (в альтернативном варианте SEQ ID NO: 3), SEQ ID NO: 138 (в альтернативном варианте SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (в альтернативном варианте SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (в альтернативном варианте SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (в альтернативном варианте SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (в альтернативном варианте SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (в альтернативном варианте SEQ ID NO: 109), SEQ ID NO: 148 (в альтернативном варианте SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (в альтернативном варианте SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125; и сигнал полиаденилирования и/или поли(А)-последовательность.In addition, the invention provides an artificial RNA molecule, preferably an artificial mRNA molecule or an artificial viral RNA molecule, containing an open reading frame, preferably an open reading frame, derived from a gene other than the gene from which the 3'-UTR element is derived and/or 5'-UTR element; wherein the 3'-UTR element contains or consists of a sequence identical to at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90 %, even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of an RNA sequence that corresponds to a DNA sequence selected from the group consisting of the sequences shown in SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO : 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternatively SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, and/or the 5'-UTR element contains or consists of a sequence identity of at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of an RNA sequence that corresponds to a DNA sequence selected from the group consisting of the sequences shown in SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternatively, SEQ ID NO: 3), SEQ ID NO: 138 (alternatively SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternatively SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternatively SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternatively SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57 , SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternatively SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62 ; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternatively SEQ ID NO: 109), SEQ ID NO: 148 (alternatively SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternatively SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125; and a polyadenylation signal and/or a poly(A) sequence.

В изобретении предложена искусственная молекула нуклеиновой кислоты, предпочтительно искусственная мРНК, которая характеризуется высокой эффективностью трансляции. Не вдаваясь в какую-либо теорию, можно считать, что высокая эффективность трансляции может быть обусловлена снижением расщепления искусственной молекулы нуклеиновой кислоты, такой как искусственная молекула мРНК, предлагаемая в настоящем изобретении. Следовательно, предлагаемый в изобретении 3'-UTR-элемент и/или предлагаемый в изобретении 5'-UTR-элемент может предупреждать расщепление и разложение искусственной нуклеиновой кислоты.The invention provides an artificial nucleic acid molecule, preferably an artificial mRNA, which is characterized by high translation efficiency. Without wishing to be bound by any theory, it is believed that the high efficiency of translation may be due to reduced cleavage of an artificial nucleic acid molecule, such as an artificial mRNA molecule of the present invention. Therefore, the inventive 3'UTR element and/or the inventive 5'UTR element can prevent cleavage and degradation of the artificial nucleic acid.

Предпочтительно искусственная молекула нуклеиновой кислоты может дополнительно содержать гистоновую структуру типа «стебель-петля». Так, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать, например, расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную последовательность гистоновой структуры типа «стебель-петля», необязательную поли(А)-последовательность или сигнал полиаденилирования и необязательную поли(С)-последовательность, или расположенные в 5'→3'-направлении 5'-UTR-элемент, ОРС, необязательную последовательность гистоновой структуры типа «стебель-петля», необязательную поли(А)-последовательность или сигнал полиаденилирования и необязательную поли(С)-последовательность, или расположенные в 5'→3'-направлении 5'-UTR-элемент, ОРС, 3'-UTR-элемент, необязательную последовательность гистоновой структуры типа «стебель-петля», необязательную поли(А)-последовательность или сигнал полиаденилирования и необязательную поли(С)-последовательность. Она может содержать также расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную поли(А)-последовательность, необязательную поли(С)-последовательность и необязательную последовательность гистоновой структуры типа «стебель-петля», или расположенные в 5'→3'-направлении 5'-UTR-элемент, ОРС, необязательную поли(А)-последовательность, необязательную поли(С)-последовательность и необязательную последовательность гистоновой структуры типа «стебель-петля», или расположенные в 5'→3'-направлении 5'-UTR-элемент, ОРС, 3'-UTR-элемент, необязательную поли(А)-последовательность, необязательную поли(С)-последовательность и необязательную последовательность гистоновой структуры типа «стебель-петля.Preferably, the artificial nucleic acid molecule may further comprise a histone stem-loop structure. Thus, an artificial nucleic acid molecule of the present invention may contain, for example, ORFs in the 5'→3' direction, a 3'UTR element, an optional stem-loop histone sequence, an optional poly(A )-sequence or polyadenylation signal and an optional poly(C)-sequence, or located in the 5'→3'-direction of the 5'-UTR element, ORF, an optional stem-loop histone sequence, an optional poly(A) - a polyadenylation sequence or signal and an optional poly(C) sequence, or located in the 5'→3' direction 5'-UTR element, ORF, 3'-UTR element, optional stem-loop histone structure sequence , an optional poly(A) sequence or polyadenylation signal, and an optional poly(C) sequence. It may also contain, in the 5'→3' direction, an ORF, a 3'UTR element, an optional poly(A) sequence, an optional poly(C) sequence, and an optional stem-loop histone sequence, or located in the 5'→3' direction of the 5'UTR element, ORF, an optional poly(A) sequence, an optional poly(C) sequence, and an optional stem-loop histone sequence, or located in the 5' →3'-direction 5'-UTR element, ORF, 3'-UTR element, optional poly(A) sequence, optional poly(C) sequence and optional stem-loop histone structure sequence.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемой в изобретении, дополнительно содержит по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля».In a preferred embodiment of the invention, the artificial nucleic acid molecule of the invention further comprises at least one stem-loop histone sequence.

Такие последовательности гистоновой структуры типа «стебель-петля» предпочтительно выбирают из последовательностей гистоновой структуры типа «стебель-петля», представленных в WO 2012/019780, содержание которой включено в настоящее описание в качестве ссылки.Such histone stem-loop sequences are preferably selected from the stem-loop histone sequences provided in WO 2012/019780, the contents of which are incorporated herein by reference.

Последовательность гистоновой структуры типа «стебель-петля», которую можно применять в настоящем изобретении, предпочтительно выбирают по меньшей мере из одной из следующих формул (I) или (II):The stem-loop histone sequence that can be used in the present invention is preferably selected from at least one of the following formulas (I) or (II):

формула (I) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (I) (stem-loop structure sequence without stem boundary elements):

Figure 00000236
Figure 00000236

формула (II) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (II) (stem-loop structure sequence with stem boundary elements):

Figure 00000237
Figure 00000237

в которых:in which:

Figure 00000238
Figure 00000238

Figure 00000239
Figure 00000239

Figure 00000240
Figure 00000240

гдеwhere

у элементов stem1 и stem2 может происходить спаривание оснований друг с другом с образованием обратно комплементарной последовательности, где спаривание оснований может иметь место между stem1 и stem2, например, посредством спаривания оснований по Уотсону-Крику нуклеотидов А и U/T или G и С, или посредством спаривания оснований не по Уотсону-Крику, например, посредством спаривания «качающихся» оснований («качающегося» спаривания оснований), обратного спариванию оснований по Уотсону-Крику, посредством хугстиновского спаривания оснований, посредством обратного хугстиновскому спаривания оснований, или у них может происходить спаривание оснований друг с другом с образованием частично обратно комплементарной последовательности, при этом неполное спаривание оснований может иметь место между stem1 и stem2, вследствие того, что для одного или нескольких оснований в одном стебле не имеется комплементарного основания в обратно комплементарной последовательности другого стебля.stem1 and stem2 elements can base-pair with each other to form a reverse complementary sequence, where base-pairing can take place between stem1 and stem2, for example, through Watson-Crick base-pairing of nucleotides A and U/T or G and C, or by non-Watson-Crick base-pairing, e.g., by "swinging" base-pairing ("swinging" base-pairing), the reverse of Watson-Crick base-pairing, by Hoogsteen base-pairing, by the reverse of Hoogsteen base-pairing, or they may be pairing bases with each other to form a partially reverse complementary sequence, while incomplete base pairing can occur between stem1 and stem2, due to the fact that one or more bases in one stem do not have a complementary base in the reverse complementary sequence of the other stem.

Согласно другому предпочтительному варианту осуществления изобретения в качестве последовательности гистоновой структуры типа «стебель-петля» можно выбирать последовательность, соответствующую по меньшей мере одной из следующих конкретных формул (Ia) или (IIa):According to another preferred embodiment of the invention, the sequence of the histone stem-loop structure can be selected from at least one of the following specific formulas (Ia) or (IIa):

формула (Ia) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (Ia) (stem-loop structure sequence without stem boundary elements):

Figure 00000241
Figure 00000241

формула (IIa) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (IIa) (stem-loop structure sequence with stem boundary elements):

Figure 00000242
Figure 00000242

в которой:wherein:

N, С, G, T и U имеют указанные выше значения.N, C, G, T and U are as defined above.

Согласно другому предпочтительному варианту осуществления изобретения мРНК, предлагаемая в настоящем изобретении, может содержать или кодировать по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля», соответствующую по меньшей мере одной из следующих конкретных формул (Ib) или (IIb):According to another preferred embodiment of the invention, the mRNA of the present invention may contain or encode at least one stem-loop histone sequence corresponding to at least one of the following specific formulas (Ib) or (IIb):

формула (Ib) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (Ib) (stem-loop structure sequence without stem boundary elements):

Figure 00000243
Figure 00000243

формула (IIb) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (IIb) (stem-loop structure sequence with stem boundary elements):

Figure 00000244
Figure 00000244

в которой:wherein:

N, С, G, Т и U имеют указанные выше значения.N, C, G, T and U are as defined above.

Наиболее предпочтительной последовательностью гистоновой структуры типа «стебель-петля» является последовательность, представленная в

Figure 00000245
или более предпочтительно последовательность РНК, соответствующая нуклеотидной последовательности, представленной в SEQ ID NO: 209.The most preferred sequence of the histone stem-loop structure is the one shown in
Figure 00000245
or more preferably an RNA sequence corresponding to the nucleotide sequence shown in SEQ ID NO: 209.

Например, отдельные элементы могут присутствовать в искусственной молекуле нуклеиновой кислоты в следующем порядке:For example, individual elements may be present in an artificial nucleic acid molecule in the following order:

5'-кэп - 5'-UTR (элемент) - ОРС - 3'-UTR (элемент) - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR (element) - ORF - 3'-UTR (element) - histone stem-loop structure - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR (элемент) - ОРС - 3'-UTR (элемент) - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR (element) - ORF - 3'-UTR (element) - poly(A)/(C)-sequence - histone stem-loop structure;

5'-кэп - 5'-UTR (элемент) - ОРС - IRES - ОРС - 3'-UTR (элемент) - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR (element) - ORF - IRES - ORF - 3'-UTR (element) - histone stem-loop structure - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR (элемент) - ОРС - IRES - ОРС - 3'-UTR (элемент) - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR (element) - ORF - IRES - ORF - 3'-UTR (element) - histone stem-loop structure - poly(A)/(C)-sequence - poly(A )/(C)-sequence;

5'-кэп - 5'-UTR (элемент) - ОРС - IRES - ОРС - 3'-UTR (элемент) - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR (element) - ORF - IRES - ORF - 3'-UTR (element) - poly(A)/(C)-sequence - histone stem-loop structure;

5'-кэп - 5'-UTR (элемент) - ОРС - IRES - ОРС - 3'-UTR (элемент) - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR (element) - ORF - IRES - ORF - 3'-UTR (element) - poly(A)/(C)-sequence - poly(A)/(C)-sequence - histone stem-loop structure;

5'-кэп - 5'-UTR (элемент) - ОРС - 3'-UTR (элемент) - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR (element) - ORF - 3'-UTR (element) - poly(A)/(C)-sequence - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR (элемент) - ОРС - 3'-UTR (элемент) - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»; и т.д.5'-cap - 5'-UTR (element) - ORF - 3'-UTR (element) - poly(A)/(C)-sequence - poly(A)/(C)-sequence - histone stem type structure -the loop"; etc.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит дополнительные элементы, такие как 5'-кэп, поли(С)-последовательность и/или IRES-мотив. 5'-кэп может быть добавлен в процессе транскрипции или после транскрипции к 5'-концу РНК. Кроме того, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, можно модифицировать с помощью последовательности, состоящей по меньшей мере из 10 цитидинов, предпочтительно по меньшей мере из 20 цитидинов, более предпочтительно по меньшей мере из 30 цитидинов (так называемая «поли(С)-последовательность»). В частности, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может содержать, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, поли(С)-последовательность которая, как правило, содержит примерно от 10 до 200 цитозиновых нуклеотидов, предпочтительно примерно от 10 до 100 цитидиновых нуклеотидов, более предпочтительно примерно от 10 до 70 цитидиновых нуклеотидов или еще более предпочтительно примерно от 20 до 50 или даже от 20 до 30 цитидиновых нуклеотидов. Наиболее предпочтительно, предлагаемая в изобретении нуклеиновая кислота содержит поли(С)-последовательность, состоящую из 30 цитидиновых остатков. Так, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит, предпочтительно расположенные в 5'→3' направлении, по меньшей мере один 5'-UTR-элемент, описанный выше, ОРС, по меньшей мере один 3'-UTR-элемент, описанный выше, поли(А)-последовательность или сигнал полиаденилирования и поли(С)-последовательность, или расположенные в 5'→3' направлении необязательно дополнительную 5'-UTR, ОРС, по меньшей мере один 3'-UTR-элемент, описанный выше, поли(А)-последовательность или сигнал полиаденилирования и поли(С)-последовательность, или расположенные в 5'→3' направлении по меньшей мере один 5'-UTR-элемент, описанный выше, ОРС, необязательно дополнительную 3'-UTR, поли(А)-последовательность или сигнал полиаденилирования и поли(С)-последовательность.In some embodiments, the artificial nucleic acid molecule contains additional elements such as a 5' cap, a poly(C) sequence, and/or an IRES motif. The 5' cap can be added during or after transcription to the 5' end of the RNA. In addition, the artificial nucleic acid molecule according to the invention, especially when the nucleic acid is in the form of mRNA or encodes mRNA, can be modified with a sequence of at least 10 cytidines, preferably at least 20 cytidines, more preferably at least 30 cytidines (the so-called "poly(C)-sequence"). In particular, the artificial nucleic acid molecule according to the invention may contain, especially when the nucleic acid is in the form of an mRNA or encodes an mRNA, a poly(C)-sequence which, as a rule, contains from about 10 to 200 cytosine nucleotides, preferably about 10 to 100 cytidine nucleotides, more preferably about 10 to 70 cytidine nucleotides, or even more preferably about 20 to 50 or even 20 to 30 cytidine nucleotides. Most preferably, the nucleic acid according to the invention contains a poly(C) sequence consisting of 30 cytidine residues. Thus, preferably, the artificial nucleic acid molecule of the present invention comprises, preferably located in the 5'→3' direction, at least one 5'-UTR element as described above, an ORF, at least one 3'-UTR- element as described above, poly(A) sequence or polyadenylation signal and poly(C) sequence, or located in the 5'→3' direction optionally additional 5'-UTR, ORF, at least one 3'-UTR element , as described above, a poly(A) sequence or polyadenylation signal and a poly(C) sequence, or located in the 5'→3' direction, at least one 5'-UTR element as described above, an ORF, optionally an additional 3' -UTR, poly(A) sequence or polyadenylation signal and poly(C) sequence.

Последовательность внутреннего сайта связывания рибосом (IRES) или IRES-мотив может разделять несколько открытых рамок считывания, например в том случае, когда искусственная молекула нуклеиновой кислоты кодирует два или большее количество пептидов или белков. IRES-последовательность может быть наиболее полезной в том случае, когда искусственная молекула нуклеиновой кислоты представляет собой би- или полицистронную молекулу нуклеиновой кислоты.An internal ribosome binding site (IRES) sequence or IRES motif may share multiple open reading frames, such as when an artificial nucleic acid molecule encodes two or more peptides or proteins. The IRES sequence may be most useful when the artificial nucleic acid molecule is a bi- or polycistronic nucleic acid molecule.

Кроме того, искусственная молекула нуклеиновой кислоты может содержать дополнительные 5'-элементы, предпочтительно промотор или последовательность, содержащую промотор. Промотор может контролировать или регулировать транскрипцию искусственной молекулы нуклеиновой кислоты предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, предлагаемой в настоящем изобретении.In addition, the artificial nucleic acid molecule may contain additional 5'-elements, preferably a promoter or a sequence containing a promoter. A promoter can control or regulate transcription of an artificial nucleic acid molecule of the present invention, such as an artificial DNA molecule of the present invention.

Предпочтительно в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно в открытой рамке считывания, модифицируют по меньшей мере содержание G/C. Так, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты можно стабилизировать с точки зрения ее термодинамических характеристик путем модификации содержания G (гуанозин)/С (цитидин) в молекуле. Содержание G/C в открытой рамке считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно повышать по сравнению с содержанием G/C в открытой рамке считывания соответствующей последовательности дикого типа, предпочтительно на основе вырожденности генетического кода. Так, аминокислотную последовательность, кодируемую искусственной молекулой нуклеиновой кислоты, предпочтительно не модифицируют посредством модификации содержания G/C по сравнению с конкретной кодируемой аминокислотной последовательностью дикого типа. Таким образом, можно варьировать кодоны кодирующей последовательности или всей искусственной молекулы нуклеиновой кислоты, например, мРНК, по сравнению с кодирующей последовательностью дикого типа таким образом, чтобы они содержали большее количество G/C-нуклеотидов, сохраняя при этом транслируемую аминокислотную последовательность. Благодаря тому факту, что несколько кодонов кодируют одну и ту же аминокислоту (так называемая вырожденность генетического кода), можно изменять кодоны, не изменяя кодируемую последовательность пептида/белка (использование так называемых альтернативных часто встречающихся кодонов). Следовательно, можно специально интродуцировать определенные кодоны (осуществляя обмен соответствующих кодонов дикого типа, кодирующих ту же самую аминокислоту), которые являются более предпочтительными с точки зрения стабильности РНК и/или с точки зрения часто встречающихся кодонов в организме индивидуума (так называемая оптимизация кодонов).Preferably, at least the G/C content is modified in the artificial nucleic acid molecule of the present invention, preferably in the open reading frame. Thus, the artificial nucleic acid molecule according to the invention can be stabilized in terms of its thermodynamic characteristics by modifying the content of G (guanosine)/C (cytidine) in the molecule. The G/C content in the open reading frame of the artificial nucleic acid molecule of the present invention can be increased compared to the G/C content in the open reading frame of the corresponding wild-type sequence, preferably based on the degeneracy of the genetic code. Thus, the amino acid sequence encoded by the artificial nucleic acid molecule is preferably not modified by modifying the G/C content as compared to the particular wild type encoded amino acid sequence. Thus, it is possible to vary the codons of a coding sequence or of an entire artificial nucleic acid molecule, e.g. mRNA, compared to the wild-type coding sequence so that they contain more G/C nucleotides while maintaining the translated amino acid sequence. Due to the fact that several codons code for the same amino acid (so-called degeneracy of the genetic code), it is possible to change codons without changing the encoded sequence of the peptide/protein (use of so-called alternative frequent codons). Therefore, it is possible to specifically introduce certain codons (by exchanging the corresponding wild-type codons encoding the same amino acid) that are more preferable in terms of RNA stability and/or in terms of frequently occurring codons in the individual's body (so-called codon optimization).

В зависимости от аминокислоты, которая должна кодироваться кодирующей областью предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, существуют различные возможности для модификации нуклеотидной последовательности, например, открытой рамки считывания, по сравнению с ее кодирующей областью дикого типа. В случае аминокислот, которые кодируются кодонами, содержащими только нуклеотиды G или С, модификации кодонов не требуется. Таким образом, кодоны для Pro (ССС или CCG), Arg (CGC или CGG), Ala (GCC или GCG) и Gly (GGC или GGG) не требуют модификации, поскольку в них отсутствуют А или U/T.Depending on the amino acid to be encoded by the coding region of the artificial nucleic acid molecule of the invention provided herein, there are different possibilities for modifying the nucleotide sequence, such as the open reading frame, compared to its wild-type coding region. In the case of amino acids that are encoded by codons containing only G or C nucleotides, codon modification is not required. Thus, the codons for Pro (CCC or CCG), Arg (CGC or CGG), Ala (GCC or GCG), and Gly (GGC or GGG) do not require modification because they lack A or U/T.

В противоположность этому, кодоны, которые содержат нуклеотиды А и/или U, можно модифицировать путем замены на другие кодоны, которые кодируют эти же аминокислоты, но не содержат А и/или U. Например,In contrast, codons that contain A and/or U nucleotides can be modified by substitution with other codons that code for the same amino acids but do not contain A and/or U. For example,

кодирующие Pro кодоны CC(U/T) или ССА можно модифицировать на ССС или CCG;encoding Pro codons CC(U/T) or CCA can be modified to CCC or CCG;

кодирующие Arg кодоны CG(U/T) или CGA, или AGA, или AGG можно модифицировать на CGC или CGG;Arg-coding codons CG(U/T) or CGA or AGA or AGG can be modified to CGC or CGG;

кодирующие Ala кодоны GC(U/T) или GCA можно модифицировать на GCC или GCG;Ala encoding GC(U/T) or GCA codons can be modified to GCC or GCG;

кодирующие Gly кодоны GG(U/T) или GGA можно модифицировать на GGC или GGG.codons encoding Gly GG(U/T) or GGA can be modified to GGC or GGG.

В других случаях, когда нуклеотиды А или U нельзя элиминировать из кодонов, можно снижать содержание А и U с использованием кодонов, которые содержат нуклеотиды А и/или U в более низком количестве. Примерами указанных кодонов являются:In other cases where A or U nucleotides cannot be eliminated from codons, A and U content can be reduced by using codons that contain A and/or U nucleotides in a lower amount. Examples of these codons are:

кодирующие Phe кодоны (U/T)(U/T)(U/T) можно модифицировать на (U/T) (U/T)C;Phe encoding codons (U/T)(U/T)(U/T) can be modified to (U/T)(U/T)C;

кодирующие Leu кодоны (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) или C(U/T)A можно модифицировать на C(U/T)C или C(U/T)G;codons encoding Leu (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) or C(U/T)A can be modified to C (U/T)C or C(U/T)G;

кодирующие Ser кодоны (U/T)C(U/T) или (U/T)CA, или AG(U/T) можно модифицировать на (U/T)CC, (U/T)CG или AGC;Ser encoding codons (U/T)C(U/T) or (U/T)CA or AG(U/T) can be modified to (U/T)CC, (U/T)CG or AGC;

кодирующий Tyr кодон (U/T)A(U/T) можно модифицировать на (U/T)AC;Tyr encoding codon (U/T)A(U/T) can be modified to (U/T)AC;

кодирующий Cys кодон (U/T)G(U/T) можно модифицировать на (U/T)GC;the Cys coding codon (U/T)G(U/T) can be modified to (U/T)GC;

кодирующий His кодон СА(U/Т) можно модифицировать на САС;the His coding codon CA(U/T) can be modified to CAC;

кодирующий Gin кодон САА можно модифицировать на CAG;the Gin coding codon CAA can be modified to CAG;

кодирующие Ile кодоны A(U/T)(U/T) или A(U/T)A можно модифицировать на A(U/T)Ccodons encoding Ile A(U/T)(U/T) or A(U/T)A can be modified to A(U/T)C

кодирующие Thr кодоны АС(U/T) или АСА можно модифицировать на АСС или ACGcoding for Thr codons AC(U/T) or ACA can be modified to ACC or ACG

кодирующий Asn кодон AA(U/T) можно модифицировать на ААС;the Asn encoding codon AA(U/T) can be modified to AAC;

кодирующий Lys кодоны AAA можно модифицировать на AAG;Lys encoding AAA codons can be modified to AAG;

кодирующие Val кодоны G(U/T)(U/T) или G(U/T)A можно модифицировать на G(U/T)C или G(U/T)G;Val-coding codons G(U/T)(U/T) or G(U/T)A can be modified to G(U/T)C or G(U/T)G;

кодирующий Asp кодон GA(U/T) можно модифицировать на GAC;the Asp encoding codon GA(U/T) can be modified to GAC;

кодирующий Glu кодон GAA можно модифицировать на GAG;the Glu coding codon GAA can be modified to GAG;

стоп-кодон (U/T)AA можно модифицировать на (U/T)AG или (U/T)GA.the stop codon (U/T)AA can be modified to either (U/T)AG or (U/T)GA.

С другой стороны, в случае кодонов Met (AUG) и Trp (UGG), отсутствует возможность модификации последовательности без изменения кодируемой аминокислотной последовательности.On the other hand, in the case of Met (AUG) and Trp (UGG) codons, there is no possibility of modifying the sequence without changing the encoded amino acid sequence.

Перечисленные выше замены можно использовать либо индивидуально, либо в любых возможных комбинациях для повышения содержания G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, по сравнению с конкретной открытой рамкой считывания дикого типа (т.е. исходной последовательности). Так, например, все кодоны Thr, встречающиеся в последовательности дикого типа, можно модифицировать на АСС (или ACG).The substitutions listed above can be used either alone or in any possible combination to increase the G/C content in the open reading frame of the inventive artificial nucleic acid molecule provided herein, compared to a specific wild-type open reading frame (i.e., e. the original sequence). Thus, for example, all Thr codons occurring in the wild-type sequence can be modified to ACC (or ACG).

Предпочтительно содержание G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, повышают по меньшей мере на 7%, более предпочтительно по меньшей мере на 15%, наиболее предпочтительно по меньшей мере на 20%, по сравнению с содержанием G/C в кодирующей области мРНК дикого типа без изменения кодируемой аминокислотной последовательности, т.е. используя вырожденность генетического кода. В конкретном варианте осуществления изобретения заменяют по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90%, 95% или даже 100% пригодных для замены кодонов в открытой рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты или ее фрагменте, варианте или производном, повышая тем самым содержание G/C в указанной открытой рамке считывания.Preferably, the open reading frame G/C content of the inventive artificial nucleic acid molecule described herein is increased by at least 7%, more preferably by at least 15%, most preferably by at least 20%, compared to the content of G/C in the coding region of the wild-type mRNA without changing the encoded amino acid sequence, i.e. using the degeneracy of the genetic code. In a particular embodiment of the invention, at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, more preferably at least 70%, even more preferably at least 80%, and most preferably at least at least 90%, 95%, or even 100% of codon substitutions in the open reading frame of the inventive artificial nucleic acid molecule or fragment, variant or derivative thereof, thereby increasing the G/C content in said open reading frame.

В этом контексте наиболее предпочтительно повышать содержание G/C в открытой рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, до максимума (т.е. до 100% пригодных для замещения кодонов) по сравнению с открытой рамкой считывания дикого типа без изменения кодируемой аминокислотной последовательности.In this context, it is most preferable to increase the content of G/C in the open reading frame of the inventive artificial nucleic acid molecule presented herein to a maximum (i.e. up to 100% usable codon substitution) compared to the open reading frame of the wild type without changing the encoded amino acid sequence.

Кроме того, в открытой рамке считывания предпочтительно осуществляют по меньшей мере частично оптимизацию кодонов. Оптимизация кодонов основана на открытии того факта, что эффективность трансляции может определяться также различной частотой встречаемости транспортных РНК (тРНК) в клетках. Таким образом, если в кодирующей области предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, присутствуют в повышенном количестве так называемые «редкие кодоны», то уровень трансляции соответствующей модифицированной нуклеотидной последовательности является более низким, чем в том случае, когда присутствуют кодоны, кодирующие относительно «часто встречающуюся» тРНК.In addition, the open reading frame preferably performs at least partially codon optimization. Codon optimization is based on the discovery that the efficiency of translation can also be determined by the different frequencies of transfer RNAs (tRNAs) in cells. Thus, if so-called "rare codons" are present in the coding region of the artificial nucleic acid molecule of the present invention, the level of translation of the corresponding modified nucleotide sequence is lower than when codons are present. encoding a relatively "frequent" tRNA.

Так, открытую рамку считывания предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты предпочтительно модифицируют по сравнению с соответствующей кодирующей областью дикого типа таким образом, чтобы по меньшей мере один кодон в последовательности дикого типа, который кодирует тРНК, которая является относительно редкой в клетке, был заменен на кодон, который кодирует тРНК, которая встречается в клетке относительно часто и «несет» такую же аминокислоту, что и относительно редко встречающаяся тРНК. Посредством такой модификации открытую рамку считывания предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, модифицируют таким образом, чтобы кодонами, для которых доступны часто встречающиеся тРНК, заменять кодоны, которые соответствуют редким тРНК. Иными словами, согласно изобретению с помощью такой модификации все кодоны в открытой рамке считывания дикого типа, которые кодируют тРНК, являющуюся редкой в клетке, можно заменять на кодон, который кодируют тРНК, более часто встречающуюся в клетке, и которая в каждом случае «несет» такую же аминокислоту, что и редко встречающаяся тРНК. тРНК, встречающиеся относительно часто в клетке, и наоборот, встречающиеся относительно редко, известны специалистам в данной области, см., например, Akashi, Curr. Opin. Genet. Dev., 11(6), 2001, cc. 660-666. Таким образом, предпочтительно открытая рамка считывания имеет оптимизированные кодоны, предпочтительно применительно к системе, в которой должна экспрессироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно применительно к системе, в которой должна транслироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении. Предпочтительно, оптимизацию кодонов для часто встречающихся кодонов в открытой рамке считывания осуществляют в соответствии с часто встречающимися кодонами млекопитающих, более предпочтительно в соответствии с часто встречающимися кодонами человека. Предпочтительно, в открытой рамке считывания осуществляют и оптимизацию кодонов и модификацию содержания G/C.Thus, the open reading frame of the artificial nucleic acid molecule according to the invention is preferably modified in comparison with the corresponding wild-type coding region so that at least one codon in the wild-type sequence that codes for a tRNA that is relatively rare in the cell is changed to a codon that codes for a tRNA that is relatively common in the cell and "carries" the same amino acid as a relatively rare tRNA. By such modification, the open reading frame of the artificial nucleic acid molecule of the invention described herein is modified so that codons for which frequently occurring tRNAs are available are replaced with codons that correspond to rare tRNAs. In other words, according to the invention, with this modification, all codons in the wild-type open reading frame that encode a tRNA that is rare in the cell can be replaced with a codon that encodes a tRNA that is more common in the cell, and which in each case "carries" the same amino acid as the rare tRNA. tRNAs that are relatively common in a cell, and vice versa, that are relatively rare, are known to those skilled in the art, see, for example, Akashi, Curr. Opin. Genet. Dev., 11(6), 2001, pp. 660-666. Thus, preferably the open reading frame has optimized codons, preferably in relation to the system in which the artificial nucleic acid molecule of the present invention is to be expressed, preferably in relation to the system in which the artificial nucleic acid molecule of the present invention is to be translated. Preferably, codon optimization for frequently occurring codons in the open reading frame is performed according to frequently occurring mammalian codons, more preferably according to frequently occurring human codons. Preferably, both codon optimization and G/C content modification are performed in the open reading frame.

Для дополнительного повышения устойчивости к расщеплению, например, устойчивости к расщеплению in vivo (или in vitro, как указано выше) экзо- или эндонуклеазой, и/или для дополнительного повышения стабильности экспрессии белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно осуществлять дополнительные модификации искусственной молекулы нуклеиновой кислоты, такие как модификации каркаса, модификации Сахаров и/или модификации оснований, например, липидные модификации или т.п. Предпочтительно, такие модификации не приводят к значимому ухудшению транскрипции и/или трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.To further increase resistance to cleavage, for example resistance to in vivo (or in vitro as above) cleavage by an exo- or endonuclease, and/or to further increase the stability of protein expression from the artificial nucleic acid molecule of the present invention, one can perform additional modifications to the artificial nucleic acid molecule, such as backbone modifications, sugar modifications, and/or base modifications, eg, lipid modifications, or the like. Preferably, such modifications do not significantly impair transcription and/or translation of the artificial nucleic acid molecule of the present invention.

Как правило, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать любой нативный (встречающийся в естественных условиях) нуклеотид, например, гуанозин, урацил, аденозин и/или цитозин, или их аналоги. В этом контексте нуклеотидные аналоги классифицируют как встречающиеся в естественных условиях и не встречающиеся в естественных условиях варианты встречающихся в естественных условиях нуклеотидов аденозина, цитозина, тимидина, гуанозина и уридина. Таким образом, аналоги представляют собой, например, химически дериватизированные нуклеотиды, несущие не встречающиеся в естественных условиях функциональные группы, которые предпочтительно добавляют или изымают путем делеции из встречающегося в естественных условиях нуклеотида, или которыми заменяют встречающиеся в естественных условиях функциональные группы нуклеотида. Следовательно, можно модифицировать каждый компонент встречающегося в естественных условиях нуклеотида, а именно, компонент, представляющий собой основание, компонент, представляющий собой сахар (рибоза), и/или компонент, представляющий собой фосфат, формирующий каркас (см. выше) последовательности РНК. Аналоги гуанозина, уридина, аденозина, тимидина и цитозина включают (но, не ограничиваясь только ими) любой встречающийся в естественных условиях или не встречающийся в естественных условиях гуанозин, уридин, аденозин, тимидин или цитозин, который был изменен химически, например, ацетилированием, метилированием, гидроксилированием и т.д., включая, например, 1-метиладенозин, 1-метилгуанозин, 1-метилинозин, 2,2-диметилгуанозин, 2,6-диаминопурин, 2'-амино-2'-дезоксиаденозин, 2'-амино-2'-дезоксицитидин, 2'-амино-2'-дезоксигуанозин, 2'-амино-2'-дезоксиуридин, 2-амино-6-хлорпуринорибозид, 2-аминопуринрибозид, 2'-арааденозин, 2'-арацитидин, 2'-арауридин, 2'-азидо-2'-дезоксиаденозин, 2'-азидо-2'-дезоксицитидин, 2'-азидо-2'-дезоксигуанозин, 2'-азидо-2'-дезоксиуридин, 2-хлораденозин, 2'-фтор-2'-дезоксиаденозин, 2'-фтор-2'-дезоксицитидин, 2'-фтор-2'-дезоксигуанозин, 2'-фтор-2'-дезоксиуридин, 2'-фтортимидин, 2-метиладенозин, 2-метилгуанозин, 2-метилтио-N6-изопенениладенозин, 2'-O-метил-2-аминоаденозин, 2'-O-метил-2'-дезоксиаденозин, 2'-O-метил-2'-дезоксицитидин, 2'-O-метил-2'-дезоксигуанозин, 2'-O-метил-2'-дезоксиуридин, 2'-O-метил-5-метилуридин, 2'-O-метилинозин, 2'-O-метилпсевдоуридин, 2-тиоцитидин, 2-тиоцитозин, 3-метилцитозин, 4-ацетилцитозин, 4-тиоуридин, 5-(карбоксигидроксиметил)урацил, 5,6-дигидроуридин, 5-аминоаллилцитидин, 5-аминоаллилдезоксиуридин, 5-бромуридин, 5-карбоксиметиламинометил-2-тиоурацил, 5-карбоксиметиламинометилурацил, 5-хлор-арацитозин, 5-фторуридин, 5-йодуридин, 5-метоксикарбонилметилуридин, 5-метоксиуридин, 5-метил-2-тиоуридин, 6-азацитидин, 6-азауридин, 6-хлор-7-деазагуанозин, 6-хлорпуринорибозид, 6-меркаптогуанозин, 6-метилмеркаптопуринрибозид, 7-деаза-2'-дезоксигуанозин, 7-деазааденозин, 7-метилгуанозин, 8-азааденозин, 8-броаденозин, 8-бромгуанозин, 8-меркапторгуанозин, 8-оксогуанозин, бензимидазолрибозид, бета-D-маннозилквеозин, дигидроурацил, инозин, N1-метиладенозин, N6-([6-аминогексил]карбамоилметил)аденозин, N6-изопентениладенозин, N6-метиладенозин, N7-метилксантозин, метиловый эфир N-урацил-5-оксиуксусной кислоты, пуромицин, квеозин, урацил-5-оксиуксусная кислота, метиловый эфир урацил-5-оксиуксусной кислоты, вибутоксозин, ксантозин и ксилоаденозин. Получение таких аналогов известно специалисту в данной области, например, описано в US 4373071, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4973679, US 5047524, US 5132418, US 5153319, US 5262530 и 5700642. Касательно аналогов, описанных выше, наиболее предпочтительными согласно некоторым вариантам осуществления изобретения могут быть те аналоги, которые увеличивают белковую экспрессию кодируемого пептида или белка, или повышают иммуногенность искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, и/или не взаимодействуют с другой интродуцированной модификацией искусственной молекулы нуклеиновой кислоты.Typically, the artificial nucleic acid molecule of the present invention may contain any native (naturally occurring) nucleotide, such as guanosine, uracil, adenosine and/or cytosine, or their analogues. In this context, nucleotide analogs are classified as naturally occurring and non-naturally occurring variants of the naturally occurring nucleotides of adenosine, cytosine, thymidine, guanosine, and uridine. Thus, analogs are, for example, chemically derivatized nucleotides bearing non-naturally occurring functional groups, which are preferably added or removed by deletion from a naturally occurring nucleotide, or by which a naturally occurring functional group of a nucleotide is substituted. Therefore, it is possible to modify each component of a naturally occurring nucleotide, namely the base component, the sugar component (ribose), and/or the phosphate component forming the backbone (see above) of the RNA sequence. Guanosine, uridine, adenosine, thymidine, and cytosine analogs include, but are not limited to, any naturally occurring or non-naturally occurring guanosine, uridine, adenosine, thymidine, or cytosine that has been altered chemically, e.g., by acetylation, methylation , hydroxylation, etc., including, for example, 1-methyladenosine, 1-methylguanosine, 1-methylinosine, 2,2-dimethylguanosine, 2,6-diaminopurine, 2'-amino-2'-deoxyadenosine, 2'-amino -2'-deoxycytidine, 2'-amino-2'-deoxyguanosine, 2'-amino-2'-deoxyuridine, 2-amino-6-chloropurine riboside, 2-aminopurine riboside, 2'-araadenosine, 2'-aracitidine, 2' -arauridine, 2'-azido-2'-deoxyadenosine, 2'-azido-2'-deoxycytidine, 2'-azido-2'-deoxyguanosine, 2'-azido-2'-deoxyuridine, 2-chloradenosine, 2'- fluoro-2'-deoxyadenosine, 2'-fluoro-2'-deoxycytidine, 2'-fluoro-2'-deoxyguanosine, 2'-fluoro-2'-deoxyuridine, 2'-fluorothymidine, 2-methyladenosine, 2-methylguanosine, 2-methylthio-N6-isopenenyladenosine, 2'-O-methyl-2-aminoaden osine, 2'-O-methyl-2'-deoxyadenosine, 2'-O-methyl-2'-deoxycytidine, 2'-O-methyl-2'-deoxyguanosine, 2'-O-methyl-2'-deoxyuridine, 2'-O-methyl-5-methyluridine, 2'-O-methylinosine, 2'-O-methylpseudouridine, 2-thiocytidine, 2-thiocytosine, 3-methylcytosine, 4-acetylcytosine, 4-thiouridine, 5-(carboxyhydroxymethyl) uracil, 5,6-dihydrouridine, 5-aminoallylcytidine, 5-aminoallyldeoxyuridine, 5-bromuridine, 5-carboxymethylaminomethyl-2-thiouracil, 5-carboxymethylaminomethyluracil, 5-chloro-aracytosine, 5-fluorouridine, 5-ioduridine, 5-methoxycarbonylmethyluridine, 5-methoxyuridine, 5-methyl-2-thiouridine, 6-azacytidine, 6-azauridine, 6-chloro-7-deazaguanosine, 6-chloropurinoribozide, 6-mercaptoguanosine, 6-methylmercaptopurine riboside, 7-deaza-2'-deoxyguanosine, 7 -deazaadenosine, 7-methylguanosine, 8-azaadenosine, 8-broadenosine, 8-bromoguanosine, 8-mercaptorguanosine, 8-oxoguanosine, benzimidazole riboside, beta-D-mannosylqueosine, dihydrouracil, inosine, N1-methyladenosine, N6-([6-aminohexyl ]carbamoylmethyl)adenosine, N6-isopentenyladenosine, N6-methylade nosine, N7-methylxanthosine, N-uracil-5-hydroxyacetic acid methyl ester, puromycin, queosine, uracil-5-hydroxyacetic acid, uracil-5-hydroxyacetic acid methyl ester, vibutoxosine, xanthosine, and xyladenosine. The preparation of such analogues is known to the person skilled in the art, for example, described in US 4373071, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4973679, US 5047524, US 5132418, US 5153319, US 5262530 and 27 described above, most preferred analogs in some embodiments of the invention may be those analogs that increase the protein expression of the encoded peptide or protein, or increase the immunogenicity of the artificial nucleic acid molecule of the invention, and/or do not interact with another introduced modification of the artificial nucleic acid molecule .

Согласно конкретному варианту осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать липидную модификацию.According to a specific embodiment of the invention, the artificial nucleic acid molecule of the present invention may contain a lipid modification.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит, предпочтительно в 5'→3'-направлении, следующие элементы:In a preferred embodiment of the invention, the artificial nucleic acid molecule contains, preferably in the 5'→3' direction, the following elements:

5'-UTR-элемент, обеспечивающий высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, предпочтительно нуклеотидную последовательность, представленную в одной из SEQ ID NO: 1-151; или дополнительную 5'-UTR, предпочтительно 5'-TOP UTR;5'-UTR element, providing high translation efficiency of the specified artificial nucleic acid molecule, preferably the nucleotide sequence presented in one of SEQ ID NO: 1-151; or an additional 5'-UTR, preferably a 5'-TOP UTR;

по меньшей мере одну открытую рамку считывания (ОРС), где ОРС предпочтительно содержит по меньшей мере одну модификацию по сравнению с последовательностью дикого типа;at least one open reading frame (ORF), where the ORF preferably contains at least one modification compared to the wild-type sequence;

3'-UTR-элемент, обеспечивающий высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, предпочтительно нуклеотидную последовательность, представленную в одной из SEQ ID NO: 152-204; или дополнительную 3'-UTR, предпочтительно 3'-UTR альбумина7;A 3'-UTR element providing high translation efficiency of said artificial nucleic acid molecule, preferably the nucleotide sequence shown in one of SEQ ID NOs: 152-204; or an additional 3'-UTR, preferably the 3'-UTR of albumin7;

поли(А)-последовательность, предпочтительно содержащую 64 аденилата;poly(A)-sequence, preferably containing 64 adenylate;

поли(С)-последовательность, предпочтительно содержащую 30 цитидилатов;poly(C)-sequence, preferably containing 30 cytidylates;

последовательность гистоновой структуры типа «стебель-петля».histone stem-loop sequence.

В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, может содержать также одну или несколько описанных ниже модификаций:In the most preferred embodiment of the invention, the artificial nucleic acid molecule of the invention may also contain one or more of the following modifications:

Химические модификации:Chemical modifications:

В контексте настоящего описания понятие «модификация» применительно к искусственной молекуле нуклеиновой кислоты может относиться к химическим модификациям, включающим модификации каркаса, а также модификации сахара или модификации основания.In the context of the present description, the term "modification" in relation to an artificial nucleic acid molecule can refer to chemical modifications, including modifications of the backbone, as well as modifications of the sugar or modification of the base.

В этом контексте искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, представленная в настоящем описании, может содержать нуклеотидные аналоги/модификации, например, модификации каркаса, модификации сахара или модификации основания. Модификация каркаса согласно настоящему изобретению представляет собой модификацию, при которой химически модифицируют фосфаты каркаса нуклеотидов, содержащихся в молекуле нуклеиновой кислоты, представленной в настоящем описании. Модификация сахара согласно настоящему изобретению представляет собой химическую модификацию сахара нуклеотидов в молекуле нуклеиновой кислоты, представленной в настоящем описании. Кроме того, модификация основания согласно настоящему изобретению представляет собой химическую модификацию основного фрагмента нуклеотидов в молекуле нуклеиновой кислоты. В этом контексте нуклеотидные аналоги или модификации предпочтительно выбирают из нуклеотидных аналогов, пригодных для транскрипции и/или трансляции.In this context, an artificial nucleic acid molecule, preferably an RNA molecule, as described herein, may contain nucleotide analogs/modifications, for example backbone modifications, sugar modifications, or base modifications. The backbone modification according to the present invention is a modification in which backbone phosphates of the nucleotides contained in the nucleic acid molecule described herein are chemically modified. The sugar modification of the present invention is the chemical modification of the sugar of the nucleotides in the nucleic acid molecule described herein. In addition, the modification of the base according to the present invention is a chemical modification of the main fragment of the nucleotides in the nucleic acid molecule. In this context, nucleotide analogs or modifications are preferably selected from nucleotide analogs suitable for transcription and/or translation.

Модификации сахара:Sugar modifications:

Модифицированные нуклеозиды и нуклеотиды, которые могут быть включены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании, могут быть модифицированы в сахарном фрагменте. Например, 2'-гидроксигруппу (ОН) в молекуле РНК можно модифицировать или заменять многочисленными «окси»- или «дезокси»-заместителями. Примерами модификаций, включающих «окси»-2'-гидроксигруппы, являются (но, не ограничиваясь только ими) алкоксигруппы или арилоксигруппы (-OR, например, R=Н, алкил, циклоалкил, арил, аралкил, гетероарил или сахар); полиэтиленгликоли (PEG), -O(CH2CH2O)nCH2CH2OR; «замкнутые» нуклеиновые кислоты (LNA), в которых 2'-гидроксил присоединен, например, с помощью метиленового мостика к 4'-углероду в том же самом сахарном фрагменте, представляющем собой рибозу; и аминогруппы (-O-аминогруппы, в которых аминогруппа, например, NRR, может представлять собой алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу или дигетероариламиногруппу, этилендиамин, полиаминогруппу) или аминоалкоксигруппу.Modified nucleosides and nucleotides that can be included in an artificial nucleic acid molecule, preferably RNA, as described herein, can be modified in the sugar moiety. For example, the 2'-hydroxy group (OH) in an RNA molecule can be modified or replaced by numerous "oxy" or "deoxy" substituents. Examples of modifications that include "oxy"-2'-hydroxy groups are (but not limited to) alkoxy or aryloxy groups (-OR, for example, R=H, alkyl, cycloalkyl, aryl, aralkyl, heteroaryl, or sugar); polyethylene glycols (PEG), -O(CH 2 CH 2 O) n CH 2 CH 2 OR; "closed" nucleic acids (LNA), in which the 2'-hydroxyl is attached, for example, via a methylene bridge to the 4'-carbon in the same ribose sugar moiety; and amino groups (-O-amino groups, in which the amino group, for example, NRR, may be an alkylamino group, a dialkylamino group, a heterocyclyl, an arylamino group, a diarylamino group, a heteroarylamino group or a diheteroarylamino group, an ethylenediamine, a polyamino group) or an aminoalkoxy group.

«Дезокси»-модификация включает водород, аминогруппу (например, NH2; алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу, дигетероариламиногруппу или аминокислоту); или аминогруппу можно присоединять к сахару через линкер, где линкер содержит один или несколько атомов С, N и О.The "deoxy" modification includes hydrogen, an amino group (eg, NH 2 ; an alkylamino group, a dialkylamino group, a heterocyclyl, an arylamino group, a diarylamino group, a heteroarylamino group, a diheteroarylamino group, or an amino acid); or an amino group can be attached to the sugar through a linker, where the linker contains one or more C, N and O atoms.

Сахарная группа может содержать также один или несколько атомов углерода, которые могут находиться в стереохимической конфигурации, отличной от конфигурации соответствующего атома углерода в рибозе. Так, модифицированная молекула нуклеиновой кислоты может включать, например, в качестве сахара арабинозу.The sugar group may also contain one or more carbon atoms, which may be in a stereochemical configuration different from that of the corresponding carbon atom in the ribose. Thus, the modified nucleic acid molecule may include, for example, arabinose as a sugar.

Модификации каркаса:Frame mods:

Можно модифицировать также фосфатный каркас в модифицированных нуклеозидах и нуклеотидах, которые могут быть встроены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании. Фосфатные группы в каркасе можно модифицировать посредством замены одного или нескольких атомов кислорода на различные заместители. Кроме того, в модифицированных нуклеозидах и нуклеотидах не модифицированный фосфатный фрагмент может быть полностью заменен на модифицированный фосфат, представленный в настоящем описании. Примеры модифицированных фосфатных групп включают (но, не ограничиваясь только ими) фосфоротиоаты, фосфороселенаты, боранофосфаты, сложные боранофосфатные эфиры, первичные фосфонаты, фосфороамидаты, алкил- или арилфосфонаты и сложные фосфотриэфиры. В фосфородитиоатах оба несвязывающих атома кислорода заменены серой. Фосфатный линкер также можно модифицировать путем замены связывающего атома кислорода на азот (мостиковые фосфороамидаты), серу (мостиковые фосфоротиоаты) и углерод (мостиковые метиленфосфонаты).It is also possible to modify the phosphate backbone in modified nucleosides and nucleotides, which can be inserted into an artificial nucleic acid molecule, preferably RNA, as described herein. Phosphate groups in the framework can be modified by replacing one or more oxygen atoms with various substituents. In addition, in modified nucleosides and nucleotides, the unmodified phosphate moiety can be completely replaced by a modified phosphate as described herein. Examples of modified phosphate groups include, but are not limited to, phosphorothioates, phosphoroselenates, boranophosphates, boranophosphate esters, primary phosphonates, phosphoramidates, alkyl or aryl phosphonates, and phosphotriesters. In phosphorodithioates, both non-bonding oxygen atoms are replaced by sulfur. The phosphate linker can also be modified by replacing the bonding oxygen atom with nitrogen (bridged phosphoroamidates), sulfur (bridged phosphorothioates), and carbon (bridged methylenephosphonates).

Модификации основания:Base modifications:

Модифицированные нуклеозиды и нуклеотиды, которые можно встраивать в искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать также во фрагменте, представляющем собой нуклеооснование. Примерами нуклеооснований, входящих в РНК, являются (но, не ограничиваясь только ими) аденин, гуанин, цитозин и урацил. Например, нуклеозиды и нуклеотиды, представленные в настоящем описании, можно химически модифицировать на поверхности главной бороздки. В некоторых вариантах осуществления изобретения химические модификации в главной бороздке включают аминогруппу, тиольную группу алкильную группу или галогруппу.Modified nucleosides and nucleotides that can be inserted into an artificial nucleic acid molecule, preferably an RNA molecule as described herein, can also be modified in a nucleobase moiety. Examples of nucleobases included in RNA are (but not limited to) adenine, guanine, cytosine and uracil. For example, the nucleosides and nucleotides provided herein can be chemically modified on the surface of the major groove. In some embodiments, the chemical modifications in the major groove include an amino group, a thiol group, an alkyl group, or a halo group.

В наиболее предпочтительных вариантах осуществления настоящего изобретения нуклеотидные аналоги/модификации выбирают из модификаций основания, которые предпочтительно выбирают из 2-амино-6-хлорпуринрибозид-5'-трифосфат, 2-аминоаденозин-5'-трифосфат, 2-тиоцитидин-5'-трифосфат, 2-тиоуридин-5'-трифосфат, 4-тиоуридин-5'-трифосфат, 5-аминоаллилцитидин-5'-трифосфат, 5-аминоаллилуридин-5'-трифосфат, 5-бромцитидин-5'-трифосфат, 5-бромуридин-5'-трифосфат, 5-йодцитидин-5'-трифосфат, 5-йодуридин-5'-трифосфат, 5-метилцитидин-5'-трифосфат, 5-метилуридин-5'-трифосфат, 6-азацитидин-5'-трифосфат, 6-азауридин-5'-трифосфат, 6-хлорпуринрибозид-5'-трифосфат, 7-деазааденозин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 8-азааденозин-5'-трифосфат, 8-азидоаденозин-5'-трифосфат, бензимидазолрибозид-5'-трифосфат, N1-метиладенозин-5'-трифосфат, N1-метилгуанозин-5'-трифосфат, N6-метиладенозин-5'-трифосфат, O6-метилгуанозин-5'-трифосфат, псевдоуридин-5'-трифосфат или пуромицин-5'-трифосфат, ксантозин-5'-трифосфат. Наиболее предпочтительные нуклеотиды для модификаций оснований выбирают из группы нуклеотидов с модифицированными основаниями, включающей 5-метилцитидин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 5-бромцитидин-5'-трифосфат и псевдоуридин-5'-трифосфат.In the most preferred embodiments of the present invention, the nucleotide analogs/modifications are selected from base modifications, which are preferably selected from 2-amino-6-chloropurine riboside-5'-triphosphate, 2-aminoadenosine-5'-triphosphate, 2-thiocytidine-5'-triphosphate , 2-thiouridine-5'-triphosphate, 4-thiouridine-5'-triphosphate, 5-aminoallylcytidine-5'-triphosphate, 5-aminoallyluridine-5'-triphosphate, 5-bromocytidine-5'-triphosphate, 5-bromouridine- 5'-triphosphate, 5-iodcytidine-5'-triphosphate, 5-ioduridine-5'-triphosphate, 5-methylcytidine-5'-triphosphate, 5-methyluridine-5'-triphosphate, 6-azacytidine-5'-triphosphate, 6-azauridine-5'-triphosphate, 6-chloropurine riboside-5'-triphosphate, 7-deazaadenosine-5'-triphosphate, 7-deazaguanosine-5'-triphosphate, 8-azaadenosine-5'-triphosphate, 8-azidoadenosine-5 '-triphosphate, benzimidazole riboside-5'-triphosphate, N1-methyladenosine-5'-triphosphate, N1-methylguanosine-5'-triphosphate, N6-methyladenosine-5'-triphosphate, O6-methylguanosine-5'-triphosphate, pseudouridine-5 '-triphosphate or puromycin-5'-triphosphate, xanthosine-5'-triphosphate. The most preferred nucleotides for base modifications are selected from the group of base-modified nucleotides including 5-methylcytidine-5'-triphosphate, 7-deazaguanosine-5'-triphosphate, 5-bromocytidine-5'-triphosphate, and pseudouridine-5'-triphosphate.

В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают пиридин-4-оновый рибонуклеозид, 5-азауридин, 2-тио-5-азауридин, 2-тиоуридин, 4-тиопсевдоуридин, 2-тиопсевдоуридин, 5-гидроксиуридин, 3-метилуридин, 5-карбоксиметилуридин, 1-карбоксиметилпсевдоуридин, 5-пропинилуридин, 1-пропинилпсевдоуридин, 5-тауринометилуридин, 1-тауринометилпсевдоуридин, 5-тауринометил-2-тиоуридин, 1-тауринометил-4-тиоуридин, 5-метилуридин, 1-метилпсевдоуридин, 4-тио-1-метилпсевдоуридин, 2-тио-1-метилпсевдоуридин, 1-метил-1-деазапсевдоуридин, 2-тио-1-метил-1-деазапсевдоуридин, дигидроуридин, дигидропсевдоуридин, 2-тиодигидроуридин, 2-тиодигидропсевдоуридин, 2-метоксиуридин, 2-метокси-4-тиоуридин, 4-метоксипсевдоуридин и 4-метокси-2-тиопсевдоуридин.In some embodiments, the modified nucleosides include pyridin-4-one ribonucleoside, 5-azauridine, 2-thio-5-azauridine, 2-thiouridine, 4-thiopseudouridine, 2-thiopseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyluridine , 1-carboxymethylpseudouridine, 5-propynyluridine, 1-propynylpseudouridine, 5-taurinomethyluridine, 1-taurinomethylpseudouridine, 5-taurinomethyl-2-thiouridine, 1-taurinomethyl-4-thiouridine, 5-methyluridine, 1-methylpseudouridine, 4-thio-1 -methylpseudouridine, 2-thio-1-methylpseudouridine, 1-methyl-1-deazapseudouridine, 2-thio-1-methyl-1-deazapseudouridine, dihydrouridine, dihydropseudouridine, 2-thiodihydrouridine, 2-thiodihydropseudouridine, 2-methoxyuridine, 2-methoxy -4-thiouridine, 4-methoxypseudouridine and 4-methoxy-2-thiopseudouridine.

В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают 5-азацитидин, псевдоизоцитидин, 3-метилцитидин, N4-ацетилцитидин, 5-формилцитидин, N4-метилцитидин, 5-гидроксиметилцитидин, 1-метилпсевдоизоцитидин, пирролоцитидин, пирролопсевдоизоцитидин, 2-тиоцитидин, 2-тио-5-метилцитидин, 4-тиопсевдоизоцитидин, 4-тио-1-метилпсевдоизоцитидин, 4-тио-1-метил-1-деазапсевдоизоцитидин, 1-метил-1-деазапсевдоизоцитидин, зебуларин, 5-азазебуларин, 5-метилзебуларин, 5-аза-2-тиозебуларин, 2-тиозебуларин, 2-метоксицитидин, 2-метокси-5-метилцитидин, 4-метоксипсевдоизоцитидин и 4-метокси-1-метилпсевдоизоцитидин.In some embodiments, the modified nucleosides include 5-azacytidine, pseudoisocytidine, 3-methylcytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methylpseudoisocytidine, pyrrolocytidine, pyrrolopseudoisocytidine, 2-thiocytidine, 2-thio- 5-methylcytidine, 4-thiopseudisocytidine, 4-thio-1-methylpseudoisocytidine, 4-thio-1-methyl-1-deazapseudoisocytidine, 1-methyl-1-deazapseudoisocytidine, zebularine, 5-azazebularine, 5-methylzebularine, 5-aza- 2-thiozebularine, 2-thiosebularine, 2-methoxycytidine, 2-methoxy-5-methylcytidine, 4-methoxypseudoisocytidine and 4-methoxy-1-methylpseudoisocytidine.

В других вариантах осуществления изобретения модифицированные нуклеозиды включают 2-аминопурин, 2, 6-диаминопурин, 7-деазааденин, 7-деаза-8-азааденин, 7-деаза-2-аминопурин, 7-деаза-8-аза-2-аминопурин, 7-деаза-2,6-диаминопурин, 7-деаза-8-аза-2,6-диаминопурин, 1-метиладенозин, N6-метиладенозин, N6-изопентениладенозин, N6-(цис-гидроксиизопентенил)аденозин, 2-метилтио-N6-(цис-гидроксиизопентенил) аденозин, N6-глицинилкарбомоиладенозин, N6-треонилкарбамоиладенозин, 2-метилтио-N6-треонилкарбамоиладенозин, N6,N6-диметиладенозин, 7-метиладенин, 2-метилтиоаденин и 2-метоксиаденин.In other embodiments, the modified nucleosides include 2-aminopurine, 2,6-diaminopurine, 7-deazaadenine, 7-deaza-8-azaadenine, 7-deaza-2-aminopurine, 7-deaza-8-aza-2-aminopurine, 7-deaza-2,6-diaminopurine, 7-deaza-8-aza-2,6-diaminopurine, 1-methyladenosine, N6-methyladenosine, N6-isopentenyladenosine, N6-(cis-hydroxyisopentenyl)adenosine, 2-methylthio-N6 -(cis-hydroxyisopentenyl)adenosine, N6-glycinylcarbamoyladenosine, N6-threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyladenosine, N6,N6-dimethyladenosine, 7-methyladenine, 2-methylthioadenine and 2-methoxyadenine.

В других вариантах осуществления изобретения модифицированные нуклеозиды включают инозин, 1-метилинозин, виозин, вибутозин, 7-деазагуанозин, 7-деаза-8-азагуанозин, 6-тиогуанозин, 6-тио-7-деазагуанозин, 6-тио-7-деаза-8-азагуанозин, 7-метилгуанозин, 6-тио-7-метилгуанозин, 7-метилинозин, 6-метоксигуанозин, 1-метилгуанозин, N2-метилгуанозин, N2,N2-диметилгуанозин, 8-оксогуанозин, 7-метил-8-оксогуанозин, 1-метил-6-тиогуанозин, N2-метил-6-тиогуанозин и N2,N2-диметил-6-тиогуанозин.In other embodiments, the modified nucleosides include inosine, 1-methylinosine, viosin, vibutosin, 7-deazaguanosine, 7-deaza-8-azaguanosine, 6-thioguanosine, 6-thio-7-deazaguanosine, 6-thio-7-deaza- 8-azaguanosine, 7-methylguanosine, 6-thio-7-methylguanosine, 7-methylinosine, 6-methoxyguanosine, 1-methylguanosine, N2-methylguanosine, N2,N2-dimethylguanosine, 8-oxoguanosine, 7-methyl-8-oxoguanosine, 1-methyl-6-thioguanosine, N2-methyl-6-thioguanosine and N2,N2-dimethyl-6-thioguanosine.

В некоторых вариантах осуществления изобретения нуклеотид можно модифицировать на поверхности главной бороздки и модификация может включать замену атома водорода на С-5 урацила метальной группой или галогруппой. В конкретных вариантах осуществления изобретения модифицированный нуклеозид представляет собой 5'-O-(1-тиофосфат)-аденозин, 5'-O-(1-тиофосфат)-цитидин, 5'-O-(1-тиофосфат)-гуанозин, 5'-O-(1-тиофосфат)-уридин или 5'-O-(1-тиофосфат)-псевдоуридин.In some embodiments, the nucleotide may be modified at the surface of the major groove, and the modification may include replacing the hydrogen atom on the C-5 uracil with a methyl group or a halo group. In specific embodiments, the modified nucleoside is 5'-O-(1-thiophosphate)-adenosine, 5'-O-(1-thiophosphate)-cytidine, 5'-O-(1-thiophosphate)-guanosine, 5' -O-(1-thiophosphate)-uridine or 5'-O-(1-thiophosphate)-pseudouridine.

В других конкретных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, может содержать нуклеозидные модификации, выбранные из 6-азацитидина, 2-тиоцитидина, альфа-тиоцитидина, псевдоизоцитидина, 5-аминоаллилуридина, 5-йодуридина, N1-метилпсевдоуридина, 5,6-дигидроуридина, альфа-тиоуридина, 4-тиоуридина, 6-азауридина, 5-гидроксиуридина, дезокситимидина, 5-метилуридина, пирролоцитидина, инозина, альфа-тиогуанозина, 6-метилгуанозина, 5-метилцитидина, 8-оксогуанозина, 7-деазагуанозина, N1-метиладенозина, 2-амино-6-хлорпурина, N6-метил-2-аминопурина, псевдоизоцитидина, 6-хлорпурина, N6-метиладенозин, альфа-тиоаденозина, 8-азидоаденозина, 7-деазааденозина.In other specific embodiments, the artificial nucleic acid molecule, preferably an RNA molecule, may contain nucleoside modifications selected from 6-azacytidine, 2-thiocytidine, alpha-thiocytidine, pseudoisocytidine, 5-aminoallyluridine, 5-yoduridine, N1-methylpseudouridine, 5, 6-dihydrouridine, alpha-thiouridine, 4-thiouridine, 6-azauridine, 5-hydroxyuridine, deoxythymidine, 5-methyluridine, pyrrolocytidine, inosine, alpha-thioguanosine, 6-methylguanosine, 5-methylcytidine, 8-oxoguanosine, 7-deazaguanosine, N1-methyladenosine, 2-amino-6-chloropurine, N6-methyl-2-aminopurine, pseudoisocytidine, 6-chloropurine, N6-methyladenosine, alpha-thioadenosine, 8-azidoadenosine, 7-deazaadenosine.

Липидная модификация:Lipid modification:

Согласно следующему варианту осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно РНК, представленная в настоящем описании, может содержать липидную модификацию. Такая модифицированная липидами РНК, как правило, содержит РНК, представленную в настоящем описании. Такая модифицированная липидами молекула РНК, представленная в настоящем описании, как правило, дополнительно содержит по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером. Альтернативно этому, модифицированная липидами молекула РНК содержит (по меньшей мере одну) молекулу РНК, указанную в настоящем описании, и по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной молекулой РНК. Согласно третьей альтернативе модифицированная липидами молекула РНК содержит искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, указанную в настоящем описании, по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером, и также по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной мРНК. В этом контексте наиболее предпочтительно липидную модификацию осуществляют на концах линейной последовательности РНК.According to a further embodiment of the invention, the artificial nucleic acid molecule, preferably RNA, provided herein may contain a lipid modification. Such lipid-modified RNA typically contains the RNA described herein. Such a lipid-modified RNA molecule as described herein typically further comprises at least one linker covalently linked to said RNA molecule and at least one lipid covalently linked to the corresponding linker. Alternatively, a lipid-modified RNA molecule comprises (at least one) an RNA molecule as defined herein and at least one (bifunctional) lipid covalently linked (without a linker) to said RNA molecule. In a third alternative, the lipid-modified RNA molecule comprises an artificial nucleic acid molecule, preferably an RNA molecule, as defined herein, at least one linker covalently linked to said RNA molecule, and at least one lipid covalently linked to a corresponding linker, and also at least one (bifunctional) lipid covalently linked (without a linker) to said mRNA. In this context, most preferably the lipid modification is carried out at the ends of the linear RNA sequence.

Модификация 5'-конца модифицированной РНК:Modification of the 5'-end of the modified RNA:

Согласно другому предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать путем добавления так называемой «5'-кэп»-структуры.According to another preferred embodiment of the invention, the artificial nucleic acid molecule, preferably the RNA molecule as described herein, can be modified by adding a so-called "5' cap" structure.

5'-кэп представляет собой структуру, как правило, структуру, состоящую из модифицированных нуклеотидов, которая, как правило, «кэпирует» 5'-конец зрелой мРНК. 5'-кэп, как правило, может быть сформирован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида.A 5' cap is a structure, typically a modified nucleotide structure, that typically caps the 5' end of a mature mRNA. The 5' cap can generally be formed by a modified nucleotide, primarily a derivative of a guanine nucleotide.

Предпочтительно 5'-кэп связан с 5'-концом с помощью 5'-5'-трифосфатной связи. 5'-кэп может быть метилирован, например, m7GpppN, где N представляет собой концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. m7GpppN представляет собой 5'-кэп-структуру, которая встречается в естественных условиях в мРНК, транскрибируемой полимеразой II, и, следовательно, не рассматривается как модификация, содержащаяся в модифицированной РНК, предлагаемой в изобретении. Это означает, что искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, предлагаемая в настоящем изобретении, может содержать m7GpppN в качестве 5'-кэпа, но при этом дополнительно искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, содержит по меньшей мере одну дополнительную модификацию, представленную в настоящем описании.Preferably, the 5' cap is linked to the 5' end via a 5'-5' triphosphate bond. The 5' cap may be methylated, for example with m7GpppN, where N is the 5' terminal nucleotide of the nucleic acid bearing the 5' cap, typically the 5' end of the RNA. m7GpppN is a 5'cap structure that occurs naturally in mRNA transcribed by polymerase II and is therefore not considered a modification contained in the modified RNA of the invention. This means that an artificial nucleic acid molecule, preferably an RNA molecule, according to the present invention may contain m7GpppN as a 5'-cap, but additionally, an artificial nucleic acid molecule, preferably an RNA molecule, contains at least one additional modification represented by in this description.

Другими примерами 5'-кэп-структур являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или несвязанный мостиком метилфосфонатный фрагмент. Эти модифицированные 5'-кэп-структуры рассматриваются в качестве по меньшей мере одной модификации, содержащейся в искусственной молекуле нуклеиновой кислоты, предпочтительно в молекуле РНК, предлагаемой в настоящем изобретении.Other examples of 5'-cap structures are glyceryl, inverted deoxy group (fragment) devoid of a nitrogenous base, 4',5'-methylene nucleotide, 1-(beta-D-erythrofuranosyl) nucleotide, 4'-thionucleotide, carbocyclic nucleotide, 1 ,5-anhydrohexitol nucleotide, L-nucleotides, alpha-nucleotide, base-modified nucleotide, treopentofuranosyl nucleotide, acyclic 3',4'-seconucleotide, acyclic 3,4-dihydroxybutyl nucleotide, acyclic 3,5-dihydroxypentyl nucleotide, 3'- 3'-inverted nucleotide fragment, 3'-3'-inverted baseless fragment, 3'-2'-inverted nucleotide fragment, 3'-2'-inverted baseless fragment, 1,4-butanediolphosphate, 3'- a phosphoramidate, hexylphosphate, aminohexylphosphate, 3'-phosphate, 3'-phosphorothioate, phosphorodithioate or bridged or unbridged methylphosphonate moiety. These modified 5' cap structures are considered to be at least one modification contained in an artificial nucleic acid molecule, preferably an RNA molecule, according to the present invention.

Наиболее предпочтительными модифицированными 5'-кэп-структурами являются САР1 (метилирование рибозы соседнего с m7GpppN нуклеотида), САР2 (метилирование рибозы 2-ого нуклеотида, расположенного по ходу транскрипции относительно m7GpppN), САР3 (метилирование рибозы 3-его нуклеотида, расположенного по ходу транскрипции относительное m7GpppN), САР4 (метилирование рибозы 4-ого нуклеотида, расположенного по ходу транскрипции относительно m7GpppN), ARCA (аналог кэп-структуры с правильной ориентацией, модифицированный ARCA (например, модифицированный фосфотиоатом ARCA), инозин, N1-метилгуанозин, 2'-фторгуанозин, 7-деазагуанозин, 8-оксогуанозин, 2-аминогуанозин, ЗНК-гуанозин и 2-азидогуанозин.The most preferred modified 5'-cap structures are CAP1 (ribose methylation of nucleotide adjacent to m7GpppN), CAP2 (methylation of ribose 2nd nucleotide downstream of m7GpppN), CAP3 (methylation of ribose 3rd nucleotide downstream of m7GpppN). relative m7GpppN), CAP4 (ribose methylation of the 4th nucleotide located downstream of m7GpppN), ARCA (correctly oriented cap analog modified by ARCA (for example, modified by ARCA phosphothioate), inosine, N1-methylguanosine, 2'- fluoroguanosine, 7-deazaguanosine, 8-oxoguanosine, 2-aminoguanosine, LNA-guanosine and 2-azidoguanosine.

В предпочтительном варианте осуществления изобретения по меньшей мере одна открытая рамка считывания кодирует терапевтический белок или пептид. В другом варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания кодируется антиген, такой как патогенный антиген, опухолевый антиген, аллергенный антиген или аутоиммунный антиген. Таким образом, введение искусственной молекулы нуклеиновой кислоты, кодирующей антиген, применяют в подходе, заключающемся в генетической вакцинации против заболевания, в котором участвует указанный антиген.In a preferred embodiment of the invention, at least one open reading frame encodes a therapeutic protein or peptide. In another embodiment, the at least one open reading frame encodes an antigen, such as a pathogenic antigen, a tumor antigen, an allergenic antigen, or an autoimmune antigen. Thus, the introduction of an artificial nucleic acid molecule encoding an antigen is used in the approach of genetic vaccination against a disease in which said antigen is involved.

В альтернативном варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, кодируется антитело или антиген-специфический Т-клеточный рецептор, или его фрагмент.In an alternative embodiment of the invention, at least one open reading frame of the artificial nucleic acid molecule of the invention encodes an antibody or an antigen-specific T-cell receptor, or a fragment thereof.

Антигены:Antigens:

Патогенные антигены:Pathogenic antigens:

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может кодировать белок или пептид, который содержит патогенный антиген или его фрагмент, вариант или производное. Такие патогенные антигены происходят из патогенных организмов, прежде всего, бактерий, вирусов или простейших (многоклеточных) патогенных организмов, которые вызывают иммунологическую реакцию у индивидуума, прежде всего у млекопитающего, более предпочтительно у человека. Более конкретно, патогенные антигены предпочтительно представляют собой поверхностные антигены, например, белки (или фрагменты белков, например, находящуюся снаружи часть поверхностного антигена), локализованные на поверхности вируса или бактерии или простейшего.The artificial nucleic acid molecule of the present invention may encode a protein or peptide that contains a pathogenic antigen or fragment, variant or derivative thereof. Such pathogenic antigens are derived from pathogenic organisms, primarily bacteria, viruses or protozoan (multicellular) pathogenic organisms, which elicit an immunological response in an individual, primarily a mammal, more preferably a human. More specifically, pathogenic antigens are preferably surface antigens, eg proteins (or fragments of proteins, eg the exposed portion of a surface antigen) located on the surface of a virus or bacterium or protozoan.

Патогенные антигены представляют собой пептидные или белковые антигены, предпочтительно происходящие из патогенов, ассоциированных с инфекционным заболеванием, которые предпочтительно выбирают из антигенов, происходящих из патогенов Acinetobacter baumannii, рода Anaplasma, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, рода Aspergillus, Astroviridae, рода Babesia, Bacillus anthracis, Bacillus cereus, Bartonella henselae, вируса BK, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, рода Borrelia, Borrelia spp, рода Brucella, Brugia malayi, семейства Bunyaviridae, Burkholderia cepacia и других видов Burkholderia, Burkholderia mallei, Burkholderia pseudomallei, семейства Caliciviridae, рода Campylobacter, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, приона CJD, Clonorchis sinensis, Clostridium botulinum, Clostridium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, коронавирусов, Coryneb acterium diphtheriae, Coxiella burnetii, вируса геморрагической лихорадки Крым-Конго, Cryptococcus neoformans, рода Cryptosporidium, Cytomegalovirus (CMV), вирусов Денге (DEN-1, DEN-2, DEN-3 и DEN-4), Dientamoeba fragilis, вируса Эбола (EBOV), рода Echinococcus, Ehrlichia chaffeensis, Ehrlichia ewingii, рода Ehrlichia, Entamoeba histolytica, рода Enterococcus, рода Enterovirus, энтеровирусов, прежде всего вируса Коксаки А и энтеровируса 71 (EV71), Epidermophyton spp, вируса Эпштейна-Барра (EBV), Escherichia coli O157:Н7, O111 и О104:Н4, Fasciola hepatica и Fasciola gigantica, приона FFI, суперсемейства Filarioidea, флавивирусов, Francisella tularensis, рода Fusobacterium, Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, приона GSS, вируса Гуанарито, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, генипавируса (вирус Гендра и вирус Нипа), вируса гепатита А, вируса гепатита В (HBV), вируса гепатита С (HCV), вируса гепатита D, вируса гепатита, вируса герпеса простого 1 и 2 (HSV-1 и HSV-2), Histoplasma capsulatum, HIV (вирус иммунодефицита человека), Hortaea werneckii, человеческого бокавируса (HBoV), человеческого вируса герпеса 6 (HHV-6) и человеческого вируса герпеса 7 (HHV-7), человеческого вируса метапенвмонии (hMPV), вируса папилломы человека (HPV), человеческих вирусов парагриппа (HPIV), вируса японского энцефалита, вируса JC, вируса Джунин, Kingella kingae, Klebsiella granulomatis, приона Куру, вируса Ласса, Legionella pneumophila, рода Leishmania, рода Leptospira, Listeria monocytogenes, вируса лимфоцитарного хориоменингита (LCMV), вируса Мачупо, Malassezia spp, вируса Марбурга, вируса кори, Metagonimus yokagawai, Microsporidia phylum, вируса контагиозного моллюска (MCV), вируса паротита, Mycobacterium leprae и Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, Mycoplasma pneumoniae, Naegleria fowleri, Necator americanus, Neisseria gonorrhoeae, Neisseria meningitidis, Nocardia asteroides, Nocardia spp, Onchocerca volvulus, Orientia tsutsugamushi, семейства Orthomyxoviridae (грипп), Paracoccidioides brasiliensis, Paragonimus spp, Paragonimus westermani, парвовируса В19, рода Pasteurella, рода Plasmodium, Pneumocystis jirovecii, полиовируса, вируса бешенства, респираторно-синтициального вируса (RSV), риновируса, риновирусов, Rickettsia akari, рода Rickettsia, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, вируса долины Рифта, ротавируса, вируса краснухи, вируса Сабиа, рода Salmonella, Sarcoptes scabiei, коронавируса SARS, рода Schistosoma, рода Shigella, вируса Син Номбре, хантавируса, Sporothrix schenckii, рода Staphylococcus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, рода Taenia, Taenia solium, вируса клещевого энцефалита (TBEV), Toxocara canis или Toxocara cati, Toxoplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, вируса ветряной оспы (VZV), Variola major или Variola minor, приона vCJD, вируса венесуэльского энцефалита лошадей, Vibrio cholerae, вируса Западного Нила, вируса западного энцефалита лошадей, Wuchereria bancrofti, вируса желтой лихорадки, Yersinia enterocolitica, Yersinia pestis и Yersinia pseudotuberculosis.Pathogenic antigens are peptide or protein antigens, preferably derived from pathogens associated with an infectious disease, which are preferably selected from antigens derived from pathogens Acinetobacter baumannii, genus Anaplasma, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, genus Aspergillus, Astroviridae, Babesia genus, Bacillus anthracis, Bacillus cereus, Bartonella henselae, BK virus, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, Borrelia genus, Borrelia spp, Brucella genus, Brugia malayi, Bunyaviridae family, Burkholderia cepacia and others Burkholderia species, Burkholderia mallei, Burkholderia pseudomallei, Caliciviridae family, Campylobacter genus, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, CJD prion, Clonorchis sinensis, Clostridium botulinum, Clostr idium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, coronaviruses, Coryneb acterium diphtheriae, Coxiella burnetii, Crimean Congo hemorrhagic fever virus, Cryptococcus neoformans, Cryptosporidium genus, Cytomegalovirus (CMV), Dengue viruses (DEN- 1, DEN-2, DEN-3 and DEN-4), Dientamoeba fragilis, Ebola virus (EBOV), genus Echinococcus, Ehrlichia chaffeensis, Ehrlichia ewingii, genus Ehrlichia, Entamoeba histolytica, genus Enterococcus, genus Enterovirus, enteroviruses, especially virus Coxsackie A and enterovirus 71 (EV71), Epidermophyton spp, Epstein-Barr virus (EBV), Escherichia coli O157:H7, O111 and O104:H4, Fasciola hepatica and Fasciola gigantica, FFI prion, Filarioidea superfamily, flaviviruses, Francisella tularensis, genus Fusobacterium, Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, GSS prion, Guanarito virus, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, genipavirus (vir c Gendra and Nipah virus), hepatitis A virus, hepatitis B virus (HBV), hepatitis C virus (HCV), hepatitis D virus, hepatitis virus, herpes simplex virus 1 and 2 (HSV-1 and HSV-2), Histoplasma capsulatum , HIV (human immunodeficiency virus), Hortaea werneckii, human bocavirus (HBoV), human herpesvirus 6 (HHV-6) and human herpesvirus 7 (HHV-7), human metapenummonia virus (hMPV), human papillomavirus (HPV) , human parainfluenza viruses (HPIV), Japanese encephalitis virus, JC virus, Junin virus, Kingella kingae, Klebsiella granulomatis, Kuru prion, Lassa virus, Legionella pneumophila, Leishmania genus, Leptospira genus, Listeria monocytogenes, Lymphocytic choriomeningitis virus (LCMV), virus Machupo, Malassezia spp, Marburg virus, Measles virus, Metagonimus yokagawai, Microsporidia phylum, Molluscum contagiosum virus (MCV), Mumps virus, Mycobacterium leprae and Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, Mycoplasma pneumoniae, Naegleria fowleri, Necator americanus, Neisseria gonorrhoeae, Neisseria meningitidis, Nocardia asteroides, Nocardia spp, Onchocerca volvulus, Orientia tsutsugamushi, families Orthomyxoviridae (influenza), Paracoccidioides brasiliensis, Paragonimus spp, Paragonimus westermani, parvovirus Pastmeurella, genus B19, genus Plasmeurella, genus B19 , Pneumocystis jirovecii, poliovirus, rabies virus, respiratory syncytial virus (RSV), rhinovirus, rhinoviruses, Rickettsia akari, Rickettsia genus, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, Rift Valley virus, rotavirus, rubella virus, Sabia virus, Salmonella genus , Sarcoptes scabiei, SARS coronavirus, Schistosoma genus, Shigella genus, Sin Nombre virus, Hantavirus, Sporothrix schenckii, Staphylococcus genus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, Taenia genus, Taenia solium, tick-borne encephalitis virus (TBEV), Toxocara canis or Toxocara cati, To xoplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, varicella zoster virus (VZV), Variola major or Variola minor, prion vCJD, Venezuelan equine encephalitis virus, Vibrio cholerae , West Nile virus, Western equine encephalitis virus, Wuchereria bancrofti, yellow fever virus, Yersinia enterocolitica, Yersinia pestis and Yersinia pseudotuberculosis.

В этом контексте наиболее предпочтительными являются антигены из патогенов, выбранных из вируса гриппа, респираторно-синтициального вируса (RSV), вируса герпеса простого (HSV), вируса папилломы человека (HPV), вируса иммунодефицита человека (HIV), Plasmodium, Staphylococcus aureus, вируса Денге, Chlamydia trachomatis, цитомегаловируса (CMV), вируса гепатита В (HBV), Mycobacterium tuberculosis, вируса бешенства и вируса желтой лихорадки.In this context, antigens from pathogens selected from influenza virus, respiratory syncytial virus (RSV), herpes simplex virus (HSV), human papillomavirus (HPV), human immunodeficiency virus (HIV), Plasmodium, Staphylococcus aureus, virus Dengue, Chlamydia trachomatis, cytomegalovirus (CMV), hepatitis B virus (HBV), Mycobacterium tuberculosis, rabies virus and yellow fever virus.

Опухолевые антигены:Tumor antigens:

В другом варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может кодировать белок или пептид, который содержит пептид или белок, содержащий опухолевый антиген, фрагмент, вариант или производное указанного опухолевого антигена, где предпочтительно, опухолевый антиген представляет собой меланоцит-специфический антиген, раково-тестикулярный антиген или опухоль-специфический антиген, предпочтительно СТ-Х-антиген, не-Х-СТ-антиген, партнер, связывающий СТ-Х-антиген или партнер, связывающий не-Х-СТ-антиген, или опухоль-специфический антиген, более предпочтительно СТ-Х-антиген, партнер, связывающий не-Х-СТ-антиген или опухоль-специфический антиген, или фрагмент, вариант или производное указанного опухолевого антигена; и где каждая из нуклеотидных последовательностей кодирует отличный от других пептид или белок; и где по меньшей мере одна из нуклеотидных последовательностей кодирует 5Т4, 707-АР, 9D7, AFP, AlbZIP HPG1, альфа-5-бета-1-интегрин, альфа-5-бета-6-интегрин, альфа-актинин-4/m, альфа-метилацил-кофермент А-рацемазу, ART-4, ARTC1/m, В7Н4, BAGE-1, BCL-2, bcr/abl, бета-катенин/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, CA19-9, CA72-4, CA125, калретикулин, CAMEL, CASP-8/m, катепсин В, катепсин L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, коактозин-подобный белок, коллаген XXIII, COX-2, CT-9/BRD6, Cten, циклин B1, циклин D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, гепсин, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, гомеобокс NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, незрелый ламининовый рецептор, каллекреин-2, каллекреин-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-А3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, маммоглобин A, MART-1/мелан-А, MART-2, MART-2/m, матриксный белок 22, MC1R, M-CSF, ME1/m, мезотелин, MG50/PXDN, MMP11, MN/CA IX-антиген, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, миозин класса I/m, NA88-A, N-ацетилглюкозаминилтрансферазу-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, остеокальцин, остеопонтин, p15, p190 минорный bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PART-1, PATE, PDEF, Pim-1-киназу, Pin-1, Pml/PARальфа, POTE, PRAME, PRDX5/m, простеин, протеиназу-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP, сурвивин, сурвивин-2В, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGFбета, TGFбетаRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, тирозиназу, UPA, VEGF, VEGFR-2/FLK-1, WT1 и иммуноглобулиновый идиотип лимфоидной кровяной клетки или идиотип Т-клеточного рецептора, или фрагмент, вариант или производное указанного опухолевого антигена; предпочтительно сурвивин или его гомолог, антиген семейства MAGE или его связывающий партнер или фрагмент, вариант или производное указанного опухолевого антигена. Наиболее предпочтительными в этом контексте являются опухолевые антигены NY-ESO-1, 5Т4, MAGE-C1, MAGE-C2, сурвивин, Muc-1, PSA, PSMA, PSCA, STEAP и РАР.In another embodiment of the invention, the artificial nucleic acid molecule of the present invention may encode a protein or peptide that contains a peptide or protein containing a tumor antigen, fragment, variant or derivative of said tumor antigen, where preferably the tumor antigen is melanocyte-specific antigen, cancer-testicular antigen or tumor-specific antigen, preferably CT-X antigen, non-X-CT antigen, CT-X antigen binding partner or non-X-CT antigen binding partner, or tumor- a specific antigen, more preferably a CT-X antigen, a non-X-CT antigen binding partner, or a tumor-specific antigen, or a fragment, variant or derivative of said tumor antigen; and where each of the nucleotide sequences encodes a different peptide or protein; and where at least one of the nucleotide sequences encodes 5T4, 707-AP, 9D7, AFP, AlbZIP HPG1, alpha-5-beta-1-integrin, alpha-5-beta-6-integrin, alpha-actinin-4/m , alpha-methylacyl-coenzyme A-racemase, ART-4, ARTC1/m, B7H4, BAGE-1, BCL-2, bcr/abl, beta-catenin/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, CA19-9, CA72-4, CA125, calreticulin, CAMEL, CASP-8/m, cathepsin B, cathepsin L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, coactosin-like protein, collagen XXIII, COX-2, CT-9/ BRD6, Cten, cyclin B1, cyclin D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6- AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT- V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, hepsin, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, homeobox NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HP V-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, immature laminin receptor, kallecrein-2, kallecrein-4, Ki67, KIAA0205, KIAA0205/ m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE- C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, mammoglobin A, MART-1/melan-A, MART-2, MART-2 /m, matrix protein 22, MC1R, M-CSF, ME1/m, mesothelin, MG50/PXDN, MMP11, MN/CA IX antigen, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, class I/m myosin, NA88-A, N-acetylglucosaminyltransferase-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, osteocalcin, osteopontin, p15, p190 minor bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PART-1, PATE, PDEF, Pim-1-kinase, Pin-1, Pml/PARalpha, POTE, PRAME, PRDX5/ m, protein, proteins Nazu-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART- 3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP, Survivin, Survivin-2B, SYT-SSX-1, SYT-SSX- 2, TA-90, TAG-72, TARP, TEL-AML1, TGFbeta, TGFbetaRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP- p8, tyrosinase, UPA, VEGF, VEGFR-2/FLK-1, WT1 and an immunoglobulin idiotype of a lymphoid blood cell or an idiotype of a T-cell receptor, or a fragment, variant or derivative of said tumor antigen; preferably survivin or a homologue thereof, a MAGE family antigen or a binding partner or fragment, variant or derivative thereof of said tumor antigen. Most preferred in this context are the tumor antigens NY-ESO-1, 5T4, MAGE-C1, MAGE-C2, survivin, Muc-1, PSA, PSMA, PSCA, STEAP and PAP.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты кодирует белок или пептид, который содержит терапевтический белок или его фрагмент, вариант или производное.In a preferred embodiment of the invention, the artificial nucleic acid molecule encodes a protein or peptide that contains a therapeutic protein or a fragment, variant or derivative thereof.

В контексте настоящего описания терапевтические белки представляют собой пептиды или белки, которые оказывают полезное действие при лечении любого врожденного или приобретенного заболевания или которые улучшают состояние индивидуума. В частности, терапевтические белки имеют важное значение для создания терапевтических средств, которые могут помимо осуществления других функций модифицировать и осуществлять репарацию генетических ошибок, разрушать раковые клетки или инфицированные патогеном клетки, лечить нарушения иммунной системы, лечить метаболические или эндокринные нарушения. Например, эритропоэтин (ЕРО), белковый гормон, можно применять для лечения пациентов с дефицитом эритроцитов, который является обычной причиной почечных осложнений. Кроме того, под понятие «терапевтические белки» подпадают адъювантные белки, терапевтические антитела, а также средства гормонзаместительной терапии, которую применяют, например, при лечении женщин в период менопаузы. В более современных подходах используют соматические клетки пациента для перепрограммирования их в плюрипотентные стволовые клетки, что является заменой спорной терапии на основе стволовых клеток. Такие белки, применяемые для перепрограммирования соматических клеток или применяемые для дифференцировки стволовых клеток, также рассматриваются как терапевтические белки в контексте настоящего описания. Кроме того, терапевтические белки можно применять и для других целей, например, для заживления ран, регенерации тканей, ангиогенеза и т.д. Кроме того, в контексте настоящего описания антигенпрезентирующие В-клеточные рецепторы и их фрагменты и варианты рассматриваются как терапевтические белки.In the context of the present description, therapeutic proteins are peptides or proteins that have a beneficial effect in the treatment of any congenital or acquired disease or that improve the condition of the individual. In particular, therapeutic proteins are important for the development of therapeutic agents that can, among other functions, modify and repair genetic errors, destroy cancer cells or pathogen-infected cells, treat immune system disorders, and treat metabolic or endocrine disorders. For example, erythropoietin (EPO), a protein hormone, can be used to treat patients with red blood cell deficiency, which is a common cause of renal complications. In addition, the term "therapeutic proteins" includes adjuvant proteins, therapeutic antibodies, as well as hormone replacement therapy, which is used, for example, in the treatment of women during menopause. More recent approaches use the patient's somatic cells to reprogram them into pluripotent stem cells, replacing controversial stem cell therapies. Such proteins used for reprogramming somatic cells or used for stem cell differentiation are also considered therapeutic proteins in the context of the present disclosure. In addition, therapeutic proteins can be used for other purposes, such as wound healing, tissue regeneration, angiogenesis, and so on. In addition, in the context of the present description, antigen-presenting B-cell receptors and their fragments and variants are considered as therapeutic proteins.

Таким образом, терапевтические белки можно применять для различных целей, включая лечение различных заболеваний, таких, например, как инфекционные заболевания, неоплазмы (например, раковые или опухолевые заболевания), заболевания крови или кроветворных органов, эндокринных, связанных с питанием или метаболических заболеваний, заболеваний нервной системы, заболеваний системы кровообращения, заболеваний дыхательной системы, заболеваний пищеварительной системы, заболеваний кожи и подкожной ткани, заболеваний скелетно-мышечной системы и соединительной ткани, и заболеваний мочеполовой системы, независимо от того, являются ли они врожденными или приобретенными.Thus, therapeutic proteins can be used for various purposes, including the treatment of various diseases, such as, for example, infectious diseases, neoplasms (for example, cancer or tumor diseases), diseases of the blood or blood-forming organs, endocrine, nutritional or metabolic diseases, diseases nervous system, diseases of the circulatory system, diseases of the respiratory system, diseases of the digestive system, diseases of the skin and subcutaneous tissue, diseases of the musculoskeletal system and connective tissue, and diseases of the genitourinary system, whether they are congenital or acquired.

В этом контексте наиболее предпочтительными терапевтическими белками, которые можно применять, среди прочего, для лечения метаболических или эндокринных нарушений, являются (в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок): кислая сфингомиелиназа (болезнь Нимана-Пика), адипотид (ожирение), агалзидаза-бета (человеческая галактозидаза А) (болезнь Фабри; препятствует накоплению липидов, которое может приводить к почечным и сердечно-сосудистым осложнениям), алглукозидаза (болезнь Помпе (гликогеноз (накопление гликогена) типа II)), альфа-галактозидаза А (альфа-GAL А, агалзидаза-альфа) (болезнь Фабри), альфа-глюкозидаза (гликогеноз (GSD), болезнь Помпе), альфа-L-идуронидаза (мукополисахаридоз (MPS), синдром Гурлер, синдром Шейе), альфа-N-ацетилглюкозаминидаза (синдром Санфилиппо), амфирегулин (рак, метаболическое нарушение), ангиопоэтин ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (ангиогенез, стабилизирует сосуды), бетацеллюлин (метаболическое нарушение), бета-глюкуронидаза (синдром Слая), костный морфогенетический белок BMP (ВМР1, ВМР2, ВМР3, ВМР4, ВМР5, ВМР6, ВМР7, ВМР8а, BMP8b, ВМР10, BMP15) (регенеративное действие, состояния, связанные с костной тканью, хроническое заболевание почек (CKD)), белок CLN6 (болезнь, вызванная мутациями в локусе CLN6 - атипичный поздний инфантилизм, вариант с поздним началом, ранний ювенильный, нейрональный цероид-липофусциноз (NCL)), эпидермальный фактор роста (EGF) (заживление ран, регуляция роста, пролиферации и дифференцировки клеток), эпиген (метаболическое нарушение), эпирегулин (метаболическое нарушение), фактор роста фибробластов (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (заживление ран, ангиогенез, эндокринные нарушения, регенерация ткани), галсульфаза (мукополисахаридоз типа VI), грелин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), глюкоцереброзидаза (болезнь Гоше), GM-CSF (регенеративное действие, производство лейкоцитов, рак), гепаринсвязывающий EGF-подобный фактор роста (HB-EGF) (заживление ран, гипертрофия сердца и развитие и функция сердца), фактор роста гепатоцитов HGF (регенеративное действие, заживление ран), гепсидин (нарушения метаболизма железа, бета-талассемия), человеческий альбумин (пониженное производство альбумина (гипопротеинемия), повышенная потеря альбумина (нефротический синдром), гиповолемия, гипербилирубинемия), идурсульфаза (идуронат-2-сульфатаза) (мукополисахаридоз типа II (синдром Хантера)), интегрины αVβ3, αVβ5 и α5β1 (связывают матриксные макромолекулы и протеиназы, ангиогенез), идуронатсульфатаза (синдром Хантера), ларонидаза (мукополисахаридоз типа I, формы Гурлер и Гурлер-Шайе), N-ацетилгалактозамин-4-сульфатаза (rhASB; галсульфаза, арилсульфатаза A (ARSA), арилсульфатаза В (ARSB)) (дефицит арилсульфатазы В, синдром Марото-Лами, мукополисахаридоз типа VI), N-ацетилглюкозамин-6-сульфатаза (синдром Санфилиппо), фактор роста нервов (NGF, мозговой нейротрофический фактор (BDNF), нейротрофин-3 (NT-3) и нейротрофин 4/5 (NT-4/5) (регенеративное действие, сердечно-сосудистые заболевания, коронарный атеросклероз, ожирение, диабет типа 2, метаболический синдром, острые коронарные синдромы, деменция, депрессия, шизофрения, аутизм, синдром Ретта, нервная анорексия, нервная булимия, заживление ран, кожные язвы, изъязвления роговицы, болезнь Альцгеймера), нейрегулин (NRG1, NRG2, NRG3, NRG4) (метаболическое нарушение, шизофрения), нейропилин (NRP-1, NRP-2) (ангиогенез, управление аксонами, выживание, миграция клеток), обестатин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), фактор роста тромбоцитов (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (регенеративное действие, заживление ран, нарушение ангиогенеза, артериосклероз, фиброз, рак), рецепторы TGF-бета (эндоглин, рецептор TGF-бета 1, рецептор TGF-бета 2, рецептор TGF-бета 3) (почечный фиброз, заболевание почек, диабет, терминальная стадия почечной болезни (ESRD), ангиогенез), тромбопоэтин (ТНРО) (фактор роста и развития мегакариоцитов (MGDF)) (тромбоцитарные нарушения, тромбоциты для донорской сдачи, восстановление уровня тромбоцитов после миелосупрессорной химиотерапии), трансформирующий фактор роста (TGF (TGF-альфа, TGF-бета (TGFбета1, TGFбета2 и TGFбета3))) (регенеративное действие, заживление ран, иммунитет, рак, заболевание сердца, диабет, синдром Марфана, синдром Лоеса-Дитца), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F и PIGF) (регенеративное действие, ангиогенез, заживление ран, рак, проницаемость), несритид (острая декомпенсированная застойная сердечная недостаточность), трипсин (декубитальная язва, варикозная язва, санация струпа, спонтанно раскрывающаяся рана, солнечный ожог, мекониевая непроходимость кишечника), адренокортикотропный гормон (АСТН) (болезнь Аддисона, мелкоклеточная саркома, адренолейкодистрофия, врожденная гиперплазия надпочечников, синдром Кушинга, синдром Нельсона, детские спазмы), предсердный натрийуретический пептид (ANP) (эндокринные нарушения), холецистокинин (различной длины), гастрин (гипогастринемия), лептин (диабет, гиперглицинемия, ожирение), окситоцин (стимулирует грудное кормление, ненаступление родов), соматостатин (симптоматическое лечение карционоидного синдрома, острое варикозное кровотечение и акромегалия, поликистозные заболевания печени и почек, акромегалия и симптомы, вызываемые нейроэндокринными опухолями), вазопрессин (антидиуретический гормон) (несахарный диабет), кальцитонин (постменопаузальный остеопороз, гиперкальциемия, болезнь Пэджета, метастазы в костную ткань, фантомная боль к конечностях, спинальный стеноз), экзенатид (диабет типа 2, устойчивый к обработке метформином и сульфонилмочевиной), гормон роста (GH), соматотропин (нарушение роста вследствие дефицита GH или хронической печеночной недостаточности, синдром Прадера-Вилли, синдром Турнера, обусловленное СПИДом истощение или кахексия при осуществлении противовирусной терапии), инсулин (сахарный диабет, диабетический кетоацидоз, гиперкалиемия), инсулиноподобный фактор роста 1 IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мекасермин ринфабат, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мегасермин, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), пэгвисомант (акромегалия), прамлинтид (сахарный диабет, в комбинации с инсулином), терипаратид (человеческий паратиреоидный гормон, остатки 1-34) (серьезный остеопороз), бекаплермин (вспомогательное средство при санации диабетических язв), диботермин-альфа (костный морфогенный белок 2) (хирургическая операция по закреплению позвоночника (Spinal Fusion), восстановление кости при повреждении), гистрелина ацетат (гонадотропин-рилизинг гормон; GnRH) (преждевременное половое созревание), октреотид (акромегалия, симптоматическое ослабление VIP-секретирующей аденомы и метастатических карциноидных опухолей) ипалифермин (фактор роста кератиноцитов; KGF) (серьезный оральный мукозит у пациентов, подвергающихся химиотерапии, заживление ран).In this context, the most preferred therapeutic proteins that can be used, among others, for the treatment of metabolic or endocrine disorders are (in brackets the specific disease for which the therapeutic protein is used is indicated): acid sphingomyelinase (Niemann-Pick disease), adipotide (obesity ), agalsidase-beta (human galactosidase A) (Fabry disease; interferes with lipid accumulation, which can lead to kidney and cardiovascular complications), alglucosidase (Pompe disease (glycogenosis (accumulation of glycogen) type II)), alpha-galactosidase A ( alpha-GAL A, agalsidase-alpha) (Fabry disease), alpha-glucosidase (glycogenosis (GSD), Pompe disease), alpha-L-iduronidase (mucopolysaccharidosis (MPS), Hurler syndrome, Scheye syndrome), alpha-N-acetylglucosaminidase (Sanfilippo syndrome), amphiregulin (cancer, metabolic disorder), angiopoietin ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (angiogenesis, stabilizes cos uds), betacellulin (metabolic disorder), beta-glucuronidase (Sly syndrome), bone morphogenetic protein BMP (BMP1, BMP2, BMP3, BMP4, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP10, BMP15) (regenerative action, conditions, bone-related, chronic kidney disease (CKD)), CLN6 protein (disease caused by mutations at the CLN6 locus - atypical late infantilism, late-onset variant, early juvenile, neuronal ceroid lipofuscinosis (NCL)), epidermal growth factor (EGF ) (wound healing, regulation of cell growth, proliferation and differentiation), epigen (metabolic disorder), epiregulin (metabolic disorder), fibroblast growth factor (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF- 5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (wound healing, angiogenesis, endocrine disruption, tissue regeneration), galsulfase (mucopolysaccharidosis type VI), ghrelin (irritable bowel syndrome (IBS), obesity, Prader-Willi syndrome, type II diabetes mellitus), glucocerebrosidase (Gaucher disease), GM-CSF (regenerative action, leukocyte production, cancer), heparin-binding EGF-like growth factor (HB-EGF) (healing wounds, cardiac hypertrophy and cardiac development and function), hepatocyte growth factor HGF (regenerative action, wound healing), hepcidin (iron metabolism disorders, beta-thalassemia), human albumin (decreased albumin production (hypoproteinemia), increased albumin loss (nephrotic syndrome ), hypovolemia, hyperbilirubinemia), idursulfase (iduronate-2-sulfatase) (mucopolysaccharidosis type II (Hunter syndrome)), αVβ3, αVβ5 and α5β1 integrins (bind matrix macromolecules and proteinases, angiogenesis), iduronate sulfatase (Hunter syndrome), laronidase (mucopolysaccharidosis type I, Hurler and Hurler-Shaie forms), N-acetylgalactosamine-4-sulfatase (rhASB; galsulfase, arylsulfatase A (ARSA), arylsulfatase B (ARSB)) (arylsulfatase B deficiency, Maroteau-Lami syndrome, mucopolysaccharidosis type VI), N-acetylglucosamine-6-sulfatase (Sanfilippo syndrome), nerve growth factor (NGF, brain-derived neurotrophic factor (BDNF), neurotrophin-3 (NT-3) and neurotrophin 4/5 (NT-4/5) (regenerative action, cardiovascular disease, coronary atherosclerosis, obesity, type 2 diabetes, metabolic syndrome, acute coronary syndromes, dementia , depression, schizophrenia, autism, Rett syndrome, anorexia nervosa, bulimia nervosa, wound healing, skin ulcers, corneal ulceration, Alzheimer's disease), neuregulin (NRG1, NRG2, NRG3, NRG4) (metabolic disorder, schizophrenia), neuropilin (NRP- 1, NRP-2) (angiogenesis, axonal guidance, survival, cell migration), obestatin (irritable bowel syndrome (IBS), obesity, Prader-Willi syndrome, type II diabetes mellitus), platelet growth factor (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (regenerative effect, for wound healing, angiogenesis disorder, arteriosclerosis, fibrosis, cancer), TGF-beta receptors (endoglin, TGF-beta 1 receptor, TGF-beta 2 receptor, TGF-beta 3 receptor) (renal fibrosis, kidney disease, diabetes, end-stage renal diseases (ESRD), angiogenesis), thrombopoietin (THRO) (megakaryocyte growth and development factor (MGDF)) (platelet disorders, platelets for donation, recovery of platelet levels after myelosuppressive chemotherapy), transforming growth factor (TGF (TGF-alpha, TGF -beta (TGFbeta1, TGFbeta2 and TGFbeta3))) (regenerative action, wound healing, immunity, cancer, heart disease, diabetes, Marfan syndrome, Loes-Dietz syndrome), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F and PIGF) (regenerative action, angiogenesis, wound healing, cancer, permeability), nesritide (acute decompensated congestive heart failure), trypsin (decubital ulcer, varicose ulcer, eschar debridement, spontaneous opening wound, sunburn, mek onium ileus), adrenocorticotropic hormone (ACTH) (Addison's disease, small cell sarcoma, adrenoleukodystrophy, congenital adrenal hyperplasia, Cushing's syndrome, Nelson's syndrome, infantile spasms), atrial natriuretic peptide (ANP) (endocrine disorders), cholecystokinin (various lengths), gastrin (hypogastrinemia), leptin (diabetes, hyperglycinemia, obesity), oxytocin (stimulates breastfeeding, non-delivery), somatostatin (symptomatic treatment of carcinoid syndrome, acute variceal bleeding and acromegaly, polycystic liver and kidney disease, acromegaly and symptoms caused by neuroendocrine tumors ), vasopressin (antidiuretic hormone) (diabetes insipidus), calcitonin (postmenopausal osteoporosis, hypercalcemia, Paget's disease, bone metastases, phantom limb pain, spinal stenosis), exenatide (type 2 diabetes resistant to metformin and sulfonylurea treatment), growth hormone (GH), som atotropin (growth failure due to GH deficiency or chronic liver failure, Prader-Willi syndrome, Turner syndrome, AIDS-related wasting or cachexia during antiviral therapy), insulin (diabetes mellitus, diabetic ketoacidosis, hyperkalemia), insulin-like growth factor 1 IGF-1 ( growth retardation in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease, cardiovascular disease, heart failure), mecasermine rinfabate, IGF-1 analogue (growth failure in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease , cardiovascular disease, heart failure), megasermin, IGF-1 analogue (growth failure in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease, cardiovascular disease, heart failure), pegvisomant (acromegaly), pramlintide ( diabetes mellitus, in combination with insulin m), teriparatide (human parathyroid hormone, residues 1-34) (severe osteoporosis), becaplermin (adjuvant in the debridement of diabetic ulcers), dibotermin-alpha (bone morphogenic protein 2) (surgery to fix the spine (Spinal Fusion), recovery bones when damaged), histrelin acetate (gonadotropin-releasing hormone; GnRH) (precocious puberty), octreotide (acromegaly, symptomatic attenuation of VIP-secreting adenoma and metastatic carcinoid tumors) andalifermin (keratinocyte growth factor; KGF) (severe oral mucositis in patients undergoing chemotherapy, wound healing).

Указанные и другие белки рассматриваются как терапевтические, поскольку они предназначены для лечения индивидуума путем возмещения нарушенного эндогенного производства в его организме функционального белка в достаточных количествах. Следовательно, такие терапевтические белки, как правило, представляют собой белки млекопитающих, прежде всего человеческие белки.These and other proteins are considered therapeutic since they are intended to treat the individual by replacing the disturbed endogenous production in his body of a functional protein in sufficient quantities. Therefore, such therapeutic proteins are typically mammalian proteins, especially human proteins.

Для лечения нарушений крови, заболеваний системы кровообращения, заболеваний дыхательной системы, раковых или опухолевых заболеваний, инфекционных заболеваний или иммунодефицитов можно применять такие терапевтические белки, как: альтерплаза (активатор тканевого плазминогена; tPA) (легочная эмболия, инфаркт миокарда, острый ишемический инсульт («удар»), окклюзия устройств центрального венозного доступа), анистреплаза (тромболизис), антитромбин III (АТ-III) (наследственный дефицит АТ-III, тромбоэмболия), бивалирудин (снижает риск свертывания крови при коронарной ангиопластике и индуцированной гепарином тромбоцитопении), дарбепоэтин-альфа (лечение анемии у пациентов с хронической почечной недостаточностью и хроническим почечным нарушением (+/- диализ)), дротрекогин-альфа (активированный белок С) (серьезный сепсис с высоким риском смерти), эритропоэтин, эпоэтин-альфа, эритропоэтин, эритропоетин (анемия при хроническом заболевании, миелодисплазия, анемия при почечной недостаточности или при осуществлении химиотерапии, предоперационная подготовка), фактор IX (гемофилия В), фактор VIIa (кровоизлияние у пациентов с гемофилией А или В и при применении ингибиторов фактора VIII или фактора IX), фактор VIII (гемофилия А), лепирудин (индуцируемая гепарином тромбоцитопения), концентрат белка С (венозный тромбоз, молниеносная пурпура), ретеплаза (делеция мутеина в tPA) (лечение острого инфаркта миокарда, улучшение функции желудочков), стрептокиназа (остро развивающийся трансмуральный инфаркт миокарда, легочная эмболия, тромбоз глубоких вен, артериальный тромбоз или эмболия, окклюзия артериовенозной канюли), тенестеплаза (острый инфаркт миокарда), урокиназа (легочная эмболия), ангиостатин (рак), анти-CD22 иммунотоксин (рецидивирующий острый миелоидный CD33+-лейкоз), денилейкин дифтитокс (кожная Т-клеточная лимфома (CTCL)), иммуноцианин (рак мочевого пузыря и предстательной железы), MPS (металлопанстимулин) (рак), афлиберцепт (немелкоклеточный рак легкого (NSCLC), метастатический колоректальный рак (mCRC), гормон-устойчивый метастатический рак предстательной железы, влажная форма дегенерации желтого пятна), эндостатин (рак, воспалительные заболевания типа ревматоидного артрита, а также болезнь Крона, диабетическая ретинопатия, псориаз и эндометриоз), коллагеназа (санация хронических кожных язв и областей серьезных ожогов, контрактура Дюпюитрена, болезнь Пейрони), человеческая дезоксирибонуклеаза I, дорназа (муковисцидоз; уменьшение инфекций респираторного тракта у выбранных пациентов с FVC, превышающим более чем на 40% предсказанную величину), гиалуронидаза (применяется в качестве адъюванта для повышения абсорбции и диспергирования инъецированных лекарственных средств, прежде всего анестезирующих средств при глазной хирургии и определенных визуализирующих агентов), папаин (санация некротической ткани или разжижение отторгающихся некротических масс при острых и хронических повреждениях, таких как пролежни, варикозные и диабетические язвы, ожоги, послеоперационные раны, пилонидальные кистозные раны, карбункулы и другие раны), L-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), пэг-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), расбуриказа (пациенты детского возраста с лейкозом, лимфомой и солидными опухолями, подвергающиеся противораковой терапии, которая может вызывать синдром лизиса опухоли), человеческий хорионный гонадотропин (HCG) (улучшает репродуктивную функцию), человеческий фолликулостимулирующий гормон (FSH) (улучшает репродуктивную функцию), лутропин-альфа (бесплодие, сопровождающееся дефицитом лютениизирующего гормона), пролактин (гипопролактинемия, дефицит сывороточного пролактина, дисфункция яичника у женщин, состояние страха, артериогенная эректильная дисфункция, преждевременное семяизвержение, олигозооспермия, астеноспермия, пониженная функция семенных пузырьков, гипоандрогенизм у мужчин), ингибитор альфа-1-протеиназы (врожденный дефицит антитрипсина), лактаза (газообразование, вздутие, спазмы и диарея вследствие неспособности расщеплять лактозу), панкреатические ферменты (липаза, амилаза, протеиназа) (муковисцидоз, хронический панкреатит, панкреатическая недостаточность, состояние после операции желудочного шунтирования по Билльрот типа II (Billroth II), обструкция протоков поджелудочной железы, стеаторрея, недостаточное пищеварение, газообразование, вздутие), аденозиндеаминаза (бычья пегадемаза, PEG-ADA) (заболевания с серьезным комбинированным иммунодефицитом вследствие дефицита аденозиндеаминазы), абатецепт (ревматоидный артрит (прежде всего, рефракторный в отношении ингибирования TNF-альфа)), алефацепт (бляшковидный псориаз), анакинра (ревматоидный артрит), этанецепт (ревматоидный артрит, многосуставной юношеский ревматоидный артрит, псориатический артрит, анкилоизирующий спондилит, бляшковидный псориаз, анкилоизирующий спондилит), антагонист рецептора интерлейкина-1 (IL-1), анакинра (воспаление и деградация хряща, ассоциированная с ревматоидным артритом), тимулин (нейродегенеративные заболевания, ревматизм, нервная анорексия), антагонист TNF-альфа (аутоиммунные заболевания, такие как ревматоидный артрит, анкилоизирующий спондилит, болезнь Крона, псориаз, гнойный гидраденит, рефрактерная астма), энфувиртид (HIV-1-инфекция) и тимозин α1 (гепатит В и С)Therapeutic proteins such as alterplase (tissue plasminogen activator; tPA) (pulmonary embolism, myocardial infarction, acute ischemic stroke ("stroke"), occlusion of central venous access devices), anistreplase (thrombolysis), antithrombin III (AT-III) (hereditary deficiency of AT-III, thromboembolism), bivalirudin (reduces the risk of blood clotting in coronary angioplasty and heparin-induced thrombocytopenia), darbepoetin- alpha (treatment of anemia in patients with chronic renal failure and chronic renal impairment (+/- dialysis)), drotrecogin-alpha (activated protein C) (serious sepsis with high risk of death), erythropoietin, epoetin-alpha, erythropoietin, erythropoietin (anemia in chronic disease, myelodysplasia, anemia in renal failure or in chemotherapy, preoperative preparation), factor IX (hemophilia B), factor VIIa (hemorrhage in patients with hemophilia A or B and the use of factor VIII or factor IX inhibitors), factor VIII (hemophilia A), lepirudin (heparin-induced thrombocytopenia), protein C concentrate (venous thrombosis, fulminant purpura), reteplase (mutein deletion in tPA) (treatment of acute myocardial infarction, improvement of ventricular function), streptokinase (acute transmural myocardial infarction, pulmonary embolism, deep vein thrombosis, arterial thrombosis or embolism, occlusion arteriovenous cannula), tenesteplase (acute myocardial infarction), urokinase (pulmonary embolism), angiostatin (cancer), anti-CD22 immunotoxin (recurrent acute myeloid CD33 + leukemia), denileukin diftitox (cutaneous T-cell lymphoma (CTCL)), immunocyanin (bladder and prostate cancer), MPS (metalopanstimulin) (cancer), aflibercept (non-small cell lung cancer (NSCLC), metastatic colorectal cancer (mCRC), hormone-resistant metastatic prostate cancer, wet macular degeneration), endostatin (cancer, inflammatory diseases such as rheumatoid arthritis, as well as Crohn's disease, diabetic retinopathy, psoriasis and endometriosis), collagenase (treatment of chronic skin ulcers and areas of severe burns, Dupuytren's contracture, Peyronie's disease), human deoxyribonuclease I, dornase (cystic fibrosis; reduction of respiratory tract infections in selected patients with an FVC greater than 40% predicted), hyaluronidase (used as an adjuvant to increase the absorption and dispersion of injected drugs, primarily anesthetics for eye surgery and certain imaging agents), papain ( debridement of necrotic tissue or liquefaction of sloughing necrotic masses in acute and chronic injuries such as bedsores, varicose and diabetic ulcers, burns, postoperative wounds, pilonidal cystic wounds, carbuncles and other wounds), L-asparaginase (acute lymphocytic leukemia requiring exogenous asparagine for proliferation), peg-asparaginase (acute lymphocytic leukemia requiring exogenous asparagine for proliferation), rasburicase (childhood patients with leukemia, lymphoma, and solid tumors undergoing anticancer therapy that can cause tumor lysis syndrome), human chorio gonadotropin (HCG) (improves reproductive function), human follicle stimulating hormone (FSH) (improves reproductive function), lutropin-alpha (infertility accompanied by luteinizing hormone deficiency), prolactin (hypoprolactinemia, serum prolactin deficiency, ovarian dysfunction in women, state of fear , arteriogenic erectile dysfunction, premature ejaculation, oligozoospermia, asthenospermia, reduced function of seminal vesicles, hypoandrogenism in men), alpha-1-proteinase inhibitor (congenital antitrypsin deficiency), lactase (gas formation, bloating, cramps and diarrhea due to inability to break down lactose), pancreatic enzymes (lipase, amylase, proteinase) (cystic fibrosis, chronic pancreatitis, pancreatic insufficiency, post-Billroth II gastric bypass surgery, pancreatic duct obstruction, steatorrhoea, maldigestion, gas, bloating), adenosine deaminases a (bovine pegademase, PEG-ADA) (diseases with severe combined immunodeficiency due to adenosine deaminase deficiency), abathecept (rheumatoid arthritis (primarily refractory to TNF-alpha inhibition)), alefacept (plaque psoriasis), anakinra (rheumatoid arthritis), ethanecept (rheumatoid arthritis, polyarticular juvenile rheumatoid arthritis, psoriatic arthritis, ankylosing spondylitis, plaque psoriasis, ankylosing spondylitis), interleukin-1 (IL-1) receptor antagonist, anakinra (inflammation and cartilage degradation associated with rheumatoid arthritis), thymulin (neurodegenerative diseases, rheumatism, anorexia nervosa), a TNF-alpha antagonist (autoimmune diseases such as rheumatoid arthritis, ankylosing spondylitis, Crohn's disease, psoriasis, hidradenitis suppurativa, refractory asthma), enfuvirtide (HIV-1 infection), and thymosin α1 (hepatitis B and C)

(в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок).(in parentheses is the specific disease for which the therapeutic protein is used).

Следующим объектом настоящего изобретения является вектор, содержащийThe next object of the present invention is a vector containing

а. открытую рамку считывания (ОРС) и/или сайт клонирования, например, предназначенный для встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания; иa. an open reading frame (ORF) and/or a cloning site, for example, for inserting an open reading frame or a sequence containing an open reading frame; and

б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент) и/или по меньшей мере один элемент 5'-нетранслируемой области (5'-UTR-элемент), при этом указанная искусственная нуклеиновая кислота характеризуется высокой эффективностью трансляции.b. at least one 3'-untranslated region element (3'-UTR element) and/or at least one 5'-untranslated region element (5'-UTR element), wherein said artificial nucleic acid is characterized by high translation efficiency .

Как правило, вектор, предлагаемой в настоящем изобретении, может содержать искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, которая описана выше. В частности, предпочтительные варианты осуществления изобретения, указанные выше при описании искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, применимы также и для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, которая содержится в векторе, предлагаемом в настоящем изобретении. Например, в предлагаемом в изобретении векторе по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент и ОРС представляют собой структуры, указанные выше при описании искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, включая предпочтительные варианты осуществления изобретения. Например, в векторе, предлагаемом в настоящем изобретении, стабильная мРНК, из которой получен по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент предпочтительно может характеризоваться тем, что обеспечивает такое расщепление мРНК, при котором отношение количества указанной мРНК во второй момент времени к количеству указанной мРНК в первый момент времени составляет по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%), по меньшей мере 0,9 (90%) или по меньшей мере 0,95 (95%).Typically, the vector of the present invention may contain an artificial nucleic acid molecule of the present invention as described above. In particular, the preferred embodiments of the invention described above in the description of the artificial nucleic acid molecule of the present invention are also applicable to the artificial nucleic acid molecule of the present invention contained in the vector of the present invention. For example, in the vector of the invention, at least one 3'-UTR element and/or at least one 5'-UTR element and the ORF are the structures indicated above when describing the artificial nucleic acid molecule of the present invention, including preferred embodiments of the invention. For example, in a vector of the present invention, a stable mRNA from which at least one 3'UTR element and/or at least one 5'UTR element is derived can preferably be characterized in that it cleaves the mRNA wherein the ratio of the amount of said mRNA at the second time point to the amount of said mRNA at the first time point is at least 0.5 (50%), at least 0.6 (60%), at least 0.7 (70% ), at least 0.75 (75%), at least 0.8 (80%), at least 0.85 (85%), at least 0.9 (90%), or at least 0 .95 (95%).

Сайт клонирования может представлять собой любую последовательность, пригодную для встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания, например, один или несколько сайтов рестрикции. Таким образом, вектор содержит сайт клонирования, предпочтительно пригодный для встраивания открытой рамки считывания в вектор, предпочтительно для встраивания открытой рамки считывания с 3'-стороны относительно 5'-UTR-элемента и/или с 5'-стороны относительно 3'-UTR-элемента. Предпочтительно сайт клонирования или ОРС расположен/расположена с 3'-стороны относительно 5'-UTR-элемента и/или с 5'-стороны относительно 3'-UTR-элемента, предпочтительно в непосредственной близости от 3'-конца 5'-UTR-элемента и/или 5'-конца 3'-UTR-элемента. Например, сайт клонирования или ОРС могут быть непосредственно присоединены к 3'-концу 5'-UTR-элемента и/или к 5'-концу 3'-UTR-элемента, или они могут быть присоединены с помощью нуклеотидного сегмента, например, сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, как указано выше при описании искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.The cloning site can be any sequence suitable for inserting an open reading frame or a sequence containing an open reading frame, such as one or more restriction sites. Thus, the vector contains a cloning site, preferably suitable for inserting an open reading frame into the vector, preferably for inserting an open reading frame from the 3' side of the 5'-UTR element and/or from the 5' side of the 3'-UTR- element. Preferably, the cloning site or ORF is/is located 3'-side of the 5'-UTR element and/or 5'-side of the 3'-UTR element, preferably in close proximity to the 3'-end of the 5'-UTR- element and/or the 5' end of the 3' UTR element. For example, the cloning site or ORF may be directly attached to the 3'end of the 5'UTR element and/or to the 5'end of the 3'UTR element, or they may be attached via a nucleotide segment, e.g. consisting of 2, 4, 6, 8, 10, 20, etc. nucleotides as described above in the description of the artificial nucleic acid molecule of the present invention.

Предпочтительно вектор, предлагаемой в настоящем изобретении, можно применять для производства искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно производства искусственной мРНК, предлагаемой в настоящем изобретении, например, необязательно путем встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания, в вектор и транскрибирования вектора. Так, предпочтительно вектор содержит элементы, необходимые для транскрипции, такие как промотор, например, промотор РНК-полимеразы. Предпочтительно вектор пригоден для транскрипции с использованием эукариотической, прокариотической, вирусной или фаговой систем транскрипции, таких как эукариотические клетки, прокариотические клетки или эукариотические, прокариотические, вирусные или фаговые системы транскрипции in vitro. Так, например, вектор может содержать промоторную последовательность, которая распознается полимеразой, такой как РНК-полимераза, например, эукариотической, прокариотической, вирусной или фаговой РНК-полимеразой. В предпочтительном варианте осуществления изобретения вектор содержит промотор РНК-полимеразы фага, такой как промотор фага SP6, Т3 или Т7, предпочтительно промотор фага Т7. Предпочтительно вектор пригоден для транскрипции in vitro с использованием системы транскрипции in vitro на основе фага, такой как система транскрипции in vitro на основе РНК-полимеразы фага Т7.Preferably, the vector of the present invention can be used to produce an artificial nucleic acid molecule of the present invention, preferably the production of an artificial mRNA of the present invention, for example, optionally by inserting an open reading frame or a sequence containing an open reading frame into the vector and transcribing the vector. Thus, preferably the vector contains elements necessary for transcription, such as a promoter, for example, an RNA polymerase promoter. Preferably, the vector is suitable for transcription using eukaryotic, prokaryotic, viral or phage transcription systems such as eukaryotic cells, prokaryotic cells or in vitro eukaryotic, prokaryotic, viral or phage transcription systems. Thus, for example, the vector may contain a promoter sequence that is recognized by a polymerase, such as an RNA polymerase, for example, a eukaryotic, prokaryotic, viral, or phage RNA polymerase. In a preferred embodiment, the vector contains a phage RNA polymerase promoter, such as the SP6, T3 or T7 phage promoter, preferably the T7 phage promoter. Preferably, the vector is suitable for in vitro transcription using a phage-based in vitro transcription system, such as an in vitro transcription system based on phage T7 RNA polymerase.

В другом предпочтительном варианте осуществления изобретения вектор можно применять непосредственно для экспрессии кодируемого пептида или белка в клетках или ткани. Для этой цели вектор содержит конкретные элементы, необходимые для экспрессии в указанных клетках/ткани, например, конкретные последовательности промотора, такого как промотор CMV.In another preferred embodiment of the invention, the vector can be used directly to express the encoded peptide or protein in cells or tissue. For this purpose, the vector contains specific elements necessary for expression in said cells/tissue, for example specific promoter sequences such as the CMV promoter.

Вектор может содержать также поли(А)-последовательность и/или сигнал полиаденилирования, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.The vector may also contain the poly(A) sequence and/or polyadenylation signal described above for the artificial nucleic acid molecule of the present invention.

Вектор может представлять собой РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой ДНК-вектор. Вектор может представлять собой любой вектор, известный специалисту в данной области, такой как вирусный вектор или плазмидный вектор. Предпочтительно вектор представляет собой плазмидный вектор, предпочтительно плазмидный ДНК-вектор.The vector may be an RNA vector or a DNA vector. Preferably the vector is a DNA vector. The vector may be any vector known to the person skilled in the art, such as a viral vector or a plasmid vector. Preferably the vector is a plasmid vector, preferably a plasmid DNA vector.

В предпочтительном варианте осуществления изобретения вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении.In a preferred embodiment of the invention, the vector of the present invention contains an artificial nucleic acid molecule of the present invention.

Предпочтительно ДНК-вектор, предлагаемой в изобретении, содержит нуклеотидную последовательность, идентичную по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR транскрипта гена, например, нуклеотидных последовательностей, представленных в SEQ ID NO: 152-204.Preferably, the DNA vector of the invention contains a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30 or 40% identical, preferably at least about 50% identical, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'-UTR of the gene transcript, for example, the nucleotide sequences shown in SEQ ID NOs: 152-204.

Предпочтительно ДНК-вектор, предлагаемой в изобретении, содержит нуклеотидную последовательность, идентичную по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 5'-UTR транскрипта гена, например, нуклеотидных последовательностей, представленных в SEQ ID NO: 1-151.Preferably, the DNA vector of the invention contains a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30 or 40% identical, preferably at least about 50% identical, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 5'-UTR of the gene transcript, for example, the nucleotide sequences shown in SEQ ID NO: 1-151.

Предпочтительно ДНК-вектор, предлагаемой в настоящем изобретении, содержит последовательность, выбранную из группы, которая состоит из последовательностей ДНК, соответствующих 5'-UTR-элементам, представленным в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (в альтернативном варианте SEQ ID NO: 3), SEQ ID NO: 138 (в альтернативном варианте SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (в альтернативном варианте SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (в альтернативном варианте SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (в альтернативном варианте SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (в альтернативном варианте SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (в альтернативном варианте SEQ ID NO: 109), SEQ ID NO: 148 (в альтернативном варианте SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (в альтернативном варианте SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (в альтернативном варианте SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125, и 3'-UTR-элементов, представленных в SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (в альтернативном варианте SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, или последовательность, идентичную по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере примерно на 99% одной из указанных последовательностей, или ее фрагменту, описанному выше, предпочтительно ее функциональному фрагменту.Preferably, the DNA vector of the present invention contains a sequence selected from the group consisting of DNA sequences corresponding to the 5'-UTR elements shown in SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternatively SEQ ID NO: 3), SEQ ID NO: 138 (alternatively SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternatively SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternatively SEQ ID NO: 31), SEQ ID NO: 32 , SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternatively SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO : 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69 , SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternatively SEQ ID NO: 42), SEQ ID NO : 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternatively SEQ ID NO: 109), SEQ ID NO: 148 (alternatively SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternatively SEQ ID NO: 119 ), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternatively SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125, and 3'UTR elements shown in SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternatively SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, or sequence identity at least about 40%, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%; even more preferably at least about 99% of one of these sequences, or a fragment thereof, as described above, preferably a functional fragment thereof.

Предпочтительно РНК-вектор, предлагаемой в настоящем изобретении, содержит последовательность, выбранную из группы, которая состоит из последовательностей, представляющих собой последовательности РНК, соответствующие последовательностям ДНК, указанным выше при описании ДНК-вектора, предлагаемого в настоящем изобретении.Preferably, the RNA vector of the present invention contains a sequence selected from the group consisting of sequences representing RNA sequences corresponding to the DNA sequences indicated above when describing the DNA vector of the present invention.

Предпочтительно вектор представляет собой кольцевую молекулу. Предпочтительно вектор представляет собой двухцепочечную молекулу, такую как двухцепочечная молекула ДНК. Такую кольцевую, предпочтительно двухцепочечную молекулу ДНК можно использовать в качестве удобной формы хранения предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты. Кроме того, ее можно применять для трансфекции клеток, например, культивируемых клеток. Ее можно использовать также для транскрипции in vitro для получения искусственной молекулы РНК, предлагаемой в изобретении.Preferably the vector is a circular molecule. Preferably the vector is a double-stranded molecule, such as a double-stranded DNA molecule. Such a circular, preferably double-stranded, DNA molecule can be used as a convenient storage form for the artificial nucleic acid molecule according to the invention. In addition, it can be used to transfect cells, such as cultured cells. It can also be used for in vitro transcription to produce an artificial RNA molecule according to the invention.

Предпочтительно вектор, предпочтительно кольцевой вектор, можно линеаризовать, например, путем расщепления рестриктазой. В предпочтительном варианте осуществления изобретения вектор содержит сайт расщепления, такой как сайт рестрикции, предпочтительно уникальный сайт расщепления, непосредственно примыкающий с 3'-стороны к ОРС, или непосредственно примыкающий с 3'-стороны к 3'-UTR-элементу, если он присутствует, или расположенный с 3'-стороны относительно поли(А)-последовательности или сигнала полиаденилирования, если она/он присутствует, или с 3'-стороны относительно поли(С)-последовательности, если она присутствует, или с 3'-стороны относительно гистоновой структуры типа «стебель-петля», если она присутствует. Так, предпочтительно продукт, полученный в результате линеаризации вектора, заканчивается на 3'-конце 3'-концом ОРС или 3'-концом 3'-UTR-элемента, если он присутствует, или 3'-концом поли(А)-последовательности или сигналом полиаденилирования, если она/он присутствует, или 3'-концом поли(С)-последовательности, если она присутствует. В варианте осуществления изобретения, в котором вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, сайт рестрикции, предпочтительно уникальный сайт рестрикции, предпочтительно примыкает непосредственно с 3'-стороны к 3'-концу искусственной молекулы нуклеиновой кислоты.Preferably the vector, preferably a circular vector, can be linearized, for example by restriction enzyme digestion. In a preferred embodiment of the invention, the vector contains a cleavage site such as a restriction site, preferably a unique cleavage site immediately adjacent 3' to the ORF, or immediately adjacent 3' to the 3' UTR element, if present, or located 3' to the poly(A) sequence or polyadenylation signal, if present, or 3' to the poly(C) sequence, if present, or 3' to the histone stem-loop structures, if present. Thus, preferably, the product resulting from vector linearization ends at the 3' end with the 3' end of the ORF or the 3' end of the 3' UTR element, if present, or the 3' end of the poly(A) sequence, or the polyadenylation signal, if present, or the 3' end of the poly(C) sequence, if present. In an embodiment in which the vector of the present invention comprises the artificial nucleic acid molecule of the present invention, the restriction site, preferably a unique restriction site, is preferably directly adjacent 3' to the 3' end of the artificial nucleic acid molecule .

Следующий объект настоящего изобретения относится к клетке, содержащей искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, или вектор, предлагаемый в настоящем изобретении. Клетка может представлять собой любую клетку, такую как бактериальная клетка, клетка насекомого, клетка растения, клетка позвоночного, например, клетка млекопитающего. Такую клетку можно применять, например, для репликации вектора, предлагаемого в настоящем изобретении, например, в клетке бактерии. Кроме того, клетку можно применять для осуществления транскрипции искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, и/или для трансляции открытой рамки считывания искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении. Например, клетку можно применять для производства рекомбинантного белка.The next object of the present invention relates to a cell containing an artificial nucleic acid molecule of the present invention, or a vector of the present invention. The cell can be any cell, such as a bacterial cell, an insect cell, a plant cell, a vertebrate cell, for example a mammalian cell. Such a cell can be used, for example, to replicate the vector of the present invention, for example, in a bacterial cell. In addition, the cell can be used to transcribe the artificial nucleic acid molecule or vector of the present invention and/or to translate the open reading frame of the artificial nucleic acid molecule or vector of the present invention. For example, the cell can be used to produce a recombinant protein.

Клетки, предлагаемые в настоящем изобретении, можно получать, например, с помощью стандартных методов переноса нуклеиновой кислоты, таких как стандартные методы трансфекции, трансдукции или трансформации. Например, искусственную молекулу нуклеиновой кислоты или вектор, предлагаемую/предлагаемый в настоящем изобретении, можно переносить в клетку путем электропорации, липофекции, например, с использованием катионных липидов и/или липосом, осаждения фосфатом кальция, трансфекции на основе наночастиц, трансфекции, основанной на применении вирусов или на основе катионных полимеров, таких как DEAE-декстран или полиэтиленимин и т.д.The cells of the present invention can be obtained, for example, using standard nucleic acid transfer methods, such as standard transfection, transduction or transformation methods. For example, an artificial nucleic acid molecule or a vector of the present invention can be transferred into a cell by electroporation, lipofection, for example, using cationic lipids and/or liposomes, calcium phosphate precipitation, nanoparticle-based transfection, transfection based on the use of viruses or based on cationic polymers such as DEAE-dextran or polyethyleneimine, etc.

Предпочтительно клетка представляет собой клетку млекопитающего, такую как клетка человека, домашнего животного, лабораторного животного, такую как клетка мыши или крысы. Предпочтительно клетка представляет собой человеческую клетку. Клетка может представлять собой клетку широко применяемой клеточной линии, такой как СНО, BHK, 293Т, COS-7, HELA, HEK и т.д. или клетка может представлять собой первичную клетку, такую как человеческая кожная фибробластная (HDF) клетка и т.д., предпочтительно клетку, выделенную из организма. В предпочтительном варианте осуществления изобретения клетка представляет собой выделенную клетку млекопитающего, предпочтительно человека. Например, клетка может представлять собой иммунную клетку, такую как дендритная клетка, раковую или опухолевую клетку, или любую соматическую клетку и т.д., предпочтительно млекопитающего, предпочтительно человека.Preferably, the cell is a mammalian cell, such as a human cell, a domestic animal cell, a laboratory animal cell, such as a mouse or rat cell. Preferably the cell is a human cell. The cell may be a widely used cell line such as CHO, BHK, 293T, COS-7, HELA, HEK, etc. or the cell may be a primary cell such as a human dermal fibroblast (HDF) cell, etc., preferably a cell isolated from the body. In a preferred embodiment of the invention, the cell is an isolated cell of a mammal, preferably a human. For example, the cell may be an immune cell such as a dendritic cell, a cancer or tumor cell, or any somatic cell, etc., preferably a mammal, preferably a human.

Следующим объектом настоящего изобретения является фармацевтическая композиция, содержащая искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, или клетку, предлагаемую в настоящем изобретении. Фармацевтическую композицию, предлагаемую в изобретении, можно применять, например, в качестве вакцины, например, для генетической вакцинации. Так, ОРС может, например, кодировать антиген, предназначенный для введения пациенту с целью вакцинации. Так, в предпочтительном варианте осуществления изобретения фармацевтическая композиция, предлагаемая в настоящем изобретении, представляет собой вакцину. Кроме того, фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять, например, для генной терапии.Another object of the present invention is a pharmaceutical composition containing an artificial nucleic acid molecule of the present invention, a vector of the present invention, or a cell of the present invention. The pharmaceutical composition according to the invention can be used, for example, as a vaccine, for example, for genetic vaccination. Thus, the ORF may, for example, encode an antigen to be administered to a patient for the purpose of vaccination. Thus, in a preferred embodiment of the invention, the pharmaceutical composition of the present invention is a vaccine. In addition, the pharmaceutical composition of the present invention can be used, for example, for gene therapy.

Предпочтительно фармацевтическая композиция содержит также один или несколько фармацевтически приемлемых наполнителей, разбавителей и/или эксципиентов и/или один или несколько адъювантов. В контексте настоящего изобретения фармацевтически приемлемый наполнитель, как правило, включает жидкую или нежидкую основу предлагаемой в изобретении фармацевтической композиции. В одном из вариантов осуществления изобретения фармацевтическая композиция находится в жидкой форме. В этом случае предпочтительно носитель представляет собой носитель на водной основе, например, может представлять собой свободную от пирогенов воду; изотонический соляной раствор или забуференные (водные) растворы, например, растворы, забуференные фосфатом, цитратом и т.д. Буфер может быть гипертоническим, изотоническим или гипотоническим относительно конкретной референс-среды, т.е. содержание в буфере солей может быть выше, идентичным или ниже их содержания в конкретной референс-среде, при этом предпочтительно можно применять такие концентрации вышеуказанных солей, которые не приводят к повреждению клеток в результате осмоса или других связанных с концентрацией воздействий. Референс-среды могут представлять собой, например, жидкости, применяемые в методах «in vivo», такие как кровь, лимфа, цитозольные жидкости или другие жидкости организма, или, например, жидкости, которые можно использовать в качестве референс-сред в методах «in vitro», такие как обычные буферы или жидкости. Указанные обычные буферы или жидкости известны специалисту в данной области. Наиболее предпочтительной жидкой основой является лактированный раствор Рингера.Preferably, the pharmaceutical composition also contains one or more pharmaceutically acceptable excipients, diluents and/or excipients and/or one or more adjuvants. In the context of the present invention, a pharmaceutically acceptable excipient typically includes a liquid or non-liquid base proposed in the invention of the pharmaceutical composition. In one of the embodiments of the invention, the pharmaceutical composition is in liquid form. In this case, preferably, the carrier is an aqueous carrier, for example, may be pyrogen-free water; isotonic saline or buffered (aqueous) solutions, such as solutions buffered with phosphate, citrate, etc. The buffer may be hypertonic, isotonic, or hypotonic with respect to the specific reference medium, i.e. the salt content of the buffer may be greater than, identical to, or less than that of the particular reference medium, and concentrations of the aforementioned salts may preferably be used which do not result in cell damage due to osmosis or other concentration-related influences. Reference media can be, for example, liquids used in in vivo methods, such as blood, lymph, cytosolic fluids, or other body fluids, or, for example, liquids that can be used as reference media in in vivo methods. vitro" such as conventional buffers or liquids. These conventional buffers or liquids are known to the person skilled in the art. The most preferred liquid base is lactated Ringer's solution.

В предлагаемой в изобретении фармацевтической композиции можно использовать также один или несколько совместимых твердых или жидких наполнителей или разбавителей или капсулирующих соединений, которые можно применять для введения пациенту. Понятие «совместимые» в контексте настоящего описания означает, что указанные компоненты предлагаемой в изобретении фармацевтической композиции можно смешивать с предлагаемой в изобретении искусственной нуклеиновой кислотой, вектором или клетками, указанными в настоящем описании, таким образом, чтобы не происходило взаимодействия, которое могло бы существенно снижать фармацевтическую эффективность предлагаемой в изобретении фармацевтической композиции в обычных условиях применения.One or more compatible solid or liquid excipients or diluents or encapsulating compounds that can be used for administration to a patient can also be used in the pharmaceutical composition of the invention. The term "compatible" in the context of the present description means that these components of the pharmaceutical composition according to the invention can be mixed with the artificial nucleic acid according to the invention, the vector or cells indicated in the present description, so that no interaction occurs that could significantly reduce the pharmaceutical efficacy of the pharmaceutical composition according to the invention under normal conditions of use.

Фармацевтическая композиция, предлагаемая в настоящем изобретении, может необязательно содержать также один или несколько дополнительных фармацевтически активных компонентов. В данном контексте фармацевтически активный компонент представляет собой соединение, которое обладает терапевтическим действием в отношении лечения, облегчения или предупреждения конкретного показания или заболевания. Такие соединения включают (но, не ограничиваясь только ими) пептиды или белки, нуклеиновые кислоты, (терапевтически активные) низкомолекулярные органические или неорганические соединения (с молекулярной массой менее 5000, предпочтительно менее 1000), сахара, антигены или антитела, терапевтические агенты, уже известные из существующего уровня техники, антигенные клетки, антигенные клеточные фрагменты, клеточные фракции; компоненты клеточной оболочки (например, полисахариды), модифицированные, ослабленные или дезактивированные (например, химическим путем или путем облучения) патогены (вирусы, бактерии и т.д.).The pharmaceutical composition of the present invention may optionally also contain one or more additional pharmaceutically active ingredients. In this context, a pharmaceutically active ingredient is a compound that has a therapeutic effect in relation to the treatment, alleviation or prevention of a particular indication or disease. Such compounds include, but are not limited to, peptides or proteins, nucleic acids, (therapeutically active) small organic or inorganic compounds (molecular weight less than 5000, preferably less than 1000), sugars, antigens or antibodies, therapeutic agents already known from the existing level of technology, antigenic cells, antigenic cell fragments, cell fractions; cell wall components (eg polysaccharides), modified, attenuated or deactivated (eg chemically or by radiation) pathogens (viruses, bacteria, etc.).

Кроме того, предлагаемая в изобретении фармацевтическая композиция может содержать носитель для искусственной молекулы нуклеиновой кислоты или вектора. Такой носитель может быть пригоден для облегчения растворения в физиологически приемлемых жидкостях, транспортировки и поглощения клеткой фармацевтически активной искусственной молекулы нуклеиновой кислоты или вектора. Следовательно, такой носитель может представлять собой компонент, который может быть пригоден для хранения и доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в изобретении. Такие компоненты могут представлять собой, например, катионные или поликатионные носители или соединения, которые могут служить в качестве агентов для трансфекции или комплексообразования.In addition, the pharmaceutical composition according to the invention may contain a carrier for an artificial nucleic acid molecule or a vector. Such a carrier may be useful for facilitating dissolution in physiologically acceptable fluids, transport and uptake by the cell of a pharmaceutically active artificial nucleic acid molecule or vector. Therefore, such a carrier may be a component that may be suitable for the storage and delivery of an artificial nucleic acid molecule or vector proposed/proposed in the invention. Such components may be, for example, cationic or polycationic carriers or compounds which may serve as transfection or complexing agents.

В предпочтительном варианте осуществления изобретения искусственную молекулу нуклеиновой кислоты или вектор включают в комплекс с одним или несколькими катионными или поликатионными соединениями, предпочтительно с катионными или поликатионными полимерами, катионными или поликатионными пептидами или белками, например, протамином, катионными или поликатионными полисахаридами и/или катионными или поликатионными липидами.In a preferred embodiment of the invention, the artificial nucleic acid molecule or vector is complexed with one or more cationic or polycationic compounds, preferably cationic or polycationic polymers, cationic or polycationic peptides or proteins, for example protamine, cationic or polycationic polysaccharides and/or cationic or polycationic lipids.

Согласно предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты или вектор можно включать в комплекс с липидами с образованием одной или большего количества липосом, липоплексов или липидных наночастиц. Следовательно, в одном из вариантов осуществления изобретения, предлагаемая в изобретении фармацевтическая композиция содержит липосомы, липоплексы или липидные наночастицы, которые содержат искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно РНК, более предпочтительно мРНК.According to a preferred embodiment of the invention, the artificial nucleic acid molecule or vector can be complexed with lipids to form one or more liposomes, lipoplexes, or lipid nanoparticles. Therefore, in one of the embodiments of the invention, proposed in the invention, the pharmaceutical composition contains liposomes, lipoplexes or lipid nanoparticles that contain an artificial nucleic acid molecule or vector, preferably RNA, more preferably mRNA.

Возрастает количество данных о том, что препаративные формы на основе липидов следует рассматривать в качестве одной из наиболее перспективных систем доставки нуклеиновых кислот, прежде всего РНК, благодаря их биосовместимости и простоты крупномасштабного производства. Катионные липиды широко изучены в качестве синтетических материалов для доставки РНК. После перемешивания нуклеиновые кислоты конденсируются катионными липидами с образованием комплексов липид/нуклеиновая кислота, известных как липоплексы. Указанные липидные комплексы могут защищать генетический материал от воздействия нуклеаз и доставляться в клетки путем взаимодействия с отрицательно заряженной клеточной мембраной. Липоплексы можно получать непосредственно путем смешения положительно заряженных липидов при физиологических значениях рН с отрицательно заряженными нуклеиновыми кислотами.There is increasing evidence that lipid-based formulations should be considered as one of the most promising delivery systems for nucleic acids, primarily RNA, due to their biocompatibility and ease of large-scale production. Cationic lipids have been extensively studied as synthetic materials for RNA delivery. After mixing, nucleic acids condense with cationic lipids to form lipid/nucleic acid complexes known as lipoplexes. These lipid complexes can protect the genetic material from the effects of nucleases and be delivered to cells by interacting with a negatively charged cell membrane. Lipoplexes can be obtained directly by mixing positively charged lipids at physiological pH with negatively charged nucleic acids.

Общепринятые липосомы состоят из липидного бислоя, который может состоять из катионных, анионных или нейтральных (фосфо)липидов и холестерина, который окружает водное ядро. Как липидный бислой, так и водное пространство могут включать гидрофобные или гидрофильные соединения соответственно. Характеристики и поведение липосом in vivo можно модифицировать путем добавления гидрофильного полимерного покрытия, например, из полиэтиленгликоля (ПЭГ), на поверхность липосом для придания стерической стабилизации. Кроме того, липосомы можно применять для специфического таргетинга путем присоединения лигандов (например, антител, пептидов и углеводов) к их поверхности или к концам присоединенных цепей ПЭГ (Front Pharmacol., 6, 1 декабря 2015 г., с. 286).Conventional liposomes are composed of a lipid bilayer, which may be composed of cationic, anionic, or neutral (phospho)lipids, and cholesterol, which surrounds an aqueous core. Both the lipid bilayer and the water space may include hydrophobic or hydrophilic compounds, respectively. The in vivo characteristics and behavior of liposomes can be modified by adding a hydrophilic polymeric coating, such as polyethylene glycol (PEG), to the surface of the liposomes to impart steric stabilization. In addition, liposomes can be used for specific targeting by attaching ligands (eg, antibodies, peptides and carbohydrates) to their surface or to the ends of attached PEG chains (Front Pharmacol., 6, December 1, 2015, p. 286).

Липосомы представляют собой коллоидные системы доставки на основе липидов и на основе поверхностно-активных веществ, состоящие из фосфолипидного бислоя, окружающего водный компартмент. Они могут иметь форму сферических пузырьков, и диапазон их размера может составлять от 20 нм до нескольких мкм. Липосомы на основе катионных липидов могут образовывать комплекс с отрицательно заряженными нуклеиновыми кислотами посредством электростатических взаимодействий, что приводит к образованию комплексов, отличающихся биосовместимостью, низкой токсичностью и возможностью их крупномасштабного производства, необходимого для клинических применений in vivo. Липосомы могут сливаться с плазматической мембраной для проникновения; находясь внутри клетки, липосомы подвергаются процессингу посредством эндоцитозного пути и после этого генетический материал высвобождается из эндосомы/носителя в цитоплазму. Липосомы в течение долгого времени рассматриваются в качестве носителей для доставки лекарственных средств благодаря их очень высокой биосовместимости, основанной на том, что липосомы являются в целом аналогами биологических мембран и их можно получать из встречающихся в естественных условиях и синтетических фосфолипидов (Int J Nanomedicine. 9, 2014, сс. 1833-1843).Liposomes are lipid-based and surfactant-based colloidal delivery systems consisting of a phospholipid bilayer surrounding an aqueous compartment. They may be in the form of spherical bubbles and may range in size from 20 nm to several microns. Liposomes based on cationic lipids can form a complex with negatively charged nucleic acids through electrostatic interactions, which leads to the formation of complexes characterized by biocompatibility, low toxicity and the possibility of their large-scale production necessary for clinical applications in vivo. Liposomes can fuse with the plasma membrane for entry; Once inside the cell, the liposomes are processed through the endocytic pathway, and then the genetic material is released from the endosome/carrier into the cytoplasm. Liposomes have long been regarded as drug delivery vehicles due to their very high biocompatibility based on the fact that liposomes are in general analogues of biological membranes and can be obtained from naturally occurring and synthetic phospholipids (Int J Nanomedicine. 9, 2014, pp. 1833-1843).

Катионные липосомы традиционно наиболее широко применяли в качестве невирусных систем доставки для олигонуклеотидов, включая плазмидную ДНК, антисмысловые олигонуклеотиды и siPHK/малую РНК-шпильку (shPHK)). Катионные липиды, такие как DOTAP (1,2-диолеоил-3-триметиламмонийпропан) и DOTMA (метилсульфат N-[1-(2,3-диолеилокси)пропил]-N,N,N-триметиламмония) могут образовывать комплексы или липоплексы с отрицательно заряженными нуклеиновыми кислотами с образованием наночастиц посредством электростатического взаимодействия, что обеспечивает высокую эффективность трансфекции in vitro. Кроме того, разработаны нанолипосомы для доставки РНК на основе нейтрального липида, например, нанолипосомы на основе нейтрального 1,2-диолеоил-sn-глицеро-3-фосфатидилхолина (DOPC) (Adv Drug Deliv Rev. 66, февраль 2014 г., сс. 110-116).Cationic liposomes have traditionally been most widely used as non-viral delivery systems for oligonucleotides, including plasmid DNA, antisense oligonucleotides, and siRNA/small hairpin RNA (shRNA)). Cationic lipids such as DOTAP (1,2-dioleoyl-3-trimethylammonium propane) and DOTMA (N-[1-(2,3-dioleyloxy)propyl]-N,N,N-trimethylammonium methyl sulfate) can form complexes or lipoplexes with negatively charged nucleic acids with the formation of nanoparticles through electrostatic interaction, which ensures high efficiency of transfection in vitro. In addition, lipid-neutral RNA delivery nanoliposomes have been developed, such as neutral 1,2-dioleoyl-sn-glycero-3-phosphatidylcholine (DOPC) nanoliposomes (Adv Drug Deliv Rev. 66, February 2014, pp. 110-116).

Таким образом, в одном из вариантов осуществления изобретения искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно РНК, входящую в фармацевтическую композицию, предлагаемую в настоящем изобретении, включают в комплекс с катионными липидами и/или нейтральными липидами и тем самым образуют липосомы, липидные наночастицы, липоплексы или нанолипосомы на основе нейтральных липидов.Thus, in one of the embodiments of the invention, an artificial nucleic acid molecule or a vector, preferably RNA, included in the pharmaceutical composition proposed in the present invention, is complexed with cationic lipids and/or neutral lipids and thereby forms liposomes, lipid nanoparticles, lipoplexes or nanoliposomes based on neutral lipids.

В других вариантах осуществления изобретения наиболее предпочтительными агентами для трансфекции или комплексообразования являются катионные или поликатионные соединения, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин, основные полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды, Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, MPG-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedid), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны.In other embodiments, the most preferred transfection or complexation agents are cationic or polycationic compounds including protamine, nucleolin, spermine or spermidine, or other cationic peptides or proteins such as poly-L-lysine (PLL), polyarginine, basic polypeptides, cell-penetrating peptides (CPPs), such as HIV-binding peptides, HIV-1 Tat (HIV), Tat-derived peptides, penetratin, VP22-derived peptides or analogs, VP22 HSV (herpes simplex virus), MAP, KALA or protein transduction domains (PTDs), PpT620, proline-rich peptides, arginine-rich peptides, lysine-rich peptides, MPG peptide(s), Pep-1, L-oligomers, calcitonin peptide(s), Antennapedia-derived peptides (primarily derived from Drosophila antennapedid), pAntp, pIsl, FGF, lactoferrin, transportan, buforin-2, Bac715-24, SynB, SynB(1), pVEC, hCT-derived peptides, SAP or histones.

Кроме того, такие катионные или поликатионные соединения могут представлять собой катионные или поликатионные пептиды или белки, которые предпочтительно содержат или дополнительно модифицированы так, чтобы они содержали по меньшей мере одну -SH-группу. Предпочтительно катионный или поликатионный носитель выбирают из катионных пептидов, имеющих следующую общую формулу (I):In addition, such cationic or polycationic compounds may be cationic or polycationic peptides or proteins that preferably contain or are further modified to contain at least one -SH group. Preferably the cationic or polycationic carrier is selected from cationic peptides having the following general formula (I):

Figure 00000246
Figure 00000246

в которой l+m+n+о+х=3-100 и l, m, n или о независимо друг от друга обозначают любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 и 91-100, при условии, общее содержание Arg (аргинин), Lys (лизин), His (гистидин) и Orn (орнитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде; а Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His или Orn; и х может обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, при условии, что общее содержание Хаа не превышает 90% от общего содержания аминокислот в олигопептиде. Любую из аминокислот Arg, Lys, His, Orn и Хаа можно помещать в любое положение пептида. В этом контексте наиболее предпочтительными являются катионные пептиды или белки, содержащие 7-30 аминокислот. Предпочтительные катионные пептиды и белки описаны также в международной заявке на патент WO 2009/030481, содержание которой включено в настоящее описание в качестве ссылки.in which l+m+n+o+x=3-100 and l, m, n or o independently of each other denote any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81 -90 and 91-100, provided that the total content of Arg (arginine), Lys (lysine), His (histidine) and Orn (ornithine) is at least 10% of the total amino acid content of the oligopeptide; and Xaa can be any amino acid selected from native (ie, naturally occurring) or non-naturally occurring amino acids with the exception of Arg, Lys, His, or Orn; and x can be any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 , 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, provided that the total Xaa content does not exceed 90% of the total amino acid content in the oligopeptide. Any of the amino acids Arg, Lys, His, Orn and Xaa can be placed at any position in the peptide. In this context, cationic peptides or proteins containing 7-30 amino acids are most preferred. Preferred cationic peptides and proteins are also described in international patent application WO 2009/030481, the contents of which are incorporated herein by reference.

Кроме того, катионный или поликатионный пептид или белок, определяемый формулой

Figure 00000247
представленной выше, который содержит или дополнительно модифицирован так, что он содержал по меньшей мере одну -SH-группу, можно выбирать (но, не ограничиваясь только этим) из соединений подформулы (Ia):In addition, a cationic or polycationic peptide or protein defined by the formula
Figure 00000247
above, which contains or is further modified so that it contains at least one -SH group, can be selected from (but not limited to) compounds of subformula (Ia):

Figure 00000248
Figure 00000248

в которой (Arg)1; (Lys)m; (His)n; (Orn)o; и х имеют указанные выше значения, Хаа' обозначает любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His, Orn или Cys, и у обозначает любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 и 81-90, при условии, что общее содержание Arg (аргинин), Lys (лизин), His (гистидин) и Orn (оринитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде. Кроме того, катионный или поликатионный пептид можно выбирать из соединений подформулы (Iб):in which (Arg) 1 ; (lys) m ; (His) n ; (Orn) o ; and x are as defined above, Xaa' is any amino acid selected from native (i.e., naturally occurring) or non-naturally occurring amino acids with the exception of Arg, Lys, His, Orn, or Cys, and y is any number , selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31 -40, 41-50, 51-60, 61-70, 71-80 and 81-90, provided that the total content of Arg (arginine), Lys (lysine), His (histidine) and Orn (orinithine) is at least 10% of the total amino acid content of the oligopeptide. In addition, the cationic or polycationic peptide can be selected from compounds of subformula (Ib):

Figure 00000249
Figure 00000249

в которой эмпирическая формула

Figure 00000250
представлена в настоящем описании и образует ядро аминокислотной последовательности, представленной (полуэмпирической) формулой (III), и в которой Cys1 и Cys2 обозначают остатки цистеина, расположенные проксимально или терминально относительно (Arg)1;(Lys)m;(His)n;(Orn)o;(Xaa)x. В этом контексте содержание WO 2011/026641 включено в настоящее описание в качестве ссылки.in which the empirical formula
Figure 00000250
is presented in the present description and forms the core of the amino acid sequence represented by (semi-empirical) formula (III), and in which Cys 1 and Cys 2 denote cysteine residues located proximal or terminal relative to (Arg) 1 ;(Lys) m ;(His) n ;(Orn) o ;(Xaa) x . In this context, the contents of WO 2011/026641 are incorporated herein by reference.

Другие предпочтительные катионные или поликатионные соединения, которые можно применять в качестве агентов для трансфекции, могут представлять собой катионные полисахариды, например, хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.Other preferred cationic or polycationic compounds that can be used as transfection agents may be cationic polysaccharides, eg chitosan, polybrene, cationic polymers, eg polyethyleneimine (PEI), cationic lipids, eg DOTMA:chloride [1-( 2,3-sioleyloxy)propyl)]-N,N,N-trimethylammonium, DMRIE, di-C14-amidine, DOTIM, SAINT, DC-Chol, BGTC, STAR, DOPC, DODAP, DOPE: dioleylphosphatidylethanolamine, DOSPA, DODAB, DOIC, DMEPC, DOGS: dioctadecylamidoglycylspermine, DIMRI: dimyristooxypropyldimethylhydroxyethylammonium bromide, DOTAP: dioleoyloxy-3-(trimethylammonio)propane, DC-6-14: O,O-ditradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride, CLIP1: rac chloride -[(2,3-dioctadecyloxypropyl)(2-hydroxyethyl)]dimethylammonium, CLIP6: rac-[2(2,3-dihexadecyloxypropyloxymethyloxy)ethyl]trimethylammonium, CLIP9: rac-[2(2,3-dihexadecyloxypropyloxysuccinyloxy)ethyl]trimethylammonium , oligofectamine, or cationic or polycationic polymers, e.g. ep, modified polyamino acids such as β-amino acid polymers or reversible polyamides, etc., modified polyethylenes such as PVP (poly(N-ethyl-4-vinylpyridinium) bromide), etc. modified acrylates such as pDMAEMA (poly(dimethylaminoethyl methyl acrylate)) etc. modified amidoamines such as pAMAM (poly(amidoamine)) etc. modified polybetaaminoester (PBAE) e.g. modified diamine terminus copolymers 1,4-butanediol diacrylate and 5-amino-1-pentanol, etc. dendrimers, for example, polypropylamine dendrimers or pAMAM-based dendrimers, etc. polyimine(s), e.g. PEI: poly(ethyleneimine), poly(propyleneimine), etc., polyallylamine, sugar backbone polymers such as cyclodextrin-based polymers, dextran-based polymers, chitosan, etc. silane backbone polymers, e.g. PMOXA-PDMS copolymers, etc., block copolymers consisting of a combination of one or more cationic blocks (e.g. selected from the cationic polymer above) and one or more hydrophilic or hydrophobic blocks ( e.g. polyethylene glycol); etc.

Согласно другому варианту осуществления изобретения фармацевтическая композиция, предлагаемая в изобретении, может содержать адъювант для повышения иммуностимулирующих свойств фармацевтической композиции. В данном контексте под адъювантом можно понимать любое соединение, которое пригодно для облегчения введения и доставки компонентов, таких как искусственная молекула нуклеиновой кислоты или вектор, которая/который содержится в фармацевтической композиции, предлагаемой в изобретении. Кроме того, такой адъювант может (но, не ограничиваясь только этим) инициировать или усиливать иммунный ответ врожденной иммунной системы, т.е. неспецифический иммунный ответ. Иными словами, после введения фармацевтическая композиция, предлагаемая в изобретении, как правило, инициирует адаптивный иммунный ответ, направленный на антиген, кодируемый искусственной молекулой нуклеиновой кислоты. Кроме того, фармацевтическая композиция, предлагаемая в изобретении, может вызывать (поддерживающий) врожденный иммунный ответ благодаря добавлению адъюванта, указанного в настоящем описании, к фармацевтической композиции, предлагаемой в изобретении.According to another embodiment of the invention, the pharmaceutical composition according to the invention may contain an adjuvant to enhance the immunostimulatory properties of the pharmaceutical composition. In this context, an adjuvant can be understood to mean any compound that is suitable for facilitating the administration and delivery of components, such as an artificial nucleic acid molecule or a vector, which/which is contained in the pharmaceutical composition of the invention. In addition, such an adjuvant may (but not limited to) initiate or enhance the immune response of the innate immune system, i. nonspecific immune response. In other words, upon administration, the pharmaceutical composition of the invention typically initiates an adaptive immune response directed to the antigen encoded by the artificial nucleic acid molecule. In addition, the pharmaceutical composition of the invention can elicit a (supportive) innate immune response by adding an adjuvant as described herein to the pharmaceutical composition of the invention.

Такой адъювант можно выбирать из любого адъюванта, известного специалисту в данной области и пригодного для рассматриваемого случая, т.е. для поддержания индукции иммунного ответа у млекопитающего. Предпочтительно адъювант можно выбирать из группы, включающей (но, не ограничиваясь только ими) TDM, MDP, мурамилдипептид, плюроники, раствор квасцов, гидроксид алюминия, ADJUMER™ (полифосфазен); гель фосфата алюминия; глюканы, выделенные из водорослей; алгаммулин; гель гидроксида алюминия (квасцы); высокоадсорбирующий белки гель гидроксида алюминия; обладающий низкой вязкостью гель гидроксида алюминия; AF или SPT (эмульсия, содержащая сквалан (5%), Твин 80 (0.2%), плюроник L121 (1,25%), забуференный фосфатом физиологический раствор, рН 7,4); AVRIDINE™ (пропандиамин); BAY R1005™ ((N-(2-дезокси-2-L-леуциламиноб-D-глюкопиранозил)-N-октадециламида гидроацетат); CALCITRIOL™ (1-альфа,25-дигидрокси-витамин D3); гель фосфата кальция; САР™ (наночастицы фосфата кальция); холерный голотоксин, слитый белок холерный токсин-A1-белок-А-D-фрагмент, субъединица В холерного токсина; CRL 1005 (блок-сополимер Р1205); содержащие цитокин липосомы; DDA (диметилдиоктадециламмония бромид); DHEA (дегидроэпиандростерон); DMPC (димиристоилфосфатидилхолин); DMPG (димиристоилфосфатидилглицерин); комплекс DOC/квасцы (натриевая соль дезоксихолиновой кислоты); полный адъювант Фрейнда; неполный адъювант Фрейнда; инулин-гамма; адъювант Гербу (смесь, содержащая: I) N-ацетилглюкозаминил-(Р1-4)-N-ацетилмурамоил-L-аланил-D35 глутамин (GMDP), II) диметилдиоктадециламмония хлорид (DDA), III) комплекс цинк-соль L-пролина (ZnPro-8); GM-CSF); GMDP (N-ацетилглюкозаминил-(b1-4)-N-ацетилмурамил-L47 аланил-D-изоглутамин); имиквимод (1-(2-метилпропил)-1Н-имидазо[4,5-с]хинолин-4-амин); ImmTher™ (N-ацетилглюкозаминил-N-ацетилмурамил-L-Ala-D-изоGlu-L-Ala-глицерина дипальмитат); DRV (иммунолипосомы, приготовленные из везикул, полученных методом гидратации-регидратации); интерферон-гамма; интерлейкин-1бета; интерлейкин-2; интерлейкин-7; интерлейкин-12; ISCOMSTM; ISCOPREP 7.0.3. ТМ; липосомы; LOXORIBINE™ (7-аллил-8-оксогуанозин); оральный адъювант LT 5 (лабильный энтеротоксин-протоксин из E. coli); микросферы и микрочастицы любого состава; MF59TM; (водная эмульсия сквалена); MONTANIDE ISA 51™ (очищенный неполный адъювант Фрейнда); MONTANIDE ISA 720™ (метаболизируемый масляный адъювант); MPL™ (3-Q-дезацил-4'-монофосфорил-липид А); липосомы МТР-РЕ и МТР-РЕ (N-ацетил-L-аланил-D-изоглутаминил-L-аланин-2-(1,2-дипальмитоил-sn-глицеро-3-(гидроксифосфорилокси))этиламид, однонатриевая соль); MURAMETIDE™ (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE™ и DMURAPALMITINE™ (Nac-Mur-L-Thr-D-изоGIn-sn-глицериндипальмитоил); NAGO (нейраминидаза-галактозооксидаза); наносферы или наночастицы любого состава; NISV (везикулы из неионогенного поверхностно-активного вещества); PLEURAN™ (β-глюкан); PLGA, PGA и PLA (гомо- и сополимеры молочной кислоты и гликолевой кислоты; микросферы/наносферы); ПЛЮРОНИК L121™; РММА (полиметилметакрилат); PODDS™ (протеноидные микросферы); полиэтиленкарбаматные производные; поли-rА:поли-rU (комплекс полиадениловая кислота-полиуридиновая кислота); полисорбат 80 (Твин 80); белковые кохлеаты (фирма Avanti Polar Lipids, Inc., Алабастер, шт. Алабама); STIMULON™ (QS-21); Quil-A (сапонин Quil-A); S-28463 (4-аминоотекдиметил-2-этоксиметил-1Н-имидазо[4,5-с]хинолин-1-этанол); SAF-1™ («композиция адъювантов фирмы Syntex»); протеолипосомы вируса Сендаи и липидные матрицы, содержащие вирус Сендаи; Спан-85 (сорбитантриолеат); Specol (эмульсия Marcol 52, Спан 85 и Твин 85); сквален или Robane® (2,6,10,15,19,23-гексаметилтетракозан и 2,6,10,15,19,23-гексаметил-2,6,10,14,18,22-тетракозагексан); стеарилтирозин (октадецилтирозина гидрохлорид); Theramid® (М-ацетилглюкозаминил-N-ацетилмурамил-L-Ala-D-isoGlu-L-Ala-дипальмитоксипропиламид); Theronyl-MDP (Termurtide™ или [thr 1]-MDP; N-ацетилмурамил-L-треонил-D-изоглутамин); Ту-частицы (Ту-ВПЧ или вирусоподобные частицы); липосомы Уолтера-Рида (липосомы, содержащие липид А, адсорбированный на гидроксиде алюминия) и липопептиды, включая Pam3Cys, прежде всего соли алюминия, такие как адъю-фос (Adju-phos), алгидрогель, регидрагель и т.д., эмульсии, такие как CFA, SAF, IFA, MF59, провакс, TiterMax, монтанид, ваксфектин и т.д., сополимеры, такие как оптивакс (Optivax, CRL1005), L121, полоксамер 4010) и т.д., липосомы, такие как «липосомы-невидимки (Stealth)» и т.д., кохлеаты, такие как BIORAL, и т.д., адъюванты растительного происхождения, такие как QS21, Quil A, Iscomatrix, ISCOM; адъюванты, пригодные для костимуляции, включая томатин, биополимеры, такие как PLG, РММ, инулин и т.д., адъюванты микробного происхождения, такие как ромуртид, DETOX, MPL, CWS, манноза, нуклеотидные последовательности CpG, CpG7909, лиганды человеческого TLR 1-13, ISS-1018, 35 IC31, имидазохинолины, амплиген, Ribi529, IMOxine, IRIV, ВПЧ, холерный токсин, термолабильный токсин, Pam3Cys, флагеллин, GPI (гликозилфосфатидилинозитол)-якорь, LNFPIII/Lewis X, противомикробные пептиды, UC-1V150, слитый белок RSV, cdiGMP; и адъюванты, пригодные в качестве антагонистов, включая нейропептид CGRP.Such an adjuvant can be selected from any adjuvant known to the person skilled in the art and suitable for the case in question, i. to maintain the induction of an immune response in a mammal. Preferably, the adjuvant can be selected from the group including (but not limited to) TDM, MDP, muramyl dipeptide, pluronics, alum solution, aluminum hydroxide, ADJUMER™ (polyphosphazene); aluminum phosphate gel; glucans isolated from algae; algammulin; aluminum hydroxide gel (alum); highly protein-absorbing aluminum hydroxide gel; a low viscosity aluminum hydroxide gel; AF or SPT (emulsion containing Squalane (5%), Tween 80 (0.2%), Pluronic L121 (1.25%), phosphate buffered saline, pH 7.4); AVRIDINE™ (propanediamine); BAY R1005™ ((N-(2-deoxy-2-L-leucylamino-D-glucopyranosyl)-N-octadecylamide hydroacetate); CALCITRIOL™ (1-alpha,25-dihydroxy vitamin D3); calcium phosphate gel; CAP™ (calcium phosphate nanoparticles); cholera holotoxin, fusion protein cholera toxin-A1 protein-A-D fragment, cholera toxin subunit B; CRL 1005 (P1205 block copolymer); cytokine-containing liposomes; DDA (dimethyldioctadecylammonium bromide); DHEA ( dehydroepiandrosterone); DMPC (dimyristoylphosphatidylcholine); DMPG (dimyristoylphosphatidylglycerol); DOC/alum complex (deoxycholic acid sodium salt); complete Freund's adjuvant; incomplete Freund's adjuvant; inulin-gamma; Gerbu's adjuvant (mixture containing: I) N-acetylglucosaminyl-( P1-4)-N-acetylmuramoyl-L-alanyl-D35 glutamine (GMDP), II) dimethyldioctadecylammonium chloride (DDA), III) L-proline zinc salt complex (ZnPro-8); GM-CSF); GMDP (N-acetylglucosaminyl-(b1-4)-N-acetylmuramyl-L47 alanyl-D-isoglutamine); imiquimod (1-(2-methylpropyl)-1H-imidazo[4,5-c]quinoline-4-amine); ImmTher™ (N-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-glycerol dipalmitate); DRV (immunoliposomes prepared from vesicles obtained by the hydration-rehydration method); interferon-gamma; interleukin-1beta; interleukin-2; interleukin-7; interleukin-12; ISCOMSM; ISCOPREP 7.0.3. TM; liposomes; LOXORIBINE™ (7-allyl-8-oxoguanosine); oral adjuvant LT 5 (labile enterotoxin-protoxin from E. coli); microspheres and microparticles of any composition; MF59TM; (water emulsion of squalene); MONTANIDE ISA 51™ (purified incomplete Freund's adjuvant); MONTANIDE ISA 720™ (metabolizable oil adjuvant); MPL™ (3-Q-deacyl-4'-monophosphoryl lipid A); liposomes MTP-PE and MTP-PE (N-acetyl-L-alanyl-D-isoglutaminyl-L-alanine-2-(1,2-dipalmitoyl-sn-glycero-3-(hydroxyphosphoryloxy))ethylamide, single sodium salt); MURAMETIDE™ (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE™ and DMURAPALMITINE™ (Nac-Mur-L-Thr-D-isoGIn-sn-glycerindipalmitoyl); NAGO (neuraminidase-galactose oxidase); nanospheres or nanoparticles of any composition; NISV (nonionic surfactant vesicles); PLEURAN™ (β-glucan); PLGA, PGA and PLA (homo- and copolymers of lactic acid and glycolic acid; microspheres/nanospheres); PLURONIC L121™; PMMA (polymethyl methacrylate); PODDS™ (protenoid microspheres); polyethylene carbamate derivatives; poly-rA:poly-rU (polyadenylic acid-polyuridic acid complex); polysorbate 80 (Tween 80); protein cochleates (Avanti Polar Lipids, Inc., Alabaster, Alabama); STIMULON™ (QS-21); Quil-A (Quil-A saponin); S-28463 (4-aminootecdimethyl-2-ethoxymethyl-1H-imidazo[4,5-c]quinoline-1-ethanol); SAF-1™ ("composition of adjuvants from Syntex"); Sendai virus proteoliposomes and lipid matrices containing Sendai virus; Span-85 (sorbitan trioleate); Specol (emulsion Marcol 52, Span 85 and Twin 85); squalene or Robane® (2,6,10,15,19,23-hexamethyltetracosane and 2,6,10,15,19,23-hexamethyl-2,6,10,14,18,22-tetracoshexane); stearyltyrosine (octadecyltyrosine hydrochloride); Theramid® (M-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-dipalmitoxypropylamide); Theronyl-MDP (Termurtide™ or [thr 1]-MDP; N-acetylmuramyl-L-threonyl-D-isoglutamine); Tu-particles (Tu-HPV or virus-like particles); Walter-Read liposomes (liposomes containing lipid A adsorbed on aluminum hydroxide) and lipopeptides, including Pam3Cys, especially aluminum salts such as Adju-phos, alhydrogel, rehydragel, etc., emulsions such as like CFA, SAF, IFA, MF59, provax, TiterMax, montanide, vaxfectin, etc., copolymers like optivax (Optivax, CRL1005), L121, poloxamer 4010) etc., liposomes like "liposomes stealth (Stealth), etc., cochleates such as BIORAL, etc., herbal adjuvants such as QS21, Quil A, Iscomatrix, ISCOM; adjuvants suitable for costimulation including tomatine, biopolymers such as PLG, PMM, inulin, etc., adjuvants of microbial origin such as romurtide, DETOX, MPL, CWS, mannose, CpG nucleotide sequences, CpG7909, human TLR 1 ligands -13, ISS-1018, 35 IC31, imidazoquinolines, ampligen, Ribi529, IMOxine, IRIV, HPV, cholera toxin, thermolabile toxin, Pam3Cys, flagellin, GPI (glycosylphosphatidylinositol)-anchor, LNFPIII/Lewis X, antimicrobial peptides, UC-1V150 , RSV fusion protein, cdiGMP; and adjuvants useful as antagonists, including the neuropeptide CGRP.

Пригодные адъюванты можно выбирать также из катионных или поликатионных соединений, при этом адъювант предпочтительно получают путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию, и катионное или поликатионное соединение. Ассоциация или образование комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор входящую/входящий в фармацевтическую композицию, и катионные или поликатионные соединения, указанные в настоящем описании, предпочтительно обеспечивает присущие адъюванту свойства и оказывает стабилизирующее действие на искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию. Наиболее предпочтительно такие катионные или поликатионные соединения выбирают из катионных или поликатионных пептидов или белков, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин, основные полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды, Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, MPG-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedia), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны. Другими предпочтительными катионными или поликатионными соединениями могут являться катионные полисахариды, например хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.Suitable adjuvants can also be selected from cationic or polycationic compounds, whereby the adjuvant is preferably prepared by forming a complex comprising an artificial nucleic acid molecule or vector included/included in a pharmaceutical composition and a cationic or polycationic compound. The association or formation of a complex comprising an artificial nucleic acid molecule or vector in/in a pharmaceutical composition and the cationic or polycationic compounds described herein preferably provides inherent adjuvant properties and has a stabilizing effect on the artificial nucleic acid molecule or vector in/in into a pharmaceutical composition. Most preferably, such cationic or polycationic compounds are selected from cationic or polycationic peptides or proteins, including protamine, nucleolin, spermine or spermidine, or other cationic peptides or proteins such as poly-L-lysine (PLL), polyarginine, basic polypeptides having the ability cell-penetrating peptides (CPPs), such as HIV-binding peptides, HIV-1 Tat (HIV), Tat-derived peptides, penetratin, VP22-derived peptides or analogs, VP22 HSV (herpes simplex virus), MAP, KALA, or domains protein transduction (PTD), PpT620, proline-rich peptides, arginine-rich peptides, lysine-rich peptides, MPG-peptide(s), Pep-1, L-oligomers, calcitonin peptide(s), Antennapedia-derived peptides (primarily derived from Drosophila antennapedia), pAntp, pIsl, FGF, lactoferrin, transportan, buforin-2, Bac715-24, SynB, SynB(1), pVEC, hCT derived peptides, SAP or histones. Other preferred cationic or polycationic compounds may be cationic polysaccharides, eg chitosan, polybrene, cationic polymers, eg polyethyleneimine (PEI), cationic lipids, eg DOTMA:[1-(2,3-sioleyloxy)propyl)]-N chloride, N,N-trimethylammonium, DMRIE, di-C14-amidine, DOTIM, SAINT, DC-Chol, BGTC, STAR, DOPC, DODAP, DOPE: dioleylphosphatidylethanolamine, DOSPA, DODAB, DOIC, DMEPC, DOGS: dioctadecylamidoglycylspermine, DIMRI: dimyristooxypropyldimethylhydroxyethylammonium bromide , DOTAP: dioleoyloxy-3-(trimethylammonio)propane, DC-6-14: O,O-ditradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride, CLIP1: rac-[(2,3-dioctadecyloxypropyl)(2- hydroxyethyl)]dimethylammonium, CLIP6: rac-[2(2,3-dihexadecyloxypropyloxymethyloxy)ethyl]trimethylammonium, CLIP9: rac-[2(2,3-dihexadecyloxypropyloxysuccinyloxy)ethyl]trimethylammonium, oligofectamine, or cationic or polycationic polymers, e.g. polyamino acids such as β-amino polymers acid, or reversible polyamides, etc., modified polyethylenes such as PVP (poly(N-ethyl-4-vinylpyridinium) bromide), etc. modified acrylates such as pDMAEMA (poly(dimethylaminoethyl methyl acrylate)) etc. modified amidoamines such as pAMAM (poly(amidoamine)) etc. modified polybetaaminoester (PBAE) e.g. modified diamine terminus copolymers 1,4-butanediol diacrylate and 5-amino-1-pentanol, etc. dendrimers, for example, polypropylamine dendrimers or pAMAM-based dendrimers, etc. polyimine(s), e.g. PEI: poly(ethyleneimine), poly(propyleneimine), etc., polyallylamine, sugar backbone polymers such as cyclodextrin-based polymers, dextran-based polymers, chitosan, etc. silane backbone polymers, e.g. PMOXA-PDMS copolymers, etc., block copolymers consisting of a combination of one or more cationic blocks (e.g. selected from the cationic polymer above) and one or more hydrophilic or hydrophobic blocks ( e.g. polyethylene glycol); etc.

Кроме того, предпочтительные катионные или поликатионные белки или пептиды, которые можно применять в качестве адъюванта путем образования комплекса с искусственной молекулой нуклеиновой кислоты или вектором, предпочтительно РНК, включенной/включенным в композицию, можно выбирать из представленных ниже белков или пептидов, имеющих следующую общую формулу (I): (Arg)1;(Lys)m;(His)n;(Orn)o;(Xaa)x, в которой l+m+n+о+х=8-15 и l, m, n или о независимо друг от друга могут обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, при условии, что общее содержание Arg, Lys, His и Orn составляет по меньшей мере 50% от общего содержания аминокислот в олигопептиде; и Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или ненативных аминокислот за исключением Arg, Lys, His или Orn; и х может обозначать любое число, выбранное из 0, 1, 2, 3 или 4, при условии, что общее содержание Хаа не должно превышать 50% от всех аминокислот в олигопептиде. Наиболее предпочтительными олигоаргининами в данном контексте являются, например, Arg7, Arg8, Arg9, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R и т.д.In addition, preferred cationic or polycationic proteins or peptides that can be used as an adjuvant by complexing with an artificial nucleic acid molecule or vector, preferably RNA included/included in the composition, can be selected from the following proteins or peptides having the following general formula (I): (Arg) 1 ;(Lys) m ;(His) n ;(Orn) o ;(Xaa) x in which l+m+n+o+x=8-15 and l, m, n or o independently of each other may represent any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15, provided that the total the content of Arg, Lys, His and Orn is at least 50% of the total content of amino acids in the oligopeptide; and Xaa may be any amino acid selected from native (ie, naturally occurring) or non-native amino acids with the exception of Arg, Lys, His, or Orn; and x may be any number selected from 0, 1, 2, 3, or 4, provided that the total Xaa content should not exceed 50% of all amino acids in the oligopeptide. The most preferred oligoarginines in this context are, for example, Arg 7 , Arg 8 , Arg 9 , Arg 7 , H 3 R 9 , R 9 H 3 , H 3 R 9 H 3 , YSSR 9 SSY, (RKH) 4 , Y( RKH) 2 R etc.

Соотношение между искусственной нуклеиновой кислотой или вектором и катионным или поликатионным соединением можно рассчитывать на основе отношения содержания азота к содержанию фосфата (N/P-отношение) во всем включающем нуклеиновую кислоту комплексе. Например, 1 мкг РНК, как правило, содержит примерно 3 нмоля остатков фосфата, при условии, что для РНК характерно статистическое распределение оснований. Кроме того, 1 мл пептида, как правило, содержит примерно х нмолей остатков азота в зависимости от молекулярной массы и количества основных аминокислот. Если в качестве примера сделать расчет для (Arg)9 (молекулярная масса 1424 г/моль, 9 атомов азота), то 1 мкг (Arg)9 содержит примерно 700 пмолей (Arg)9 и, следовательно, 700×9=6300 пмолей основных аминокислот, т.е. 6,3 нмолей атомов азота. Можно рассчитать, что для массового соотношения PHK/(Arg)9, составляющего примерно 1:1, отношение N/P должно составлять примерно 2. Если в качестве примера сделать расчет для протамина (молекулярная масса примерно 4250 г/моль, 21 атом азота, если применяют протамин из лосося) при массовом соотношении, составляющем примерно 2:1, то для 2 мкг РНК дает 6 нмолей фосфата; 1 мкг протамина содержит примерно 235 пмолей молекул протамина и, следовательно, 235×21=4935 пмолей основных атомов азота, т.е. 4,9 нмолей атомов азота. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 2:1, отношение N/P должно составлять примерно 0,81. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 8:1, отношение N/P должно составлять примерно 0,2. В контексте настоящего изобретения касательно соотношения нуклеиновая кислота:пептид в комплексе N/P-отношение предпочтительно находится примерно в пределах 0,1-10, предпочтительно примерно в пределах 0,3-4, и наиболее предпочтительно примерно в пределах 0,5-2 или 0,7-2, и наиболее предпочтительно примерно в пределах 0,7-1,5.The ratio between the artificial nucleic acid or vector and the cationic or polycationic compound can be calculated based on the nitrogen to phosphate ratio (N/P ratio) of the entire nucleic acid complex. For example, 1 μg of RNA typically contains approximately 3 nmol of phosphate residues, provided that the RNA is characterized by a statistical distribution of bases. In addition, 1 ml of the peptide typically contains about x nmol of nitrogen residues, depending on the molecular weight and the number of basic amino acids. If, as an example, a calculation is made for (Arg) 9 (molecular weight 1424 g / mol, 9 nitrogen atoms), then 1 μg of (Arg) 9 contains approximately 700 pmoles (Arg) 9 and, therefore, 700 × 9 = 6300 pmoles of basic amino acids, i.e. 6.3 nmol nitrogen atoms. It can be calculated that for a PHK/(Arg) 9 mass ratio of about 1:1, the N/P ratio should be about 2. If, as an example, the calculation is made for protamine (molecular weight about 4250 g/mol, 21 nitrogen atoms, if protamine from salmon is used) at a weight ratio of about 2:1, then for 2 μg of RNA it gives 6 nmol of phosphate; 1 µg of protamine contains approximately 235 pmoles of protamine molecules and therefore 235×21=4935 pmoles of basic nitrogen atoms, i.e. 4.9 nmol nitrogen atoms. It can be calculated that for an RNA/protamine weight ratio of about 2:1, the N/P ratio would be about 0.81. It can be calculated that for an RNA/protamine weight ratio of about 8:1, the N/P ratio would be about 0.2. In the context of the present invention, regarding the ratio of nucleic acid:peptide in the complex, the N/P ratio is preferably in the range of 0.1-10, preferably in the range of 0.3-4, and most preferably in the range of 0.5-2 or 0.7-2, and most preferably in the range of 0.7-1.5.

В заявке на патент WO 2010/037539, содержание которой включено в настоящее описание в качестве ссылки, описана иммуностимулирующая композиция и методы получения иммуностимулирующей композиции. Так, в предпочтительном варианте осуществления изобретения композицию получают, осуществляя две отдельные стадии для достижения и эффективного иммуностимулирующего действия, и эффективной трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении. Для этого на первой стадии получают так называемый «адъювантный компонент» путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно РНК, входящую в адъювантный компонент, и катионное или поликатионное соединение в конкретном соотношении для формирования стабильного комплекса. В этом контексте важно, чтобы в адъювантном компоненте отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение после образования комплекса с нуклеиновой кислотой. Таким образом, соотношение между нуклеиновой кислотой и катионным или поликатионным соединением в адъювантном компоненте, как правило, выбирают в таком диапазоне, чтобы нуклеиновая кислота была полностью включена в комплекс и отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение. Предпочтительно соотношение в адъювантном компоненте, т.е. соотношение между мРНК и катионным или поликатионным соединением, выбирают из диапазона, составляющего от примерно 6:1 (мас./мас.) до примерно 0,25:1 (мас./мас.), более предпочтительно от примерно 5:1 (мас./мас.) до примерно 0,5:1 (мас./мас.), еще более предпочтительно от примерно 4:1 (мас./мас.) до примерно 1:1 (мас./мас.) или от примерно 3:1 (мас./мас.) до примерно 1:1 (мас./мас.) и наиболее предпочтительно от примерно 3:1 (мас./мас.) до примерно 2:1 (мас./мас).Patent application WO 2010/037539, the contents of which are incorporated herein by reference, describes an immunostimulatory composition and methods for preparing an immunostimulatory composition. Thus, in a preferred embodiment of the invention, the composition is prepared by performing two separate steps to achieve both an effective immunostimulatory effect and efficient translation of the artificial nucleic acid molecule of the invention. To do this, in the first stage, the so-called "adjuvant component" is obtained by forming a complex that includes an artificial nucleic acid molecule or a vector, preferably RNA, which is part of the adjuvant component, and a cationic or polycationic compound in a specific ratio to form a stable complex. In this context, it is important that the adjuvant component is free from or retains only negligible amounts of free cationic or polycationic compound after complexation with the nucleic acid. Thus, the ratio between the nucleic acid and the cationic or polycationic compound in the adjuvant component is generally chosen to be in the range such that the nucleic acid is completely incorporated into the complex and there is no or only negligible free cationic or polycationic compound present. Preferably the ratio in the adjuvant component, ie. the ratio between mRNA and cationic or polycationic compound is selected from the range of from about 6:1 (wt./wt.) to about 0.25:1 (wt./wt.), more preferably from about 5:1 (wt. ./wt.) to about 0.5:1 (wt./wt.), even more preferably from about 4:1 (wt./wt.) to about 1:1 (wt./wt.) or from about 3:1 (w/w) to about 1:1 (w/w) and most preferably from about 3:1 (w/w) to about 2:1 (w/w).

Согласно предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемую/предлагаемый в изобретении, добавляют на второй стадии к входящей в комплекс молекуле нуклеиновой кислоты, предпочтительно РНК, адъювантного компонента для получения (иммуностимулирующей) композиции, предлагаемой в изобретении. При этом искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемые в изобретении, добавляют в виде свободной нуклеиновой кислоты, т.е. нуклеиновой кислоты, которая не входит в комплекс с другими соединениями. Перед добавлением свободную искусственную молекулу нуклеиновой кислоты или вектор не включают в комплекс и предпочтительно после добавления адъювантного компонента она/он не должна/должен подвергаться какой-либо поддающейся обнаружению или значимой реакции комплексообразования.According to a preferred embodiment of the invention, an artificial nucleic acid molecule or a vector, preferably an RNA molecule according to the invention, is added in a second step to the complexed nucleic acid molecule, preferably RNA, of the adjuvant component to obtain an (immunostimulatory) composition according to the invention. In this case, an artificial nucleic acid molecule or a vector, preferably an RNA molecule according to the invention, is added in the form of a free nucleic acid, i. nucleic acid that is not complexed with other compounds. Prior to addition, the free artificial nucleic acid molecule or vector is not complexed, and preferably after addition of the adjuvant component, it/it should not undergo any detectable or significant complexation reaction.

Приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (II): GlXmGn, в которой: G обозначает гуанозин (гуанин), уридин (урацил) или аналог гуанозина (гуанина) или уридина (урацила); X обозначает гуанозин (гуанин), уридин (урацил), аденозин (аденин), тимидин (тимин), цитидин (цитозин) или аналог вышеуказанных нуклеотидов (нуклеозидов); l обозначает целое число от 1 до 40, при этом, когда l=1, то G представляет собой гуанозин или его аналог, когда l>1, то по меньшей мере 50% нуклеотидов представляют собой гуанозин (гуанин) или его аналог; m обозначает целое число и обозначает по меньшей мере 3; при этом, когда m=3, то X представляет собой уридин (урацил) или его аналог, когда m>3, то по присутствуют меньшей мере 3 последовательно расположенных уридинов (урацилов) или аналогов уридина (урацила); n обозначает целое число от 1 до 40, при этом, когда n=1, то G представляет собой гуанозин (гуанин) или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов (нуклеозидов) представляет собой гуанозин (гуанин) или его аналог.Suitable adjuvants can also be selected from nucleic acids having the formula (II): G l X m G n in which: G is guanosine (guanine), uridine (uracil) or a guanosine (guanine) or uridine (uracil) analogue; X is guanosine (guanine), uridine (uracil), adenosine (adenine), thymidine (thymine), cytidine (cytosine) or an analogue of the above nucleotides (nucleosides); l denotes an integer from 1 to 40, while when l=1, then G is guanosine or its analogue, when l>1, then at least 50% of the nucleotides are guanosine (guanine) or its analogue; m is an integer and is at least 3; when m=3, then X is uridine (uracil) or its analogue, when m>3, then at least 3 consecutive uridines (uracils) or analogues of uridine (uracil) are present; n denotes an integer from 1 to 40, while when n=1, then G is guanosine (guanine) or its analogue, when n>1, then at least 50% of the nucleotides (nucleosides) is guanosine (guanine) or its equivalent.

Другие приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (III): ClXmCn, в которой: С обозначает цитидин (цитозин), уридин (урацил) или аналог цитидинва (цитозина) или уридина (урацила); X обозначает гуанозин (гуанин), уридин (урацил), аденозин (аденин), тимидин (тимин), цитидин (цитозин) или аналог вышеуказанных нуклеотидов (нуклеозидов); l обозначает целое число от 1 до 40, при этом, когда l=1, то С представляет собой цитидин (цитозин) или его аналог, когда l>1, то по меньшей мере 50% нуклеотидов (нуклеозидов) представляют собой цитидин (цитозин) или его аналог; m обозначает целое число и обозначает по меньшей мере 3; когда m=3, X представляет собой уридин (урацил) или его аналог, когда m>3, то присутствуют по меньшей мере 3 последовательно расположенных уридина (урацила) или аналогов уридина (урацила); n обозначает целое число от 1 до 40, при этом, когда n=1, то С представляет собой цитидин (цитозин) или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов (нуклеозидов) представляют собой цитидин (цитозин) или его аналог.Other suitable adjuvants can also be selected from nucleic acids having the formula (III): C l X m C n in which: C is cytidine (cytosine), uridine (uracil) or an analogue of cytidine (cytosine) or uridine (uracil); X is guanosine (guanine), uridine (uracil), adenosine (adenine), thymidine (thymine), cytidine (cytosine) or an analogue of the above nucleotides (nucleosides); l denotes an integer from 1 to 40, while when l=1, then C is cytidine (cytosine) or its analogue, when l>1, then at least 50% of the nucleotides (nucleosides) are cytidine (cytosine) or its equivalent; m is an integer and is at least 3; when m=3, X is uridine (uracil) or an analogue thereof, when m>3, then at least 3 consecutive uridine (uracil) or analogues of uridine (uracil) are present; n denotes an integer from 1 to 40, while when n=1, then C is cytidine (cytosine) or its analogue, when n>1, then at least 50% of the nucleotides (nucleosides) are cytidine (cytosine) or its equivalent.

Предлагаемая в настоящем изобретении фармацевтическая композиция предпочтительно содержит в «безопасном и эффективном количестве» компоненты фармацевтической композиции, прежде всего предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, вектор и/или клетки, представленные в настоящем описании. В контексте настоящего описания понятие «безопасное и эффективное количество» обозначает количество, достаточное для значимой индукции положительной модификации заболевания или нарушения, указанного в настоящем описании. Однако в то же время «безопасное и эффективное количество» должно быть таким, чтобы избегать серьезных побочных действий и обеспечивать разумное соотношение между преимуществом и риском. Определение этих пределов, как правило, находится в компетенции осуществляющего лечение врача.The pharmaceutical composition according to the present invention preferably contains in a "safe and effective amount" the components of the pharmaceutical composition, especially the artificial nucleic acid molecule according to the invention, the vector and/or the cells presented in the present description. In the context of the present description, the term "safe and effective amount" means an amount sufficient to significantly induce a positive modification of the disease or disorder specified in the present description. However, at the same time, a "safe and effective amount" must be such as to avoid serious side effects and provide a reasonable balance between benefit and risk. The determination of these limits, as a rule, is within the competence of the treating physician.

Следующим объектом настоящего изобретения является искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенные для применения в качестве лекарственного средства, например, в качестве вакцины (для генетической вакцинации), или в генной терапии.Another object of the present invention is an artificial nucleic acid molecule according to the present invention, a vector according to the present invention, a cell according to the present invention, or a pharmaceutical composition according to the present invention, intended for use as a medicine, for example, as vaccines (for genetic vaccination), or in gene therapy.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, наиболее пригодны для любого медицинского применения, в котором используется терапевтическое действие или эффект пептидов, полипептидов или белков, или в котором требуется добавление конкретного пептида или белка. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенные для применения при лечении или предупреждении заболеваний или нарушений, поддающихся лечению посредством терапевтического действия или эффекта пептидов, полипептидов или белков, или поддающихся лечению путем добавления конкретного пептида, полипептида или белка. Например, искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять для лечения или предупреждения генетических заболеваний, аутоиммунных заболеваний, раковых или связанных с опухолью заболеваний, инфекционных заболеваний, хронических заболеваний или т.п., например, путем генетической вакцинации или генной терапии.The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are most suitable for any medical application that uses the therapeutic action or effect of peptides, polypeptides or proteins, or in which the addition of a particular peptide or protein is required. Thus, the present invention provides an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention for use in the treatment or prevention of diseases or disorders. treatable by the therapeutic action or effect of the peptides, polypeptides or proteins, or treatable by the addition of a particular peptide, polypeptide or protein. For example, an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention can be used to treat or prevent genetic diseases, autoimmune diseases, cancer, or related with tumor diseases, infectious diseases, chronic diseases or the like, for example, by genetic vaccination or gene therapy.

В частности, такие терапевтические обработки, польза от которых определяется увеличенным количеством и пролонгированным присутствием терапевтических пептидов, полипептидов или белков в организме индивидуума, подлежащего лечению, являются наиболее пригодными в качестве медицинского подхода в контексте настоящего изобретения, поскольку предлагаемый в изобретении 3'-UTR-элемент обеспечивает стабильную и пролонгированную экспрессию пептида или белка, кодируемого предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты или предлагаемым в изобретении вектором, и/или предлагаемый в изобретении 5'-UTR-элемент обеспечивает повышенную экспрессию пептида или белка, кодируемого предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты или предлагаемым в изобретении вектором. Так, наиболее пригодным медицинским применением искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, вектора, предлагаемого в настоящем изобретении, клетки, предлагаемой в настоящем изобретении, или фармацевтической композиции, предлагаемой в настоящем изобретении, является вакцинация. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, для вакцинации индивидуума, предпочтительно млекопитающего, более предпочтительно человека. Предпочтительными видами вакцинации являются вакцинация против инфекционных заболеваний, таких как бактериальные, протозойные или вирусные инфекции, и противоопухолевая вакцинация. Такие виды вакцинации можно осуществлять в профилактических или терапевтических целях.In particular, such therapeutic treatments, the benefit of which is determined by the increased amount and prolonged presence of therapeutic peptides, polypeptides or proteins in the body of the individual to be treated, are most suitable as a medical approach in the context of the present invention, since the inventive 3'-UTR- the element provides stable and prolonged expression of the peptide or protein encoded by the inventive artificial nucleic acid molecule or the inventive vector, and/or the inventive 5'-UTR element provides increased expression of the peptide or protein encoded by the inventive artificial nucleic acid molecule acid or proposed in the invention vector. Thus, the most suitable medical application of the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention is vaccination. Thus, the present invention provides an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention for vaccinating a subject, preferably a mammal, more preferably a human. . The preferred types of vaccination are vaccination against infectious diseases such as bacterial, protozoal or viral infections and antitumor vaccination. Such types of vaccination can be carried out for prophylactic or therapeutic purposes.

Можно выбирать ОРС в зависимости от заболевания, подлежащего лечению. Например, открытая рамка считывания может кодировать белок, который требуется поставлять в организм пациента, страдающего от полной потери или по меньшей мере от частичной потери функции белка, например, в организм пациента, страдающего генетическим заболеванием. Кроме того, открытую рамку считывания можно выбирать из ОРС, кодирующих пептид или белок, который оказывает благоприятное действие на заболевание или состояние пациента. Кроме того, открытая рамка считывания может кодировать пептид или белок, который осуществляет понижающую регуляцию патологического сверхпроизводства встречающегося в естественных условиях пептида или белка или элиминацию клеток, патологически экспрессирующих белок или пептид. Такое отсутствие, потеря функции или сверхпроизводство могут иметь место, например, в случае опухоли и неоплазии, при аутоиммунных заболеваниях, аллергиях, инфекциях, хронических заболеваниях или т.п. Кроме того, открытая рамка считывания может кодировать антиген или иммуноген, например, эпитоп патогена или опухолевого антигена. Так, в предпочтительных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты или вектор, предлагаемая/предлагаемый в настоящем изобретении, содержит ОРС, кодирующую аминокислотную последовательность, содержащую или состоящую из последовательности антигена или иммуногена, например, эпитопа патогена или опухоль-ассоциированного антигена, 3'-UTR-элемент, указанный выше, и/или 5'-UTR-элемент, указанный выше, и необязательно дополнительные компоненты, такие как поли(А)-последовательность и т.п.You can choose ORS depending on the disease to be treated. For example, the open reading frame may encode a protein that is to be delivered to a patient suffering from a complete loss or at least a partial loss of protein function, such as a patient suffering from a genetic disease. In addition, the open reading frame can be selected from ORFs encoding a peptide or protein that has a beneficial effect on the disease or condition of the patient. In addition, the open reading frame may encode a peptide or protein that down-regulates abnormal overproduction of a naturally occurring peptide or protein, or elimination of cells abnormally expressing the protein or peptide. Such absence, loss of function or overproduction may occur, for example, in the case of tumor and neoplasia, autoimmune diseases, allergies, infections, chronic diseases or the like. In addition, the open reading frame may encode an antigen or immunogen, such as an epitope of a pathogen or tumor antigen. Thus, in preferred embodiments of the invention, the artificial nucleic acid molecule or vector proposed / proposed in the present invention contains an ORF encoding an amino acid sequence containing or consisting of an antigen or immunogen sequence, for example, a pathogen epitope or tumor-associated antigen, 3'- UTR element as above and/or 5' UTR element as above and optionally additional components such as poly(A) sequence and the like.

В контексте медицинского применения, прежде всего в контексте вакцинации, предпочтительно, чтобы искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляла собой РНК, предпочтительно мРНК, поскольку ДНК несет риск вызывания иммунного анти-ДНК-ответа и имеет тенденцию к встраиванию в геномную ДНК. Однако в некоторых вариантах осуществления изобретения, например, когда применяют вирусный носитель для доставки, такой как аденовирусный носитель для доставки, для доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, например, в контексте различных видов генного терапии, может оказаться желательным, чтобы искусственная молекула нуклеиновой кислоты или вектор представляла/представлял собой молекулу ДНК.In the context of medical applications, especially in the context of vaccination, it is preferable that the artificial nucleic acid molecule of the present invention is RNA, preferably mRNA, since DNA carries the risk of inducing an immune anti-DNA response and tends to be integrated into genomic DNA . However, in some embodiments of the invention, for example, when a viral delivery vehicle, such as an adenoviral delivery vehicle, is used to deliver an artificial nucleic acid molecule or vector of the present invention, for example, in the context of various gene therapies, it may be desirably, the artificial nucleic acid molecule or vector is/is a DNA molecule.

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить орально, парентерально, путем ингаляции с использованием спрея, местно, ректально, интраназально, трансбуккально, вагинально, с использованием имплантированного резервуара или посредством струйной инъекции. В контексте настоящего описания понятие «парентерально» включает методы подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, чрескожной, внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной и подъязычной инъекции или инфузии. В предпочтительном варианте осуществления изобретения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят посредством безыгольной инъекции (например, струйной инъекции).The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention can be administered orally, parenterally, by inhalation using a spray, topically, rectally, intranasally , buccally, vaginally, using an implanted reservoir, or by bolus injection. In the context of the present description, the term "parenteral" includes the methods of subcutaneous, intravenous, intramuscular, intraarticular, intrasynovial, epigastric, intrathecal, intrahepatic, carried out in the area of damage, intracranial, percutaneous, intradermal, intrapulmonary, intraperitoneal, intracardiac, intraarterial and sublingual injection or infusion. In a preferred embodiment, the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are administered by needleless injection (e.g., jet injection).

Предпочтительно искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят парентерально, например, путем парентеральной инъекции, более предпочтительно с помощью методов подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, чрескожной, внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной, подъязычной инъекции или инфузии. Наиболее предпочтительными являются внутрикожная и внутримышечная инъекции. Стерильные инъекционные формы предлагаемой в изобретении фармацевтической композиции могут представлять собой водную или масляную суспензию. Такие суспензии можно приготавливать с помощью методов, известных в данной области, с применением пригодных диспергирующих или смачивающих средств и суспендирующих средств. Предпочтительно, растворы или суспензии вводят посредством безыгольной инъекции (например, струйной инъекции).Preferably, the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are administered parenterally, such as by parenteral injection, more preferably by subcutaneous, intravenous, intramuscular, intraarticular, intrasynovial, epigastric, intrathecal, intrahepatic, carried out in the area of damage, intracranial, percutaneous, intradermal, intrapulmonary, intraperitoneal, intracardiac, intraarterial, sublingual injection or infusion. Most preferred are intradermal and intramuscular injections. Sterile injectable forms of the pharmaceutical composition according to the invention may be an aqueous or oily suspension. Such suspensions may be prepared by methods known in the art using suitable dispersing or wetting agents and suspending agents. Preferably, solutions or suspensions are administered by needleless injection (eg, jet injection).

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить также орально в любой пригодной для орального введения лекарственной форме, включая (но, не ограничиваясь только ими) капсулы, таблетки, водные суспензии или растворы.The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention may also be orally administered in any oral dosage form, including (but, not limited to) capsules, tablets, aqueous suspensions or solutions.

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять также местно, прежде всего в тех случаях, когда мишень для лечения включает области или органы, легкодоступные для местного нанесения, включая, например, заболевания кожи или любой другой доступной эпителиальной ткани. Для каждой из таких областей или органов можно легко приготавливать пригодные для местной обработки композиции. Для местного нанесения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно приготавливать в виде пригодной мази, суспендированной или растворенной в одном или нескольких носителях.The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention can also be applied topically, especially when the target for treatment includes areas or organs readily available for topical application, including, for example, diseases of the skin or any other accessible epithelial tissue. For each of these areas or organs, compositions suitable for topical treatment can be easily prepared. For topical application, an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention may be formulated into a suitable ointment suspended or dissolved in one or more carriers.

В одном из вариантов осуществления изобретения применение в качестве лекарственного средства включает стадию трансфекции клеток млекопитающих, предпочтительно трансфекцию in vitro или ex vivo клеток млекопитающих, более предпочтительно трансфекцию in vitro клеток, выделенных из организма пациента, подлежащего лечению лекарственным средством. Если применение в качестве лекарственного средства включает трансфекцию in vitro выделенных клеток, то применение может предусматривать также повторное введение трансфектированных клеток пациенту. Применение предлагаемых в изобретении искусственных молекул нуклеиновой кислоты или вектора в качестве лекарственного средства может включать также стадию отбора успешно трансфектированных выделенных клеток. Таким образом, может оказаться целесообразным, чтобы вектор содержал также маркер для селекции. Применение в качестве лекарственного средства может включать также трансфекцию in vitro выделенных клеток и очистку продукта экспрессии, т.е. кодируемого пептида или белка из указанных клеток. Этот очищенный пептид или белок можно затем вводить индивидууму, нуждающемуся в этом.In one embodiment, the use as a drug comprises the step of transfecting mammalian cells, preferably in vitro or ex vivo transfection of mammalian cells, more preferably in vitro transfection of cells isolated from the patient to be treated with the drug. If the use as a drug involves in vitro transfection of the isolated cells, then the use may also involve re-administration of the transfected cells to the patient. The use of the artificial nucleic acid molecules or vector according to the invention as a drug may also include the step of selecting successfully transfected isolated cells. Thus, it may be desirable for the vector to also contain a selection marker. Use as a drug may also include in vitro transfection of isolated cells and purification of the expression product, i.e. encoded peptide or protein from said cells. This purified peptide or protein can then be administered to an individual in need thereof.

В настоящем изобретении предложен также способ лечения или предупреждения заболевания или нарушения, указанного выше, заключающийся в том, что вводят искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, индивидууму, нуждающемуся в этом.The present invention also provides a method for treating or preventing a disease or disorder as defined above, comprising administering an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition, proposed in the present invention, the individual in need of it.

Кроме того, предложен способ лечения или предупреждения заболевания или нарушения, заключающийся в том, что осуществляют трансфекцию клетки искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении. Указанную трансфекцию можно осуществлять in vitro, ex vivo или in vivo. В предпочтительном варианте осуществления изобретения трансфекцию клетки осуществляют in vitro и трансфектированную клетку вводят индивидууму, нуждающемуся в этом, предпочтительно больному человеку. Предпочтительно клетка, которую требуется трансфектировать in vitro, представляет собой клетку, выделенную из организма индивидуума, предпочтительно больного человека. Таким образом, в настоящем изобретении предложен способ лечения, заключающийся в том, что осуществляют стадии, на которых выделяют клетку из организма индивидуума, предпочтительно из организма больного человека, трансфектируют выделенную клетку искусственной нуклеиновой кислотой, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении, и вводят трансфектированную клетку индивидууму, предпочтительно больному человеку.In addition, a method for treating or preventing a disease or disorder is provided, comprising transfecting a cell with an artificial nucleic acid molecule of the present invention or a vector of the present invention. Said transfection can be carried out in vitro, ex vivo or in vivo. In a preferred embodiment of the invention, the cell is transfected in vitro and the transfected cell is administered to an individual in need thereof, preferably a sick individual. Preferably, the cell to be transfected in vitro is a cell isolated from the body of an individual, preferably a diseased human. Thus, the present invention provides a method of treatment comprising the steps of isolating a cell from an individual, preferably from a sick person, transfecting the isolated cell with an artificial nucleic acid of the present invention or a vector of the present invention. of the invention and administering the transfected cell to an individual, preferably a sick individual.

Способ лечения или предупреждения нарушения, предлагаемый в настоящем изобретении, предпочтительно представляет собой способ вакцинации или способ генной терапии, описанный выше.The method for treating or preventing a disorder according to the present invention is preferably a vaccination method or a gene therapy method as described above.

Как описано выше, предлагаемый в изобретении 3'-UTR-элемент и/или предлагаемый в изобретении 5'-UTR-элемент обладает способностью пролонгировать и/или повышать производство белка с мРНК. Таким образом, следующий объект настоящего изобретения относится к способу повышения и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты, предпочтительно с молекулы мРНК или вектора, где способ включает стадию, на которой осуществляют ассоциацию открытой рамки считывания с 3'-UTR-элементом и/или 5'-UTR-элементом, где 3'-UTR-элемент и/или 5'-UTR-элемент обеспечивает высокую эффективность трансляции полученной искусственной молекулы нуклеиновой кислоты, с получением искусственной молекулы нуклеиновой кислоты, предпочтительно молекулы мРНК, предлагаемой в настоящем изобретении, которая описана выше, или вектора, предлагаемого в настоящем изобретении, который описан выше.As described above, the inventive 3'UTR element and/or the inventive 5'UTR element has the ability to prolong and/or increase protein production from mRNA. Thus, a further aspect of the present invention relates to a method for increasing and/or prolonging protein production from an artificial nucleic acid molecule, preferably from an mRNA molecule or a vector, wherein the method comprises associating an open reading frame with a 3'UTR element and /or a 5'-UTR element, where the 3'-UTR element and/or the 5'-UTR element provides a high efficiency of translation of the obtained artificial nucleic acid molecule, obtaining an artificial nucleic acid molecule, preferably an mRNA molecule, proposed in the present invention , which is described above, or the vector proposed in the present invention, which is described above.

Предпочтительно, в способе повышения и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты, предпочтительно с молекулы мРНК или вектора, предлагаемой/предлагаемого в настоящем изобретении, 3'-UTR-элемент и/или 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, которая получена из 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, которая состоит из ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, СВХ6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, ТМЕМ33, TUBA4A, ЕМР3, ТМЕМ201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (предпочтительно все человеческие) и Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, An1n, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Cel17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Cel17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (предпочтительно все мышиные); предпочтительно из группы, состоящей из ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB3-5'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR, (предпочтительно все человеческие) и Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (предпочтительно все мышиные); и NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (предпочтительно все человеческие) и Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Cel17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR, (предпочтительно все мышиные).Preferably, in a method for increasing and/or prolonging the production of a protein from an artificial nucleic acid molecule, preferably from an mRNA molecule or a vector of the present invention, the 3'-UTR element and/or the 5'-UTR element contains or consists of a nucleotide sequence that is derived from the 3'-UTR and/or 5'-UTR of a gene transcript selected from the group consisting of ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2 , TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3, FASN, PSMB6 , PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2 , CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CD K9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (preferably all human) and Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3 , Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, An1n, Slfn9, Ncaph, Pole , Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1 , Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Cel17, Alkbh7, Ms4a8a , Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (preferably all mice); preferably from the group consisting of ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6- 5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5 '-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5' -UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'- UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB3-5'-UTR , FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D -5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1- 5'-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5 '-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQC R10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR, (preferably all human) and Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2- 5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5 '-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5' -UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'- UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR , Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6 -5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6- 5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5 '-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (ex preferably all mice); and NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56 -3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1- 3'-UTR (preferably all human) and Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'- UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR , Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Cel17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik -3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR, (preferably all murines).

Понятие «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом и/или с 5'-UTR-элементом» в контексте настоящего изобретения предпочтительно означает функциональную ассоциацию или функциональное объединение искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом и/или с 5'-UTR-элементом. Это означает, что осуществляют ассоциацию или связывание искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом и/или с 5'-UTR-элементом, предпочтительно с 3'-UTR-элементом и/или с 5'-UTR-элементом, описанным выше, таким образом, чтобы осуществлялась функция 3'-UTR-элемента и/или 5'-UTR-элемента, например, функция пролонгирования и/или повышения производства РНК и/или белка. Как правило, это означает, что 3'-UTR-элемент и/или 5'-UTR-элемент интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в молекулу мРНК, с 3'-стороны и/или 5'-стороны относительно открытой рамки считывания соответственно, предпочтительно так, чтобы он непосредственно примыкал с 3'-стороны к открытой рамке считывания и/или непосредственно примыкал с 5'-стороны к открытой рамке считывания, чтобы 3'-UTR-элемент предпочтительно располагался между открытой рамкой считывания и поли(А)-последовательностью или сигналом полиаденилирования. Предпочтительно 3'-UTR-элемент и/или 5'-UTR-элемент интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в мРНК, в качестве 3'-UTR и/или 5'-UTR соответственно, т.е. так, чтобы 3'-UTR-элемент и/или 5'-UTR-элемент представлял собой 3'-UTR и/или 5'-UTR соответственно искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно мРНК, т.е. так, чтобы 5'-UTR-концы находились непосредственно перед 5'-концом ОРС и 3'-UTR простирался от 3'-стороны открытой рамки считывания до 5'-стороны поли(А)-последовательности или сигнала полиаденилирования, необязательно был присоединен с помощью короткого линкера, такого как последовательность, содержащая или состоящая из одного или нескольких сайтов рестрикции. Таким образом, предпочтительно понятие «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом и/или 5'-UTR-элементом» означает функциональную ассоциацию 3'-UTR-элемента и/или 5'-UTR-элемента с открытой рамкой считывания, локализованной в искусственной молекуле нуклеиновой кислоты или векторе, предпочтительно в молекуле мРНК. 3'-UTR и/или 5'-UTR и ОРС представляют собой конструкции, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, предпочтительно ОРС и 3'-UTR являются гетерологичными и/или ОРС и 5'-UTR являются гетерологичными соответственно, например, происходят из различных генов, как описано выше. Ассоциацию с 3'-UTR-элементом и/или 5'-UTR-элементом можно осуществлять либо посредством de novo ассоциации индивидуальных элементов, либо путем модификации уже существующей нуклеиновой кислоты (матрицы). В последнем случае, в качестве примера и в качестве иллюстрации молекулу нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно получать путем (I) использования нуклеиновой кислоты, имеющей соответствующую последовательность, которая представлена на фиг. 1А, в качестве матрицы, (II) модификации указанной матрицы путем замены по меньшей мере одного (а) подчеркнутого 5'-UTR-элемента (подчеркнут на фиг. 1А) или (б) 3'-UTR-элемента (подчеркнут двойной линией на фиг. 1А) на (а) другой 5'-UTR-элемент или (б) другой 3'-UTR-элемент, осуществляя тем самым ассоциацию искусственной молекулы нуклеиновой кислоты с указанным 5'-UTR-элементом или 3'-UTR-элементом.The term "association of an artificial nucleic acid molecule or vector with a 3'-UTR element and/or with a 5'-UTR element" in the context of the present invention preferably means the functional association or functional association of an artificial nucleic acid molecule or vector with a 3'-UTR- element and/or with a 5'-UTR element. This means that the association or binding of the artificial nucleic acid molecule or vector is carried out with a 3'-UTR element and/or with a 5'-UTR element, preferably with a 3'-UTR element and/or with a 5'-UTR element described above, in such a way that the function of the 3'-UTR element and/or 5'-UTR element is carried out, for example, the function of prolonging and/or increasing the production of RNA and/or protein. This generally means that the 3'UTR element and/or the 5'UTR element is integrated into the artificial nucleic acid molecule or vector, preferably into the mRNA molecule, from the 3' side and/or 5' side of the relatively open frame, respectively, preferably so that it is directly adjacent on the 3' side of the open reading frame and/or directly adjacent on the 5' side of the open reading frame, so that the 3'-UTR element is preferably located between the open reading frame and the poly (A) polyadenylation sequence or signal. Preferably, the 3'UTR element and/or the 5'UTR element is integrated into the artificial nucleic acid molecule or vector, preferably into mRNA, as the 3'UTR and/or 5'UTR, respectively, i. so that the 3'-UTR element and/or 5'-UTR element is the 3'-UTR and/or 5'-UTR respectively of an artificial nucleic acid molecule or vector, preferably mRNA, i. e. so that the 5'-UTR ends immediately before the 5'-end of the ORF and the 3'-UTR extends from the 3' side of the open reading frame to the 5' side of the poly(A) sequence or polyadenylation signal, optionally attached to using a short linker, such as a sequence containing or consisting of one or more restriction sites. Thus, preferably, the term "association of an artificial nucleic acid molecule or vector with a 3'-UTR element and/or 5'-UTR element" means the functional association of a 3'-UTR element and/or 5'-UTR element with an open a reading frame located in an artificial nucleic acid molecule or vector, preferably in an mRNA molecule. 3'-UTR and/or 5'-UTR and ORF are the constructs described above for the artificial nucleic acid molecule of the present invention, for example, preferably ORF and 3'-UTR are heterologous and/or ORF and 5'-UTR are heterologous, respectively, eg derived from different genes, as described above. Association with the 3'-UTR element and/or 5'-UTR element can be accomplished either by de novo association of individual elements or by modification of an already existing nucleic acid (template). In the latter case, by way of example and illustration, the nucleic acid molecule of the present invention can be obtained by (I) using a nucleic acid having the corresponding sequence as shown in FIG. 1A as a template, (ii) modifying said template by replacing at least one (a) underlined 5'-UTR element (underlined in FIG. 1A) or (b) 3'-UTR element (underlined in double line on Fig. 1A) to (a) another 5'-UTR element or (b) another 3'-UTR element, thereby carrying out the association of an artificial nucleic acid molecule with the specified 5'-UTR element or 3'-UTR element .

Другой объект настоящего изобретения относится к применению 3'-UTR-элемента и/или 5'-UTR-элемента, предпочтительно 3'-UTR-элемента, описанного выше, и/или 5'-UTR-элемента, описанного выше, для повышения и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты, предпочтительно с молекулы мРНК или вектора, где 3'-UTR-элемент и/или 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, полученной из 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, которая состоит из ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, СВХ6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, ТМЕМ33, TUBA4A, ЕМР3, ТМЕМ201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3 5'-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, ЕМР3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (предпочтительно все человеческие) и Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Cel17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (предпочтительно все мышиные); предпочтительно из группы, состоящей из ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB3 5'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (предпочтительно все человеческие) и Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (предпочтительно все мышиные); и NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (предпочтительно все человеческие) и Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox11-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR, (предпочтительно все мышиные).Another aspect of the present invention relates to the use of a 3'UTR element and/or a 5'UTR element, preferably a 3'UTR element as described above and/or a 5'UTR element as described above, to enhance and /or prolonging the production of a protein from an artificial nucleic acid molecule, preferably from an mRNA molecule or a vector, where the 3'-UTR element and/or the 5'-UTR element contains or consists of a nucleotide sequence derived from the 3'-UTR and/or 5'-UTR of a gene transcript selected from the group consisting of ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3 5'-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, PO LR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (preferably all human) and Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn , Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3 , Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Cel17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp7 , Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (preferably all mice); preferably from the group consisting of ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6- 5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5 '-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5' -UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'- UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB3 5'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC -5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D- 5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5 '-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5' -UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQC R10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (preferably all human) and Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2-5 '-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5' -UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'- UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR , Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1 -5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6- 5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5 '-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5' -UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (pre preferably all mouse); and NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56 -3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1- 3'-UTR (preferably all human) and Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox11-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'- UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR , Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik -3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR, (preferably all murines).

Варианты применения, предлагаемые в настоящем изобретении, предпочтительно включают ассоциацию искусственной молекулы нуклеиновой кислоты, вектора или РНК с 3'-UTR-элементом, описанным выше, и/или с 5'-UTR-элементом, описанным выше.The uses of the present invention preferably include the association of an artificial nucleic acid molecule, vector or RNA with a 3'UTR element as described above and/or a 5'UTR element as described above.

Соединения и ингредиенты предлагаемой в изобретении фармацевтической композиции можно также изготавливать и продавать по отдельности друг от друга. Таким образом, изобретение относится также к набору или набору компонентов, содержащему искусственную молекулу нуклеиновой кислоты, предлагаемой в изобретении, вектор, предлагаемый в изобретении, клетку, предлагаемую в изобретении, и/или фармацевтическую композицию, предлагаемую в изобретении. Предпочтительно такой набор или наборы компонентов могут дополнительно содержать инструкции по применению, клетки для трансфекции, адъювант, средства для введения фармацевтической композиции, фармацевтически приемлемый носитель и/или фармацевтически приемлемый раствор для растворения или разведения искусственной молекулы нуклеиновой кислоты, вектора, клеток или фармацевтической композиции.Compounds and ingredients proposed in the invention of the pharmaceutical composition can also be manufactured and sold separately from each other. Thus, the invention also relates to a kit or kit of components comprising an artificial nucleic acid molecule according to the invention, a vector according to the invention, a cell according to the invention, and/or a pharmaceutical composition according to the invention. Preferably, such kit or kits of components may further comprise instructions for use, transfection cells, an adjuvant, means for administering the pharmaceutical composition, a pharmaceutically acceptable carrier, and/or a pharmaceutically acceptable solution for dissolving or reconstituting the artificial nucleic acid molecule, vector, cells, or pharmaceutical composition.

Способ идентификации элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или элемента 5'-нетранслируемой области (5'-UTR-элемента)Method for identifying an element of a 3'-untranslated region (3'-UTR element) and/or an element of a 5'-untranslated region (5'-UTR element)

Другим объектом настоящего изобретения является способ идентификации элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или элемента 5'-нетранслируемой области (5'-UTR-элемента), включающий следующие стадии, на которых:Another object of the present invention is a method for identifying a 3'-untranslated region element (3'-UTR element) and/or a 5'-untranslated region element (5'-UTR element), comprising the following steps, in which:

а) анализируют стабильность мРНК, осуществляя следующие подстадии, на которых:a) analyze the stability of the mRNA, carrying out the following sub-steps, in which:

I. определяют количество указанной мРНК в первый момент времени в процессе расщепления указанной мРНК,I. determine the amount of the specified mRNA at the first time point in the process of cleavage of the specified mRNA,

II. определяют количество указанной мРНК во второй момент времени в процессе расщепления указанной мРНК, иII. determining the amount of said mRNA at a second time point in the process of cleavage of said mRNA, and

III. рассчитывают отношение количества указанной мРНК, определенное на стадии (I), к количеству указанной мРНК, определенному на стадии (II);III. calculate the ratio of the amount of said mRNA determined in step (I) to the amount of said mRNA determined in step (II);

б) Отбирают стабильную мРНК, характеризующуюся тем, что отношение, рассчитанное на подстадии (III), составляет по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%), по меньшей мере 0,9 (90%) или по меньшей мере 0,95 (95%); иb) A stable mRNA is selected, characterized in that the ratio calculated in substep (III) is at least 0.5 (50%), at least 0.6 (60%), at least 0.7 (70 %), at least 0.75 (75%), at least 0.8 (80%), at least 0.85 (85%), at least 0.9 (90%), or at least 0.95 (95%); and

в) Определяют нуклеотидную последовательность 3'- и/или 5'-UTR-элемента указанной стабильной мРНК.c) The nucleotide sequence of the 3'- and/or 5'-UTR element of said stable mRNA is determined.

При этом стабильность мРНК предпочтительно оценивают в стандартных условиях, например, в стандартных условиях (стандартная среда, инкубация и т.д.) для конкретной применяемой клеточной линии или применяемого типа клеток.While the stability of the mRNA is preferably assessed under standard conditions, for example, under standard conditions (standard environment, incubation, etc.) for a specific used cell line or used cell type.

Для анализа стабильности мРНК процесс расщепления указанной мРНК оценивают путем определения количества или концентрации указанной мРНК в первый и второй моменты времени в процессе расщепления указанной мРНК (смотри стадии а) I. и а) II.).To analyze the stability of the mRNA, the cleavage process of said mRNA is evaluated by determining the amount or concentration of said mRNA at the first and second time points during the cleavage of said mRNA (see steps a) I. and a) II.).

Для определения количества или концентрации мРНК в процессе расщепления РНК in vivo или in vitro, как указано выше (т.е. in vitro относится, в частности, к («живым») клеткам и/или ткани, включая ткань живого индивидуума; клетки включают, в частности, клеточные линии, первичные клетки, клетки в ткани или в организме индивидуумов, предпочтительными являются клетки млекопитающих, например, человеческие клетки и мышиные клетки, и наиболее предпочтительно применяют человеческие линии клеток HeLa, HEPG2 и U-937 и мышиные линии клеток NIH3T3, JAWSII и L929, кроме того, наиболее предпочтительными являются первичные клетки, в наиболее предпочтительных вариантах осуществления изобретения - человеческие кожные фибробласты (HDF)), можно применять различные методы, известные специалисту в данной области. Примеры таких методов включают (но, не ограничиваясь только ими) общее ингибирование транскрипции, например, с помощью ингибитора транскрипции, такого как актиномицин D, применение индуцибельных промоторов для специфического усиления кратковременной транскрипции, например, индуцируемой сывороткой промоторной системы c-fos и регуляторной промоторной системы Tet-off, и кинетические методы мечения, например, импульсного мечения.To determine the amount or concentration of mRNA during in vivo or in vitro RNA digestion as defined above (i.e. in vitro refers specifically to (“live”) cells and/or tissue, including tissue from a living individual; cells include in particular cell lines, primary cells, cells in tissue or in the body of individuals, mammalian cells such as human cells and mouse cells are preferred, and most preferably human HeLa, HEPG2 and U-937 cell lines and mouse NIH3T3 cell lines are used. , JAWSII and L929, moreover, most preferred are primary cells, in the most preferred embodiments of the invention, human dermal fibroblasts (HDF)), various methods known to the person skilled in the art can be used. Examples of such methods include, but are not limited to, general transcription inhibition, e.g., with a transcription inhibitor such as actinomycin D, the use of inducible promoters to specifically enhance short-term transcription, e.g., the serum-inducible c-fos promoter system and the regulatory promoter system. Tet-off, and kinetic labeling methods such as pulse labeling.

Например, если для определения количества или концентрации мРНК в процессе расщепления РНК in vivo или in vitro, как указано выше, применяют опосредуемое ингибитором транскрипции прекращение транскрипции на стадии а), то можно применять ингибиторы транскрипции, такие как актиномицин D (ActD), 5,6-дихлор-1-D-рибофуранозилбензимидазол (DRB) или -аманитин (α-Am). В этом случае для оценки расщепления мРНК, как правило, ингибиторы транскрипции добавляют к клеткам и тем самым обычно ингибируют транскрипцию, и при этом можно выявлять расщепление РНК без помех, обусловленных происходящей транскрипцией.For example, if transcription inhibitor-mediated transcription termination in step a) is used to determine the amount or concentration of mRNA during in vivo or in vitro RNA cleavage as above, then transcription inhibitors such as actinomycin D (ActD), 5, 6-dichloro-1-D-ribofuranosylbenzimidazole (DRB) or -amanitin (α-Am). In this case, in order to assess mRNA cleavage, generally, transcription inhibitors are added to cells and thereby generally inhibit transcription, and RNA cleavage can be detected without being interfered with by ongoing transcription.

В альтернативном варианте на стадии а) можно применять индуцибельные промоторы для специфического усиления кратковременной транскрипции, в этом случае идея заключается в том, чтобы обеспечить стимул, который активирует транскрипцию и приводит к всплеску синтеза мРНК, после чего стимул удаляют для «выключения» транскрипции и осуществляют мониторинг расщепления мРНК. При этом применение индуцибельного промотора позволяет осуществлять строгий контроль, благодаря чему индукция и прекращение транскрипции происходят в узком временном окне. Известно, что в случае клеток млекопитающих, для указанной цели полезным является промотор c-fos, поскольку он поддается быстрой и кратковременной индукции в ответ на добавление сыворотки, что обеспечивает надежный и простой путь достижения кратковременной вспышки транскрипции. Промоторная система Tet-off представляет собой другую возможность, которая еще больше расширяет применение подхода, основанного на импульсном усилении транскрипции, для изучения обмена мРНК в клетках млекопитающих.Alternatively, in step a), inducible promoters can be used to specifically enhance short-term transcription, in which case the idea is to provide a stimulus that activates transcription and leads to a burst of mRNA synthesis, after which the stimulus is removed to “turn off” transcription and mRNA cleavage monitoring. At the same time, the use of an inducible promoter allows for strict control, due to which the induction and termination of transcription occur in a narrow time window. In the case of mammalian cells, the c-fos promoter is known to be useful for this purpose because it is amenable to rapid and short-term induction in response to the addition of serum, which provides a reliable and simple way to achieve a short-term burst of transcription. The Tet-off promoter system represents another possibility that further expands the application of the transcriptional burst-amplification approach to studying mRNA turnover in mammalian cells.

Однако, в настоящем изобретении на стадии а) для определения количества мРНК в процессе расщепления РНК in vivo или in vitro, как указано выше, предпочтительно применяют кинетические методы мечения. В кинетических методах мечения, как правило, осуществляют мечение РНК, при этом метки включают, прежде всего, меченые нуклеотиды и меченые нуклеозиды, наиболее предпочтительными являются меченый уридин и меченый урацил. Примеры предпочтительных меток включают 4-тиоуридин (4sU), 2-тиоуридин, 6-тиогуанозин, 5-этинилуридин (EU), 5-бромуридин (BrU), биотин-16-аминоаллилуридин, 5-аминоаллилуридин, 5-аминоаллилцитидин и т.д., при этом 4-тиоуридин (4sU), 5-этинилуридин (EU) или 5'-бромуридин (BrU) являются более предпочтительными. Наиболее предпочтительным является 4-тиоуридин (4sU). 4-тиоуридин (4sU) предпочтительно применяют в концентрации 100-500 мкМ. Кроме того, можно применять также радиоактивно меченые нуклеотиды, например, уридин-3Н. Можно применять также комбинации указанных выше меченых нуклеотидов, при этом наиболее предпочтительными является комбинация 4-тиоуридина и 6-тиогуанозина.However, in the present invention, in step a), kinetic labeling methods are preferably used to determine the amount of mRNA during in vivo or in vitro RNA cleavage as described above. In kinetic labeling methods, as a rule, labeling of RNA is carried out, while labels include primarily labeled nucleotides and labeled nucleosides, labeled uridine and labeled uracil are most preferred. Examples of preferred labels include 4-thiouridine (4sU), 2-thiouridine, 6-thioguanosine, 5-ethynyluridine (EU), 5-bromuridine (BrU), biotin-16-aminoallyluridine, 5-aminoallyluridine, 5-aminoallylcytidine, etc. ., with 4-thiouridine (4sU), 5-ethynyluridine (EU) or 5'-bromouridine (BrU) being more preferred. Most preferred is 4-thiouridine (4sU). 4-thiouridine (4sU) is preferably used at a concentration of 100-500 μM. In addition, radiolabeled nucleotides, for example uridine- 3H , can also be used. Combinations of the above labeled nucleotides can also be used, with the combination of 4-thiouridine and 6-thioguanosine being most preferred.

При кинетическом мечении, как правило, метят образующуюся РНК, например, путем включения меченого уридина или урацила в процессе транскрипции. Спустя некоторое время прекращают добавление метки, и после этого можно обнаруживать расщепление РНК путем оценки специфически меченой РНК, не осуществляя общее ингибирования транскрипции.Kinetic labeling typically labels the resulting RNA, for example by incorporating a labeled uridine or uracil during transcription. After some time, labeling is stopped, and thereafter RNA cleavage can be detected by assessing specifically labeled RNA without overall inhibition of transcription.

Для определения количества мРНК в процессе расщепления РНК на стадии а) предпочтительно применяют импульсное мечение, при этом наиболее предпочтительной является методология вытеснения метки. В контексте настоящего описания понятие «импульсное мечение» относится к методу, в котором применяют метку, например, описанные выше метки, для измерения скоростей синтеза и/или расщепления соединений в живых клетках. Как правило, клетки приводят в контакт с небольшим количеством метки в течение короткого периода времени, поэтому используют понятие «импульс». В методологии вытеснения метки после импульсного мечения, как правило, после необходимого периода времени контактирования с меткой добавляют в намного большем количестве немеченое соединение, соответствующее «импульсу» (соединению, используемому для импульсного мечения) (например, немеченый уридин, если в качестве импульса применяли меченый уридин). Воздействие конкуренции между меченым и немеченым соединениями должно приводить к снижению дальнейшего поглощения меченого соединения до пренебрежимо малого уровня, отсюда понятие «вытеснение».To determine the amount of mRNA during RNA cleavage in step a), pulse labeling is preferably used, with label displacement methodology being most preferred. In the context of the present description, the term "pulse labeling" refers to a method in which a label is used, for example, the labels described above, to measure the rates of synthesis and/or cleavage of compounds in living cells. Typically, cells are brought into contact with a small amount of label for a short period of time, so the term "pulse" is used. In a post-pulse labeling dislodge methodology, typically after the required period of contact time with the label, a much larger amount of unlabeled compound corresponding to the "pulse" (compound used for pulse labeling) is added (e.g., unlabeled uridine if labeled was used as the pulse). uridine). The effect of competition between labeled and unlabeled compounds should reduce further absorption of the labeled compound to a negligible level, hence the concept of "crowding out".

Для определения количества или концентрации мРНК, как правило, необходимо выделять мРНК. Специалисту в данной области известны различные методы выделения РНК, например, с помощью экстракции гуанидин-тиоцианат-фенол-хлороформом или экстракции с использованием силикагелевой колонки. Можно применять также поступающие в продажу наборы, например, набор RNeasy Kit фирмы Qiagen.To determine the amount or concentration of mRNA, as a rule, it is necessary to isolate the mRNA. The person skilled in the art is aware of various methods for isolating RNA, for example, by extraction with guanidine-thiocyanate-phenol-chloroform or by extraction using a silica gel column. Commercially available kits can also be used, such as the RNeasy Kit from Qiagen.

Кроме того, может потребоваться стадия экстракции, в частности, в том случае, когда применяют кинетический метод мечения (в отличие от ингибитора транскрипции, когда общая РНК представляет собой «расщепляющуюся» РНК, поскольку осуществляют общее ингибирование транскрипции). На стадии экстракции меченую РНК (т.е. представляющую собой «расщепляющуюся» РНК) экстрагируют из общей выделенной РНК. Таким образом, средства экстракции можно выбирать в зависимости от применяемой метки. Например, можно применять иммунную очистку с использованием антител к метке.In addition, an extraction step may be required, in particular when a kinetic labeling method is used (as opposed to a transcription inhibitor where the total RNA is a "cleaving" RNA, since overall transcription inhibition is performed). In the extraction step, labeled RNA (i.e., representing "cleaving" RNA) is extracted from the total isolated RNA. Thus, extraction means can be selected depending on the label used. For example, immunopurification using anti-label antibodies can be used.

Кроме того, например, для экстракции несущей тио-метку, например, меченой 4-тиоуридином (4sU) РНК, можно осуществлять инкубацию HPDP-биотин (пиридилдитиол-активированный, сульфгидрил-реактивный реагент для биотинилирования, конъюгация с которым происходит посредством расщепляемой (обратимой) дисульфидной связи) с выделенной «общей РНК». Этот реагент специфически взаимодействует с восстановленными тиолами (-SH) в меченой 4-тиоуридином (4sU) РНК с образованием обратимых дисульфидных связей. Биотинилирование позволяет осуществлять связывание несущей тио-метку, например, меченой 4-тиоуридином (4sU) РНК со стрептавидином и, следовательно, ее можно экстрагировать из общей РНК путем восстановления дисульфидной связи с помощью дитиотреитола или бета-меркаптоэтанола (или любого другого восстановителя).In addition, for example, to extract a thio-labeled, for example, 4-thiouridine (4sU) labeled RNA, one can incubate HPDP-biotin disulfide bond) with isolated "total RNA". This reagent reacts specifically with reduced thiols (-SH) in 4-thiouridine (4sU) labeled RNA to form reversible disulfide bonds. Biotinylation allows binding of a thio-labeled, for example, 4-thiouridine (4sU) labeled RNA to streptavidin and can therefore be extracted from total RNA by disulfide reduction with dithiothreitol or beta-mercaptoethanol (or any other reducing agent).

В случае меченых биотином нуклеотидов, например, биотин-16-аминоаллилуридина, можно применять непосредственно стрептавидин для экстракции меченой РНК из общей РНК.In the case of biotin labeled nucleotides, for example biotin-16-aminoallyluridine, streptavidin can be used directly to extract labeled RNA from total RNA.

Например, для экстракции новых транскрибированных меченных 5-этинилуридином (EU) клеточных РНК из общей РНК можно применять биотинилирование EU в катализируемой медью реакции циклоприсоединения (часто обозначают как «клик-химия»), после чего осуществлять очистку на основе аффинности к стрептавидину. Этот метод осуществляют с использованием поступающего в продажу набора Click-iT Nascent RNA Capture (каталожный номер С10365, фирма Invitrogen). В инструкции производителя рекомендовано применять время импульсного мечения от 30 до 60 мин для дозы 0,5 мМ EU или от 1 до 24 ч для дозы 0,1 или 0,2 мМ EU.For example, to extract novel transcribed 5-ethynyluridine (EU) labeled cellular RNAs from total RNA, EU biotinylation in a copper-catalyzed cycloaddition reaction (often referred to as "click chemistry") can be used, followed by purification based on affinity for streptavidin. This method is performed using the commercially available Click-iT Nascent RNA Capture Kit (catalog number C10365, Invitrogen). The manufacturer's instructions recommend using a pulse labeling time of 30 to 60 min for a dose of 0.5 mM EU or 1 to 24 h for a dose of 0.1 or 0.2 mM EU.

Например, меченные BrU молекулы РНК можно экстрагировать посредством иммуноочистки с использованием антитела к бромдезоксиуридину (например, клона 2 В1, каталожный номер MI-11-3, фирма MBL) и белок G сефарозы.For example, BrU-labeled RNA molecules can be extracted by immunopurification using an anti-bromodeoxyuridine antibody (eg, clone 2B1, catalog number MI-11-3, MBL) and Sepharose G protein.

Затем можно измерять количество или концентрацию мРНК, т.е. уровень (число копий) транскрипта, с помощью различных методов, известных специалисту в данной области. Примерами таких методов являются (но, не ограничиваясь только ими) анализ с использованием микромассивов, анализ методом нозерн-блоттинга, количественная ПЦР или технология секвенирования следующего поколения (высокоэффективное секвенирование). Наиболее предпочтительными являются анализ с использованием микромассивов и технология секвенирования следующего поколения. Кроме того, наиболее предпочтительными являются подходы на основе анализа полного генома/полного транскриптома, например, при анализе на основе микромассивов - анализ полногеномного микромассива, например, Affymetrix Human Gene 1.0 ST или 2.0 ST, или Affymetrix Mouse Gene 1.0 ST или 2.0 ST, или анализ полного транскрипта путем секвенирования следующего поколения.The amount or concentration of mRNA can then be measured, i. e. the level (number of copies) of the transcript, using various methods known to the person skilled in the art. Examples of such methods include, but are not limited to, microarray analysis, Northern blot analysis, quantitative PCR, or next generation sequencing technology (high throughput sequencing). Most preferred are microarray analysis and next generation sequencing technology. In addition, whole genome/whole transcriptome based approaches are most preferred, e.g. in microarray based analysis, whole genome microarray analysis, e.g. Affymetrix Human Gene 1.0 ST or 2.0 ST, or Affymetrix Mouse Gene 1.0 ST or 2.0 ST, or full transcript analysis by next generation sequencing.

На подстадиях I. и II. стадии а) определяют количество мРНК в первый и во второй моменты времени в процессе расщепления мРНК. Как правило, это означает, что мРНК, прежде всего, выделяют в первый и во второй моменты времени в процессе расщепления мРНК для определения соответствующих количеств. Следовательно, «первый момент времени» и «второй момент времени» представляют собой определенные моменты времени в процессе расщепления РНК, в которые выделяют РНК для определения количества РНК. Как правило, «второй момент времени» наступает позднее в процессе расщепления РНК, чем «первый момент времени».At substages I. and II. step a) determine the amount of mRNA at the first and second time points in the process of mRNA cleavage. Typically, this means that the mRNA is first isolated at the first and second time points in the mRNA cleavage process to determine the appropriate amounts. Therefore, "first time" and "second time" are specific times in the RNA cleavage process at which RNA is isolated to determine the amount of RNA. As a rule, the "second time point" occurs later in the RNA cleavage process than the "first time point".

Предпочтительно первый момент времени выбирают таким образом, чтобы рассматривать только мРНК, подвергающуюся процессу расщепления, т.е. чтобы избегать образующейся мРНК, например, в процессе транскрипции. Например, если применяют кинетические методы мечения, например, импульсное мечение, то первый момент времени предпочтительно выбирают таким образом, чтобы было завершено включение метки в мРНК, т.е. более не происходило включение метки в мРНК. Так, если применяют кинетическое мечение, то первый момент времени может наступать по меньшей мере через 10 мин, по меньшей мере через 20 мин, по меньшей мере через 30 мин, по меньшей мере через 40 мин, по меньшей мере через 50 мин, по меньшей мере через 60 мин, по меньшей мере через 70 мин, по меньшей мере через 80 мин или по меньшей мере через 90 мин после окончания экспериментальной процедуры мечения, например, после окончания инкубации клеток с меткой.Preferably, the first time point is chosen such that only the mRNA undergoing the cleavage process is considered, ie. to avoid the resulting mRNA, for example, during the transcription process. For example, if kinetic labeling methods are used, such as pulsed labeling, the first time point is preferably chosen such that incorporation of the label into the mRNA is complete, i.e. there was no more incorporation of the label into the mRNA. Thus, if kinetic labeling is used, the first time point may be at least 10 minutes, at least 20 minutes, at least 30 minutes, at least 40 minutes, at least 50 minutes, at least at least 60 minutes, at least 70 minutes, at least 80 minutes, or at least 90 minutes after the end of the experimental labeling procedure, for example, after the end of incubation of the labeled cells.

Например, первый момент времени может наступать предпочтительно через 0-6 ч после прекращения транскрипции (например, с помощью ингибитора транскрипции), прекращения индукции промотора в случае применения индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания мечения. Более предпочтительно первый момент времени может наступать по истечении периода, составляющего от 30 мин до 5 ч, еще более предпочтительно от 1 до 4 ч и наиболее предпочтительно примерно через 3 ч после прекращения транскрипции (например, с помощью ингибитора транскрипции), прекращения индукции промотора в случае применения индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания мечения.For example, the first time point may preferably occur 0-6 hours after transcription has been terminated (e.g., with a transcription inhibitor), promoter induction has been terminated when using inducible promoters, or after the pulse or label has been terminated, e.g., after labeling has ended. More preferably, the first time point may occur after a period of 30 minutes to 5 hours, even more preferably 1 to 4 hours, and most preferably about 3 hours after transcription has ceased (for example, with a transcription inhibitor), promoter induction has ceased at in the case of using inducible promoters or after the pulse or label is stopped, for example, after the end of labeling.

Предпочтительно второй момент времени выбирают таким образом, чтобы он наступал максимально позже в процессе расщепления мРНК. Однако, если рассматривают множество видов мРНК, то второй момент времени предпочтительно выбирают таким образом, чтобы все еще имелось значительное количество видов мРНК, предпочтительно по меньшей мере 10% видов мРНК, присутствующих в поддающемся обнаружению количестве, т.е. в количестве, превышающем 0. Предпочтительно, второй момент времени наступает по меньшей мере через 5 ч, по меньшей мере через 6 ч, по меньшей мере через 7 ч, по меньшей мере через 8 ч, по меньшей мере через 9 ч, по меньшей мере через 10 ч, по меньшей мере через 11 ч, по меньшей мере через 12 ч, по меньшей мере через 13 ч, по меньшей мере через 14 ч или по меньшей мере через 15 ч после прекращения транскрипции (например, с помощью ингибитора транскрипции), прекращения индукции промотора в случае применения индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания мечения.Preferably, the second time point is chosen so that it occurs as late as possible in the mRNA cleavage process. However, if multiple mRNA species are considered, the second time point is preferably chosen such that there is still a significant number of mRNA species, preferably at least 10% of the mRNA species present in a detectable amount, i.e. in an amount greater than 0. Preferably, the second time occurs after at least 5 hours, at least 6 hours, at least 7 hours, at least 8 hours, at least 9 hours, at least 10 hours, at least 11 hours, at least 12 hours, at least 13 hours, at least 14 hours, or at least 15 hours after transcription is stopped (for example, with a transcription inhibitor), cessation of promoter induction in the case of inducible promoters or after the termination of the pulse or label, for example, after the end of labeling.

Например, второй момент времени предпочтительно может наступать через 3-48 ч после прекращения транскрипции (например, с помощью ингибитора транскрипции), прекращения индукции промотора в случае применения индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания мечения. Более предпочтительно второй момент времени может наступать по истечении периода времени, составляющего от 6 мин до 36 ч, еще более предпочтительно от 10 до 24 ч и наиболее предпочтительно примерно через 15 ч после прекращения транскрипции (например, с помощью ингибитора транскрипции), прекращения индукции промотора в случае применения индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания мечения.For example, the second time point may preferably occur 3-48 hours after transcription has been terminated (e.g., with a transcription inhibitor), promoter induction has been terminated when using inducible promoters, or after the pulse or label has been terminated, e.g., after labeling has ended. More preferably, the second time point may occur after a period of 6 minutes to 36 hours, even more preferably 10 to 24 hours, and most preferably about 15 hours after transcription has ceased (for example, with a transcription inhibitor), promoter induction has ceased. in the case of the use of inducible promoters or after the termination of the pulse or label, for example, after the end of labeling.

Таким образом, промежуток времени между первым моментом времени и вторым моментом времени предпочтительно должен быть максимально большим в указанных выше пределах. Следовательно, промежуток времени между первым моментом времени и вторым моментом времени предпочтительно должен составлять по меньшей мере 4 ч, по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч или по меньшей мере 12 ч, при этом наиболее предпочтителен промежуток времени, составляющий примерно 12 ч. Как правило, второй момент времени наступает по меньшей мере на 10 мин позднее чем первый момент времени.Thus, the time interval between the first time and the second time should preferably be as long as possible within the above limits. Therefore, the time interval between the first time point and the second time point should preferably be at least 4 hours, at least 5 hours, at least 6 hours, at least 7 hours, at least 8 hours, at least 9 hours. , at least 10 hours, at least 11 hours, or at least 12 hours, with about 12 hours being most preferred. Typically, the second time is at least 10 minutes later than the first time.

На подстадии III. стадии а) рассчитывают отношение количества мРНК, определенного на стадии (I), к количеству мРНК, определенному на стадии (II). Для этой цели количество мРНК (число копий транскрипта), определенное как указано выше во второй момент времени, делят на количество мРНК (число копий транскрипта), определенное как указано выше в первый момент времени. Использование указанного отношения препятствует тому, что стабильные виды мРНК, которые уже в первый момент времени присутствуют лишь в очень малых количествах, не будут учтены при сравнении с видами мРНК, которые присутствуют в больших количествах.At substage III. step a) calculate the ratio of the amount of mRNA determined in stage (I) to the amount of mRNA determined in stage (II). For this purpose, the mRNA amount (transcript copy number) determined as above at the second time point is divided by the mRNA amount (transcript copy number) determined as above at the first time point. The use of this ratio prevents that stable mRNA species, which are present only in very small amounts already at the first time point, will not be taken into account when compared with mRNA species that are present in large quantities.

На стадии б) отбирают такую мРНК, для которой отношение, рассчитанное на подстадии (III) стадии а), составляет по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%), по меньшей мере 0,9 (90%) или по меньшей мере 0,95 (95%). Такая мРНК рассматривается согласно настоящему изобретению как наиболее стабильная мРНК.In step b), an mRNA is selected for which the ratio calculated in substep (III) of step a) is at least 0.5 (50%), at least 0.6 (60%), at least 0, 7 (70%), at least 0.75 (75%), at least 0.8 (80%), at least 0.85 (85%), at least 0.9 (90%), or at least 0.95 (95%). Such mRNA is considered according to the present invention as the most stable mRNA.

На стадии в) определяют нуклеотидную последовательность 3'- и/или 5'-UTR-элемента указанной мРНК, т.е. мРНК, отобранной на стадии б). Для этой цели можно применять различные методы, известные специалисту в данной области, например, секвенирование или выбор из публично доступных баз данных, таких, например, как NCBI (Национальный центр биотехнологической информации). Например, можно осуществлять поиск последовательности мРНК отобранной на стадии б) мРНК в базе данных и затем можно 3'- и/или 5'-UTR выделять из последовательности мРНК, имеющейся в базе данных.In step c) the nucleotide sequence of the 3'- and/or 5'-UTR element of said mRNA is determined, i. mRNA selected in step b). For this purpose, various methods known to the person skilled in the art can be used, such as sequencing or selection from publicly available databases such as, for example, NCBI (National Center for Biotechnology Information). For example, you can search for the mRNA sequence selected in step b) mRNA in the database and then you can select 3'-and/or 5'-UTR from the mRNA sequence available in the database.

В частности, в описанном выше способе идентификации элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или элемента 5'-нетранслируемой области (5'-UTR-элемента) понятие «мРНК» и/или «стабильная мРНК» соответственно могут относиться также и к видам мРНК, представленным в настоящем описании, и/или к стабильным видам мРНК соответственно.In particular, in the method described above for identifying a 3'-untranslated region element (3'-UTR element) and/or a 5'-untranslated region element (5'-UTR element), the concept of "mRNA" and/or "stable mRNA" respectively, may also refer to the types of mRNA presented in the present description, and/or stable types of mRNA, respectively.

Кроме того, в контексте настоящего описания предпочтительно «стабильная мРНК» может характеризоваться более медленным расщеплением по сравнению со средним расщеплением мРНК, которое предпочтительно оценивают in vivo или in vitro как описано выше. При этом «среднее расщепление мРНК» можно оценивать путем исследования расщепления мРНК для множества видов мРНК.In addition, in the context of the present description, preferably "stable mRNA" may be characterized by slower cleavage compared to the average cleavage of the mRNA, which is preferably assessed in vivo or in vitro as described above. Meanwhile, "average mRNA cleavage" can be assessed by examining mRNA cleavage for a plurality of mRNA species.

Следовательно, другим объектом настоящего изобретения является способ идентификации элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или элемента 5'-нетранслируемой области (5'-UTR-элемента), включающий следующие стадии, на которых:Therefore, another object of the present invention is a method for identifying a 3'-untranslated region element (3'-UTR element) and/or a 5'-untranslated region element (5'-UTR element), comprising the following steps, in which:

а) анализируют стабильность множества видов мРНК, осуществляя следующие подстадии, на которых:a) analyze the stability of multiple types of mRNA, carrying out the following sub-steps, in which:

I. определяют количество каждого вида мРНК из указанного множества видов мРНК в первый момент времени в процессе расщепления указанных видов мРНК,I. determine the amount of each mRNA species from the specified set of mRNA species at the first time point in the process of cleavage of the specified mRNA species,

II. определяют количество каждого вида мРНК из указанного множества видов мРНК во второй времени в процессе расщепления указанных видов мРНК иII. determine the amount of each mRNA species from the specified set of mRNA species in the second time in the process of cleavage of the specified mRNA species and

III. рассчитывают для каждого вида мРНК из указанного множества видов мРНК отношение количества указанного вида мРНК, определенного на стадии (I), к количеству указанного вида мРНК, определенному на стадии (II);III. calculate for each mRNA species from the specified set of mRNA species the ratio of the number of the specified mRNA species, determined in stage (I), to the number of the specified mRNA species, determined in stage (II);

б) ранжируют виды мРНК из множества видов мРНК в зависимости от величины отношения, рассчитанного на подстадии (III) для каждого вида мРНК;b) ranking mRNA species from a plurality of mRNA species depending on the magnitude of the ratio calculated for substep (III) for each mRNA species;

в) отбирают один или большее количество видов мРНК, характеризующихся наибольшей величиной отношения или наибольшими величинами отношения, рассчитанного(ыми) на подстадии (III); иc) selecting one or more mRNA species having the highest ratio or highest ratios calculated in substep (III); and

г) определяют нуклеотидную последовательность 3'- и/или 5'-UTR-элемента указанной мРНК.d) determining the nucleotide sequence of the 3'- and/or 5'-UTR element of said mRNA.

Понятие «виды мРНК» в контексте настоящего описания соответствует геномной транскрипционной единице, т.е. гену. Так, в одном «виде мРНК» могут присутствовать различные транскрипты, например, обусловленные процессингом мРНК. Виды мРНК, например, могут быть представлены в виде пятен на микромассиве. Следовательно, микромассив представляет собой предпочтительный «инструмент» для определения количества множества видов мРНК, например, в определенный момент времени в процессе расщепления мРНК. Однако можно применять также и другие методы, известные специалисту в данной области, например, секвенирование РНК (называемое также секвенированием полного транскриптома по методу дробовика (шотган-секвенирование), что представляет собой технологию, в которой используются возможности секвенирования следующего поколения для выявления на основе моментальных снимков присутствия и количества РНК в геноме в данный момент времени), количественную ПЦР и т.д.The concept of "types of mRNA" in the context of the present description corresponds to the genomic transcription unit, i.e. gene. Thus, in one "type of mRNA" there may be different transcripts, for example, due to the processing of mRNA. mRNA species, for example, can be represented as spots on a microarray. Therefore, the microarray is the preferred "tool" for quantifying multiple mRNA species, for example, at a specific point in time during mRNA cleavage. However, other methods known to one of skill in the art can also be used, such as RNA sequencing (also referred to as shotgun sequencing of the entire transcriptome, which is a technology that uses the power of next-generation sequencing to detect based on instantaneous pictures of the presence and amount of RNA in the genome at a given time), quantitative PCR, etc.

Предпочтительно выражение «множество видов мРНК» относится к по меньшей мере 100, по меньшей мере 300, по меньшей мере 500, по меньшей мере 1000, по меньшей мере 2000, по меньшей мере 3000, по меньшей мере 4000, по меньшей мере 5000, по меньшей мере 6000, по меньшей мере 7000, по меньшей мере 8000, по меньшей мере 9000, по меньшей мере 10000, по меньшей мере 11000, по меньшей мере 12000, по меньшей мере 13000, по меньшей мере 14000, по меньшей мере 15000, по меньшей мере 16000, по меньшей мере 17000, по меньшей мере 18000, по меньшей мере 19000, по меньшей мере 20000, по меньшей мере 21000, по меньшей мере 22000, по меньшей мере 23000, по меньшей мере 24000, по меньшей мере 25000, по меньшей мере 26000, по меньшей мере 27000, по меньшей мере 28000, по меньшей мере 29000, по меньшей мере 30000 видам мРНК. Наиболее предпочтительно оценивать весь транскриптом или максимально возможное количество видов мРНК в транскриптоме. Это можно осуществлять, например, с использованием микромассива, обеспечивающего охват всех транскриптов.Preferably, "multiple mRNA species" refers to at least 100, at least 300, at least 500, at least 1000, at least 2000, at least 3000, at least 4000, at least 5000, at least 6000, at least 7000, at least 8000, at least 9000, at least 10000, at least 11000, at least 12000, at least 13000, at least 14000, at least 15000, at least 16,000, at least 17,000, at least 18,000, at least 19,000, at least 20,000, at least 21,000, at least 22,000, at least 23,000, at least 24,000, at least 25,000, at least 26,000, at least 27,000, at least 28,000, at least 29,000, at least 30,000 mRNA species. It is most preferable to evaluate the entire transcriptome or the maximum possible number of mRNA species in the transcriptome. This can be done, for example, using a microarray that covers all transcripts.

В этом способе стадия а), включая ее подстадии I.-III., практически соответствует стадии а), включая ее подстадии I.-III., описанного ранее способа, предлагаемого в изобретении, но отличается только тем, что количество каждого вида мРНК из множества видов мРНК определяют в первый и второй моменты времени, и тем, что величину отношения рассчитывают для каждого вида мРНК. Следовательно, подробно описанные выше способы и предпочтительные варианты осуществления изобретения применимы также и в данном случае и величину отношения для индивидуальных видов мРНК (и каждый из индивидуальных видов мРНК соответственно) можно определять согласно процедуре, описанной выше для «мРНК».In this method, step a), including its sub-steps I.-III., practically corresponds to step a), including its sub-steps I.-III., of the previously described method of the invention, but differs only in that the amount of each type of mRNA from the plurality of mRNA species are determined at the first and second time points, and that the ratio value is calculated for each mRNA species. Therefore, the methods detailed above and the preferred embodiments of the invention apply here as well, and the ratio value for the individual mRNA species (and each of the individual mRNA species, respectively) can be determined according to the procedure described above for "mRNA".

Однако, в отличие от указанного выше способа стабильность мРНК оценивают не по абсолютной величине отношения, а путем ранжирования видов мРНК из множества видов мРНК, в зависимости от величины отношения, рассчитанного на подстадии (III) стадии а) для каждого из видов мРНК. Затем отбирают на подстадии в) один или большее количество видов мРНК, характеризующихся наибольшей величиной отношения или наибольшими величинами отношения, рассчитанного на подстадии (III) стадии а).However, in contrast to the above method, mRNA stability is assessed not by the absolute value of the ratio, but by ranking mRNA species from a plurality of mRNA species, depending on the ratio value calculated in substep (III) of step a) for each of the mRNA species. Then one or more mRNA species are selected in sub-step c) having the highest ratio or the highest ratio values calculated in sub-step (III) of step a).

В данном контексте наиболее предпочтительно на стадии в) отбирают 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% наиболее стабильных видов мРНК. Альтернативно этому или дополнительно можно отбирать на стадии в) такие виды мРНК, которые характеризуются величиной отношения, рассчитанного на подстадии III. стадии а), которое соответствует по меньшей мере 100% средней величины отношения, рассчитанной для всех проанализированных видов мРНК. Более предпочтительно отбирают такие виды мРНК, которые характеризуются величиной отношения, составляющей меньшей мере 150%, еще более предпочтительно по меньшей мере 200% и наиболее предпочтительно по меньшей мере 300% от средней величины отношения, рассчитанной для всех проанализированных видов мРНК.In this context, most preferably in step c) 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% of the most stable mRNA species. Alternatively, or additionally, mRNA species can be selected in step c) which are characterized by the magnitude of the ratio calculated in substep III. step a), which corresponds to at least 100% of the average ratio calculated for all analyzed mRNA species. More preferably, mRNA species are selected that have a ratio of at least 150%, even more preferably at least 200%, and most preferably at least 300% of the average ratio calculated for all analyzed mRNA species.

На стадии г) определяют нуклеотидную последовательность 3'- и/или 5'-UTR-элемента мРНК, отобранной на стадии в), согласно процедуре, описанной выше для стадии в) описанного ранее способа, предлагаемого в изобретении.In step d), the nucleotide sequence of the 3'- and/or 5'-UTR element of the mRNA selected in step c) is determined according to the procedure described above for step c) of the previously described method of the invention.

Предпочтительно в обоих описанных выше способах идентификации 3'-UTR-элемента и/или 5'-UTR-элемента, предлагаемого в настоящем изобретении, период времени между первым моментом времени и вторым моментом времени составляет по меньшей мере 5 ч, предпочтительно по меньшей мере 6 ч, предпочтительно по меньшей мере 7 ч, более предпочтительно по меньшей мере 8 ч, более предпочтительно по меньшей мере 9 ч, еще более предпочтительно по меньшей мере 10 ч, еще более предпочтительно по меньшей мере 11 ч и наиболее предпочтительно по меньшей мере 12 ч.Preferably, in both of the methods described above for identifying a 3'-UTR element and/or a 5'-UTR element according to the present invention, the time period between the first time point and the second time point is at least 5 hours, preferably at least 6 hours. h, preferably at least 7 h, more preferably at least 8 h, more preferably at least 9 h, even more preferably at least 10 h, even more preferably at least 11 h and most preferably at least 12 h .

Предпочтительно в обоих описанных выше способах идентификации 3'-UTR-элемента и/или 5'-UTR-элемента, предлагаемого в настоящем изобретении, стабильность мРНК анализируют с помощью импульсного мечения, предпочтительно с использованием методологии вытеснения метки.Preferably, in both of the methods described above for identifying a 3'UTR element and/or a 5'UTR element according to the present invention, mRNA stability is analyzed by pulse labeling, preferably using label displacement methodology.

Способ идентификации элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или элемента 5'-нетранслируемой области (5'-UTR-элемента)Method for identifying an element of a 3'-untranslated region (3'-UTR element) and/or an element of a 5'-untranslated region (5'-UTR element)

Другим объектом настоящего изобретения является также способ идентификации элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или элемента 5'-нетранслируемой области (5'-UTR-элемента), который обеспечивает высокую эффективность трансляции искусственной молекулы нуклеиновой кислоты, включающий следующие стадии, на которых:Another object of the present invention is also a method for identifying a 3'-untranslated region element (3'-UTR element) and/or a 5'-untranslated region element (5'-UTR element), which provides high translation efficiency of an artificial nucleic acid molecule, including the following steps:

а) идентифицируют 3'-UTR-элемент и/или 5'-UTR-элемент, полученный из стабильной мРНК, с помощью способа идентификации 3'-UTR-элемента и/или 5'-UTR-элемента, соответствующего одному из способов, которые описаны выше;a) identifying a 3'-UTR element and/or a 5'-UTR element derived from a stable mRNA using a method for identifying a 3'-UTR element and/or a 5'-UTR element corresponding to one of the methods that described above;

б) синтезируют искусственную молекулу нуклеиновой кислоты, содержащую по меньшей мере одну открытую рамку считывания и по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент, который соответствует или содержится в 3'-UTR-элементе и/или 5'-UTR-элементе, идентифицированном на стадии а);b) synthesize an artificial nucleic acid molecule containing at least one open reading frame and at least one 3'-UTR element and/or at least one 5'-UTR element that corresponds to or is contained in the 3'-UTR element and/or 5'-UTR element identified in step a);

в) анализируют экспрессию белка, кодируемого по меньшей мере одной открытой рамкой считывания (ОРС) искусственной молекулы нуклеиновой кислоты, синтезированной на стадии б);c) analyzing the expression of a protein encoded by at least one open reading frame (ORF) of the artificial nucleic acid molecule synthesized in step b);

г) анализируют экспрессию белка, кодируемого по меньшей мере одной открытой рамкой считывания (ОРС) искусственной референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR-элемент и/или 5'-UTR-элемент;d) analyzing the expression of a protein encoded by at least one open reading frame (ORF) of an artificial reference nucleic acid molecule lacking a 3'-UTR element and/or a 5'-UTR element;

д) сравнивают экспрессию белка с искусственной молекулы нуклеиновой кислоты, проанализированной на стадии в), с экспрессией белка с искусственной референс-молекулы нуклеиновой кислоты, проанализированной на стадии г); иe) comparing the expression of the protein from the artificial nucleic acid molecule analyzed in step c) with the expression of the protein from the artificial reference nucleic acid molecule analyzed in step d); and

е) отбирают 3'-UTR-элемент и/или 5'-UTR-элемент, если экспрессия белка с искусственной молекулы нуклеиновой кислоты, проанализированной на стадии в), пролонгирована и/или повышена по сравнению с экспрессией белка с искусственной референс-молекулы нуклеиновой кислоты, проанализированной на стадии г).e) selecting a 3'-UTR element and/or a 5'-UTR element if the expression of the protein from the artificial nucleic acid molecule analyzed in step c) is prolonged and/or increased compared to the expression of the protein from the artificial nucleic acid reference molecule acid analyzed in step d).

В этом способе первый 3'-UTR-элемент и/или 5'-UTR-элемент идентифицируют с помощью описанного выше способа, предлагаемого в настоящем изобретении. Это позволяет осуществлять синтез 3'- и/или 5'-UTR-элемента с помощью методов, известных специалисту в данной области, например, с помощью ПЦР-амплификации. Праймеры, применяемые для такой ПЦР, предпочтительно могут содержать сайты рестрикции для клонирования. Альтернативно этому 3'- и/или 5'-UTR-элемент можно синтезировать, например, с помощью химического синтеза или отжига олигонуклеотидов. Таким образом, на стадии б) синтезируют искусственную молекулу нуклеиновой кислоты, содержащую по меньшей мере одну открытую рамку считывания и по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент, который соответствует или содержится в 3'-UTR-элементе и/или 5'-UTR-элементе, идентифицированном на стадии а). В частности, по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент, как правило, объединяют с открытой рамкой считывания, что приводит к получению искусственной нуклеиновой кислоты, содержащей 3'- и/или 5'-UTR-элемент, предлагаемый в настоящем изобретении, если 3'- и/или 5'-UTR-элемент удовлетворяют(ет) соответствующим требованиям, а именно, если они пролонгируют и/или повышают экспрессию белка. Для тестирования этого 3'-и/или 5'-UTR-элемент, идентифицированный на стадии а), или ПЦР-фрагмент или синтезированную последовательность соответственно можно клонировать в конкретном векторе, предпочтительно в экспрессионном векторе, для оценки экспрессии белка с соответствующей ОРС.In this method, the first 3'-UTR element and/or 5'-UTR element is identified using the method described above, proposed in the present invention. This allows the synthesis of the 3'- and/or 5'-UTR element using methods known to the person skilled in the art, for example, using PCR amplification. The primers used for such PCR may preferably contain restriction sites for cloning. Alternatively, the 3'- and/or 5'-UTR element can be synthesized, for example, by chemical synthesis or oligonucleotide annealing. Thus, in step b), an artificial nucleic acid molecule is synthesized containing at least one open reading frame and at least one 3'-UTR element and/or at least one 5'-UTR element that corresponds to or is contained in in the 3'-UTR element and/or 5'-UTR element identified in step a). In particular, at least one 3'-UTR element and/or at least one 5'-UTR element is typically combined with an open reading frame, resulting in an artificial nucleic acid containing 3'- and/ or a 5'-UTR element according to the invention, if the 3'- and/or 5'-UTR element satisfies the relevant requirements, namely, if they prolong and/or increase protein expression. To test this, the 3' and/or 5' UTR element identified in step a) or the PCR fragment or synthesized sequence, respectively, can be cloned into a particular vector, preferably an expression vector, to assess the expression of the protein with the corresponding ORF.

Затем, как описано выше, на стадии в) оценивают экспрессию белка с искусственной молекулы нуклеиновой кислоты, содержащей по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент, и сравнивают с оцененной на стадии г), экспрессией белка с соответствующей искусственной референс-молекулы нуклеиновой кислоты, которая не содержит 3'-UTR-элемент и/или 5'-UTR-элемент, как описано на стадии д).Then, as described above, in step c), protein expression from an artificial nucleic acid molecule containing at least one 3'-UTR element and/or at least one 5'-UTR element is evaluated and compared with that evaluated in step d) expression of a protein from a corresponding artificial reference nucleic acid molecule that does not contain a 3'-UTR element and/or a 5'-UTR element, as described in step e).

После этого на стадии е) отбирают такой 3'-UTR-элемент и/или 5'-UTR-элемент, который повышает экспрессию белка с искусственной молекулы нуклеиновой кислоты, проанализированной на стадии в), по сравнению с экспрессией белка с искусственной референс-молекулы нуклеиновой кислоты, проанализированной на стадии г). Сравнение экспрессии белка с предлагаемой в изобретении молекулы нуклеиновой кислоты с экспрессией белка с референс-молекулы нуклеиновой кислоты осуществляют согласно процедуре, представленной в настоящем описании, прежде всего в контексте предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты.Thereafter, in step e), a 3'-UTR element and/or a 5'-UTR element is selected that increases the expression of the protein from the artificial nucleic acid molecule analyzed in step c) as compared to the expression of the protein from the artificial reference molecule. nucleic acid analyzed in step d). Comparison of protein expression from the inventive nucleic acid molecule with protein expression from the reference nucleic acid molecule is carried out according to the procedure presented in the present description, primarily in the context of the artificial nucleic acid molecule of the invention.

Кроме того, в настоящем изобретении предложен наиболее предпочтительный способ идентификации элемента 3'-нетранслируемой области (3'-UTR-элемента) и/или элемента 5'-нетранслируемой области (5'-UTR-элемента), который обеспечивает высокую эффективность трансляции искусственной молекулы нуклеиновой кислоты, включающий следующие стадии, на которых:In addition, the present invention proposes the most preferred method for identifying a 3'-untranslated region element (3'-UTR element) and/or a 5'-untranslated region element (5'-UTR element), which provides high translation efficiency of the artificial molecule nucleic acid, including the following stages, in which:

а) подпитывают/инкубируют клетки с меченым нуклеотидом для его включения в новые транскрибированные молекулы РНК (мечение с вытеснением метки);a) cells are fed/incubated with the labeled nucleotide for its incorporation into new transcribed RNA molecules (labeling with label displacement);

б) выделяют общую РНК из клеток в первый момент времени и по меньшей мере в один второй более поздний момент времени;b) separating total RNA from the cells at a first time point and at least one second later time point;

в) экстрагируют меченые молекулы РНК из общей РНК, выделенной на стадии б);c) extract the labeled RNA molecules from the total RNA isolated in step b);

г) измеряют количество/число копий транскрипта различных видов мРНК, присутствующих в меченой РНК;d) measuring the number/number of copies of the transcript of the various types of mRNA present in the labeled RNA;

д) рассчитывают отношение количества/числа копий транскрипта видов мРНК, присутствующих по меньшей мере в один второй более поздний момент времени, к количеству/числу копий транскрипта видов мРНК, присутствующих в первый момент времени;e) calculate the ratio of the number/number of copies of the mRNA species transcript present at least one second later time point to the number/number of copies of the mRNA species transcript present at the first time point;

е) ранжируют виды мРНК в зависимости от величины отношения, определенного на стадии д);e) ranking the types of mRNA depending on the value of the ratio determined in step e);

ж) отбирают наиболее стабильные виды мРНК;g) selecting the most stable types of mRNA;

з) определяют нуклеотидную последовательность 3'- и/или 5'-UTR наиболее стабильных видов мРНК, отобранных на стадии ж);h) determining the nucleotide sequence of the 3'- and/or 5'-UTR of the most stable mRNA species selected in step g);

и) синтезируют 3'- и/или 5'-UTR-элемент, содержащийся в 3'- и/или 5'-UTR, определенной на стадии з);i) synthesizing the 3'- and/or 5'-UTR element contained in the 3'- and/or 5'-UTR determined in step h);

к) комбинируют 3'- и/или 5'-UTR-элемент, синтезированный на стадии и), с открытой рамкой считывания с получением предлагаемой в изобретении нуклеиновой кислоты, указанной в настоящем описании; иj) combining the 3'- and/or 5'-UTR element synthesized in step i) with an open reading frame to produce the nucleic acid of the invention as described herein; and

л) необязательно сравнивают экспрессию открытой рамки считывания, присутствующей в предлагаемой в изобретении нуклеиновой кислоте, с экспрессией открытой рамки считывания, присутствующей в нуклеиновой референс-кислоте, не содержащей 3'- и/или 5'-UTR-элемент, указанный в настоящем описании.k) optionally comparing the expression of an open reading frame present in the nucleic acid of the invention with the expression of an open reading frame present in a reference nucleic acid lacking the 3' and/or 5' UTR element described herein.

При этом подробное описание и предпочтительные варианты осуществления изобретения, представленные выше для предлагаемых в изобретении способов, можно применять и в данном случае с учетом соответствующих ограничений, указанных для стадий а)-л).In this case, the detailed description and preferred embodiments of the invention presented above for the methods proposed in the invention can be applied in this case, subject to the appropriate restrictions indicated for stages a)-l).

В частности, для подпитки на стадии а) предлагаемого в изобретении способа предпочтительно применяют следующие меченые нуклеотиды: 4-тиоуридин (4sU), 2-тиоуридин, 6-тиогуанозин, 5-этинилуридин (EU), 5-бромуридин (BrU), биотин-16-аминоаллилуридин, 5-аминоаллилуридин, 5-аминоаллилцитидин и т.д. Наиболее предпочтительным является 4-тиоуридин (4sU). 4-тиоуридин предпочтительно применяют в концентрации 100-500 мкМ. В альтернативном варианте можно применять радиоактивно меченые нуклеотиды, например, уридин-3Н. Можно применять комбинации указанных выше меченых нуклеотидов. Наиболее предпочтительной является комбинация 4-тиоуридина и 6-тиогуанозина.In particular, the following labeled nucleotides are preferably used for feeding in step a) of the method according to the invention: 4-thiouridine (4sU), 2-thiouridine, 6-thioguanosine, 5-ethynyluridine (EU), 16-aminoallyluridine, 5-aminoallyluridine, 5-aminoallylcytidine, etc. Most preferred is 4-thiouridine (4sU). 4-thiouridine is preferably used at a concentration of 100-500 μM. Alternatively, radioactively labeled nucleotides, for example uridine- 3H , may be used. Combinations of the above labeled nucleotides may be used. Most preferred is a combination of 4-thiouridine and 6-thioguanosine.

Инкубацию клеток с меченым нуклеотидом на стадии а) можно варьировать. Наиболее предпочтительно продолжительность инкубации (время подпитки) составляет от 10 мин до 24 ч. Наиболее предпочтительным является период времени от 2 до 6 ч, более предпочтительно от 2 до 3 ч.The incubation of cells with the labeled nucleotide in step a) can be varied. Most preferably, the duration of incubation (feeding time) is from 10 minutes to 24 hours. The most preferred time period is from 2 to 6 hours, more preferably from 2 to 3 hours.

Клетки, которые можно применять в способе, предлагаемом в изобретении, включают, в частности, клеточные линии, первичные клетки, клетки в ткани или организме индивидуумов. В конкретных вариантах осуществления изобретения пригодными для применения согласно настоящему изобретению могут быть типы клеток, позволяющие осуществлять культивирование клеток. Наиболее предпочтительными являются клетки млекопитающих, например, человеческие клетки и мышиные клетки. В наиболее предпочтительных вариантах осуществления изобретения применяют человеческие клеточные линии HeLa, HEPG2 и U-937 и мышиные клеточные линии NIH3T3, JAWSII L929. Кроме того, наиболее пригодными являются первичные клетки, в наиболее предпочтительных вариантах осуществления изобретения можно применять человеческие кожные фибробласты (HDF). В альтернативном варианте мечеными нуклеотидами можно обрабатывать также ткань индивидуума и после периода инкубации выделять РНК из ткани согласно стадии в).Cells that can be used in the method of the invention include, in particular, cell lines, primary cells, cells in a tissue or an individual's body. In specific embodiments of the invention suitable for use according to the present invention may be cell types that allow the cultivation of cells. Most preferred are mammalian cells, eg human cells and mouse cells. In the most preferred embodiments of the invention, human cell lines HeLa, HEPG2 and U-937 and mouse cell lines NIH3T3, JAWSII L929 are used. In addition, primary cells are most suitable, in the most preferred embodiments of the invention, human dermal fibroblasts (HDF) can be used. Alternatively, the individual's tissue can also be treated with labeled nucleotides and, after an incubation period, RNA can be isolated from the tissue according to step c).

Для определения наиболее стабильных мРНК в клетке (типе) общую РНК экстрагируют в первый момент времени, указанный выше, например, через 0-6 ч после мечения, предпочтительно через 3 ч после мечения, и во второй более поздний момент времени, указанный выше, например, через 3-48 ч после мечения, предпочтительно через 10-24 ч, наиболее предпочтительно через 15 ч после мечения. Второй более поздний момент времени наступает по меньшей мере через 10 мин после первого момента времени.To determine the most stable mRNAs in a cell (type), total RNA is extracted at the first time point above, e.g. 0-6 hours after labeling, preferably 3 hours after labeling, and at the second later time point above, , 3-48 hours after labeling, preferably 10-24 hours, most preferably 15 hours after labeling. The second later time occurs at least 10 minutes after the first time.

На стадии е) виды мРНК ранжируют в зависимости от величины отношения, рассчитанного на стадии д). В этом контексте наиболее предпочтительно отбирают 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% наиболее стабильных видов мРНК.In step e), mRNA species are ranked according to the ratio calculated in step e). In this context, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9% are most preferably selected. , 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% of the most stable mRNA species.

В этом контексте предпочтительно также отбирают такие виды мРНК, для которых число копий транскрипта/количество видов мРНК во второй более поздний момент времени по сравнению с первым моментом времени составляет по меньшей мере 50% (0,5-кратное), по меньшей мере 60% (0,6-кратное), по меньшей мере 70% (0,7-кратное), по меньшей мере 90% (0,9-кратное) или по меньшей мере 95% (0,95-кратное). Этот вариант осуществления изобретения является наиболее предпочтительным, если РНК выделяют через 3 ч (первый момент времени) и через 15 ч (второй момент времени) после мечения.In this context, it is also preferable to select such mRNA species for which the number of transcript copies/number of mRNA species at the second later time point compared to the first time point is at least 50% (0.5-fold), at least 60% (0.6-fold), at least 70% (0.7-fold), at least 90% (0.9-fold) or at least 95% (0.95-fold). This embodiment of the invention is most preferred if the RNA is recovered 3 hours (first time point) and 15 hours (second time point) after labeling.

В альтернативном варианте или дополнительно отбирают такие виды мРНК, которые характеризуются величиной отношения, рассчитанного на стадии д), соответствующего по меньшей мере 100% средней величины отношения, рассчитанной для всех проанализированных видов мРНК. Более предпочтительно отбирают такие виды мРНК, которые характеризуются величиной отношения, составляющей по меньшей мере 150% и более предпочтительно по меньшей мере 200%, и наиболее предпочтительно по меньшей мере 300% средней величины отношения, рассчитанной для всех проанализированных видов мРНК.Alternatively or additionally, mRNA species are selected that have a ratio calculated in step e) corresponding to at least 100% of the average ratio calculated for all analyzed mRNA species. More preferably, mRNA species are selected that have a ratio of at least 150% and more preferably at least 200%, and most preferably at least 300% of the average ratio calculated for all analyzed mRNA species.

На следующей стадии предлагаемого в изобретении способа определяют нуклеотидную последовательность 3'- и/или 5'-UTR наиболее стабильных видов мРНК, отобранных на стадии ж), и на стадии и) синтезируют 3'- и/или 5'-UTR-элемент, например, с помощью ПЦР-амплификации. Праймеры, применяемые для ПЦР, предпочтительно могут содержать сайты рестрикции для клонирования. Альтернативно этому можно синтезировать 3'- и/или 5'-UTR-элемент (например, путем химического синтеза или отжига олигонуклеотидов).In the next step of the method according to the invention, the nucleotide sequence of the 3'- and/or 5'-UTR of the most stable mRNA species selected in step g) is determined, and the 3'- and/or 5'-UTR element is synthesized in step i), for example, using PCR amplification. Primers used for PCR may preferably contain restriction sites for cloning. Alternatively, the 3' and/or 5' UTR element can be synthesized (eg by chemical synthesis or oligonucleotide annealing).

На стадии к) предлагаемого в изобретении способа комбинируют ПЦР-фрагмент или синтезированную последовательность с открытой рамкой считывания, получая искусственную нуклеиновую кислоту, содержащую 3'-и/или 5'-UTR-элемент, предлагаемый в изобретении. Предпочтительно ПЦР-фрагмент или последовательность можно клонировать в векторе.In step j) of the method of the invention, the PCR fragment or synthesized sequence is combined with an open reading frame to produce an artificial nucleic acid containing the 3' and/or 5' UTR element of the invention. Preferably, the PCR fragment or sequence can be cloned into a vector.

Наиболее предпочтительный вариант осуществления изобретения относится к включающему стадии а)-л) способу идентификации элементов 3'-нетранслируемой области (3'-UTR-элементов) и/или элементов 5'-нетранслируемой области (5'-UTR-элементов), где 3'-UTR-элементы и/или 5'-UTR-элементы пролонгируют производство белка с искусственной молекулы нуклеиновой кислоты, содержащей по меньшей мере один из 3'-UTR-элементов и/или по меньшей мере один из 5'-UTR-элементов.The most preferred embodiment of the invention relates to a method comprising steps a) to l) for identifying elements of the 3'-untranslated region (3'-UTR elements) and/or elements of the 5'-untranslated region (5'-UTR elements), where 3 '-UTR elements and/or 5'-UTR elements prolong protein production from an artificial nucleic acid molecule containing at least one of the 3'-UTR elements and/or at least one of the 5'-UTR elements.

Следующий объект настоящего изобретения относится также к способу создания искусственной молекулы нуклеиновой кислоты, в котором синтезируют искусственную молекулу нуклеиновой кислоты, содержащую по меньшей мере одну открытую рамку считывания и по меньшей мере один 3'-UTR-элемент и/или по меньшей мере один 5'-UTR-элемент, идентифицированный с помощью предлагаемого в настоящем изобретении способа идентификации 3'-UTR-элемента и/или 5'-UTR-элемента, указанного в настоящем описании. Синтез искусственной молекулы нуклеиновой кислоты, как правило, осуществляют с помощью методов, известных специалисту в данной области, например, методов клонирования, например, общеизвестных методов или представленных в настоящем описании.Another object of the present invention also relates to a method for creating an artificial nucleic acid molecule, in which an artificial nucleic acid molecule is synthesized containing at least one open reading frame and at least one 3'-UTR element and/or at least one 5' -UTR element identified using the proposed method of the present invention to identify the 3'-UTR element and/or 5'-UTR element specified in the present description. The synthesis of an artificial nucleic acid molecule is generally carried out using methods known to the person skilled in the art, for example, cloning methods, for example, well-known methods or presented in the present description.

Предпочтительно вектор, предлагаемый в настоящем изобретении, который представлен в настоящем описании, применяют в таком предлагаемом в изобретении способе создания искусственной молекулы нуклеиновой кислоты.Preferably, the vector of the present invention as described herein is used in such an inventive method for generating an artificial nucleic acid molecule.

Предпочтительно искусственная молекула нуклеиновой кислоты, созданная с помощью такого способа получения искусственной молекулы нуклеиновой кислоты, представляет собой предлагаемую в настоящем изобретении молекулу нуклеиновой кислоты, указанную в настоящем описании.Preferably, the artificial nucleic acid molecule produced by such a method for producing an artificial nucleic acid molecule is the nucleic acid molecule of the present invention as described herein.

Кроме того, в настоящем изобретении предложена также искусственная молекула нуклеиновой кислоты, которую можно получать с помощью предлагаемого в настоящем изобретении способа создания искусственной молекулы нуклеиновой кислоты, представленного в настоящем описании.In addition, the present invention also provides an artificial nucleic acid molecule, which can be obtained using the method proposed in the present invention for creating an artificial nucleic acid molecule presented in the present description.

Представленные ниже чертежи, последовательности и примеры предназначены для дополнительной иллюстрации изобретения. Они не направлены на ограничение сущности изобретения.The following drawings, sequences and examples are intended to further illustrate the invention. They are not intended to limit the essence of the invention.

На чертежах показано:The drawings show:

на фиг. 1 - последовательности, кодирующие мРНК (т.е. искусственные молекулы нуклеиновой кислоты), которые можно получать путем транскрипции in vitro;in fig. 1 - sequences encoding mRNA (ie artificial nucleic acid molecules), which can be obtained by transcription in vitro;

Используются следующие сокращения:The following abbreviations are used:

• PpLuc (GC): последовательность мРНК с высоким содержанием GC (GC-обогащенная), кодирующая люциферазу Photinus pyralis; ОРС PpLuc (GC) выделена курсивом;• PpLuc (GC): high GC (GC-rich) mRNA sequence encoding Photinus pyralis luciferase; ORF PpLuc (GC) is in italics;

• А64: поли(А)-последовательность, содержащая 64 аденилата;• A64: poly(A) sequence containing 64 adenylates;

• С30: поли(С)-последовательность, содержащая 30 цитидилатов;• C30: poly(C) sequence containing 30 cytidylates;

• hSL: последовательность гистоновой структуры типа «стебель-петля», взятая из публикации Cakmakci, Lerner, Wagner, Zheng и William F. Marzluff, Mol. Cell. Biol. 28(3), 2008, cc. 1182-1194;• hSL: histone stem-loop sequence taken from Cakmakci, Lerner, Wagner, Zheng and William F. Marzluff, Mol. cell. Biol. 28(3), 2008, pp. 1182-1194;

• 32L4: искусственный вариант 5'-нетранслируемой области 5'-UTR человеческого рибосомального белка большой субъединицы 32, в которой отсутствует 5'-концевой олигопиримидиновый тракт. 5'-UTR получают из человеческого рибосомального белка большой субъединицы 32, в которой отсутствует 5'-концевой олигопиримидиновый тракт;• 32L4: An artificial variant of the 5'-untranslated region of the 5'-UTR of the human ribosomal large subunit protein 32, which lacks the 5'-oligopyrimidine tract. The 5'-UTR is derived from the human 32 ribosomal large subunit protein, which lacks the 5'-oligopyrimidine tract;

• альбумин7: искусственный вариант 3'-нетранслируемой области (3'-UTR) человеческого альбумина, содержащий три единичные точечные мутации, интродуцированные для того, чтобы удалить сигнал терминации Т7, а также сайты рестрикции HindIII и XbaI.• albumin7: an artificial variant of the 3'-untranslated region (3'-UTR) of human albumin containing three single point mutations introduced to remove the T7 termination signal, as well as the HindIII and XbaI restriction sites.

на фиг. 1А - референс-конструкция, SEQ ID NO: 205, т.е. последовательность мРНК 32L4 - PpLuc(GC) - альбумин7 - А64 - С30 - hSL (R3111);in fig. 1A - reference construct, SEQ ID NO: 205, i.e. mRNA sequence 32L4 - PpLuc(GC) - albumin7 - A64 - C30 - hSL (R3111);

Описание UTR-элементов человеческого происхождения, которые подвергали экспериментальному тестированию, представлено в таблице 3. Описание UTR-элементов мышиного происхождения, которые подвергали экспериментальному тестированию, представлено в таблице 4;A description of the human-derived UTR elements that were experimentally tested is shown in Table 3. A description of the mouse-derived UTR elements that were experimentally tested is shown in Table 4;

На фиг. 1Б - Искусственная нуклеиновая кислота (SEQ ID NO: 210), указанная искусственная нуклеиновая кислота содержит протестированную 5'-UTR, соответствующую SEQ ID NO: 1 (подчеркнута одной линией). Все элементы последовательности, представленной на данном чертеже, за исключением подчеркнутого одной линией элемента, идентичны SEQ ID NO: 205. Таким образом, SEQ ID NO: 210 отличается от SEQ ID NO: 205 тем, что содержит другой 5'-UTR-элемент.In FIG. 1B - Artificial nucleic acid (SEQ ID NO: 210), said artificial nucleic acid contains the tested 5'-UTR corresponding to SEQ ID NO: 1 (underlined by one line). All elements of the sequence shown in this drawing, with the exception of the one-underlined element, are identical to SEQ ID NO: 205. Thus, SEQ ID NO: 210 differs from SEQ ID NO: 205 in that it contains a different 5'-UTR element.

[5'-UTR, соответствующая SEQ ID NO: 1] - PpLuc(GC) - альбумин7 - А64 - С30 - hSL;[5'-UTR corresponding to SEQ ID NO: 1] - PpLuc(GC) - albumin7 - A64 - C30 - hSL;

На фиг. 1В - Искусственная нуклеиновая кислота (SEQ ID NO: 211), указанная искусственная нуклеиновая кислота содержит протестированную 3'-UTR, соответствующую SEQ ID NO: 152 (подчеркнута двойной линией). Все элементы последовательности, представленной на данном чертеже, за исключением подчеркнутого двойной линией элемента, идентичны SEQ ID NO: 205. Таким образом, SEQ ID NO: 211 отличается от SEQ ID NO: 205 тем, что содержит другой 3'-UTR-элемент.In FIG. 1B - Artificial nucleic acid (SEQ ID NO: 211), said artificial nucleic acid contains the tested 3'-UTR corresponding to SEQ ID NO: 152 (double underlined). All elements of the sequence shown in this figure, with the exception of the double-underlined element, are identical to SEQ ID NO: 205. Thus, SEQ ID NO: 211 differs from SEQ ID NO: 205 in that it contains a different 3'-UTR element.

32L4 - PpLuc(GC) - [3'-UTR, соответствующая SEQ ID NO: 152] - А64 - С30 -hSL;32L4 - PpLuc(GC) - [3'-UTR corresponding to SEQ ID NO: 152] - A64 - C30 -hSL;

На фиг. 2-9 - средние уровни экспрессии люциферазы и SEM для мРНК, которые анализировали в трех повторностях; т.е. относительные уровни экспрессии PpLuc, стандартизованные относительно RrLuc (представлены средние значения по трем независимым экспериментам и стандартная ошибка среднего (SEM)). Исследовали влияние 5'-UTR-элементов и 3'-UTR-элементов человеческого происхождения (таблица 3) и 5'-UTR-элементов и 3'-UTR-элементов мышиного происхождения (таблица 4) на экспрессию люциферазы с мРНК в сравнении с экспрессией люциферазы с мРНК, представленной на фиг. 1 (референс-конструкция). Данные о конструкциях, содержащих протестированные 5'-UTR-элементы и 3'-UTR-элементы, описанные в таблицах 3 и 4, представлены в примере 3, прежде всего в разделах 3.3 и 3.4. Для этой цели линии клеток, указанные на чертежах, трансфектировали различными мРНК посредством липофекции (фиг. 2: клетки HDF трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы человеческого происхождения, указанными в таблице 3; на фиг. 3: клетки HDF трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы мышиного происхождения, указанными в таблице 4; на фиг. 4: клетки L929 трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы человеческого происхождения, указанными в таблице 3; на фиг. 5: клетки L929 трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы мышиного происхождения, указанными в таблице 4; на фиг. 6: клетки HEPG2 трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы человеческого происхождения, указанными в таблице 3; на фиг. 7: клетки HEPG2 трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы мышиного происхождения, указанными в таблице 4; на фиг. 8: клетки HeLa трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы человеческого происхождения, указанными в таблице 3; на фиг. 9: клетки HeLa трансфектировали мРНК, имеющими 5'-UTR-элементы и 3'-UTR-элементы мышиного происхождения, указанными в таблице 4). Более подробные сведения представлены в примере 3, прежде всего в разделе 3.5. На каждой из фиг. 2-9 представлены 96 столбиков, соответствующих 96 лункам в анализе, описанном в примере 3. На фиг. 2-9 96 столбиков расположены друг за другом в следующем порядке A1, B1, C1, D1, […], F12, G12, Н12.In FIG. 2-9 - average levels of expression of luciferase and SEM for mRNA, which were analyzed in triplicate; those. relative levels of PpLuc expression standardized against RrLuc (mean values from three independent experiments and standard error of the mean (SEM) are shown). The influence of 5'-UTR elements and 3'-UTR elements of human origin (Table 3) and 5'-UTR elements and 3'-UTR elements of mouse origin (Table 4) on the expression of luciferase with mRNA was studied in comparison with the expression luciferase with mRNA shown in Fig. 1 (reference design). Data on constructs containing the tested 5'-UTR elements and 3'-UTR elements described in tables 3 and 4 are presented in example 3, especially in sections 3.3 and 3.4. For this purpose, the cell lines indicated in the drawings were transfected with various mRNAs by lipofection (Fig. 2: HDF cells were transfected with mRNAs having 5'-UTR elements and 3'-UTR elements of human origin indicated in Table 3; in Fig. Fig. 3: HDF cells were transfected with mRNA having 5'-UTR elements and 3'-UTR elements of mouse origin shown in Table 4. Fig. 4: L929 cells were transfected with mRNA having 5'-UTR elements and 3'- Human origin UTR elements shown in Table 3. Figure 5: L929 cells transfected with mRNA having 5'-UTR elements and murine 3'-UTR elements shown in Table 4. Figure 6: HEPG2 cells mRNA having 5'-UTR elements and 3'-UTR elements of human origin are transfected in Fig. 7: HEPG2 cells are transfected with mRNA having 5'-UTR elements and 3'-UTR elements of mouse origin indicated in Table 4. Fig. 8: HeLa cells were transfected with mRNA having 5'- UTR elements and 3'-UTR elements of human origin listed in Table 3; in fig. 9: HeLa cells were transfected with mRNA having 5'-UTR elements and 3'-UTR elements of murine origin shown in Table 4). More details are provided in example 3, especially in section 3.5. On each of the FIGS. 2-9 show 96 bars corresponding to 96 wells in the assay described in Example 3. FIG. 2-9 96 columns are located one after another in the following order A1, B1, C1, D1, […], F12, G12, H12.

RLU = относительные световые единицы (используются при измерении люциферазной активности).RLU = relative light units (used when measuring luciferase activity).

ПримерыExamples

Пример 1: UTR-элементы - кандидатыExample 1: Candidate UTR Elements

Экспрессию мРНК в человеческих и мышиных клетках оценивали экспериментально. Это позволило идентифицировать мРНК, которые экспрессировались в соответствующих клетках. Нуклеотидную последовательность 5'- и/или 3'-UTR видов мРНК определяли путем поиска в базе данных, проверяли и корректировали на основе полученных путем высокопроизводительного секвенирования данных о клеточных транскриптомах, и амплифицировали с помощью ПЦР или синтезировали с помощью отжига олигонуклеотидов.mRNA expression in human and mouse cells was evaluated experimentally. This made it possible to identify the mRNAs that were expressed in the respective cells. The nucleotide sequence of the 5'- and/or 3'-UTR of the mRNA species was determined by database searching, checked and corrected based on cell transcriptome data obtained by high-throughput sequencing, and amplified by PCR or synthesized by oligonucleotide annealing.

Поскольку идентифицированные мРНК происходят из их нативного клеточного окружения, то эти мРНК рассматривались в качестве мРНК дикого типа:Since the identified mRNAs originate from their native cellular environment, these mRNAs were considered as wild-type mRNAs:

SEQ ID NO: 1-72 соответствуют человеческим 5'-UTR-элементам дикого типа;SEQ ID NOs: 1-72 correspond to wild-type human 5'UTR elements;

SEQ ID NO: 73-136 соответствуют мышиным 5'-UTR-элементам дикого типа;SEQ ID NO: 73-136 correspond to wild-type murine 5'UTR elements;

SEQ ID NO: 152-173 соответствуют человеческим 3'-UTR-элементам дикого типа;SEQ ID NOs: 152-173 correspond to wild-type human 3'UTR elements;

SEQ ID NO: 174-203 соответствуют мышиным 3'-UTR-элементам дикого типа.SEQ ID NO: 174-203 correspond to wild-type murine 3'UTR elements.

Хотя несколько из этих UTR-элементов являлись известными (например, они присутствуют в их окружении дикого типа), данный подход позволил идентифицировать также новые 5'-UTR-элементы и новые 3'-UTR-элементы, т.е. 5'-UTR-элементы и 3'-UTR-элементы, которые, как было установлено при создании изобретения, экспрессируются в человеческих клетках и мышиных клетках соответственно, но которые не были известны из публичных баз данных (NCBI):Although several of these UTR elements were known (for example, they are present in their wild-type environment), this approach also allowed the identification of new 5'-UTR elements and new 3'-UTR elements, i.e. 5'-UTR elements and 3'-UTR elements that were found at the time of the invention to be expressed in human cells and mouse cells, respectively, but which were not known from public databases (NCBI):

В частности, в группе, состоящей из человеческих 5'-UTR-элементов, имеющих SEQ ID NO: 1-72, следующие 5'-UTR-элементы дикого типа отличаются от 5'-UTR-элементов, известных из публичных баз данных (NCBI): SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49.In particular, in the group consisting of human 5'-UTR elements having SEQ ID NO: 1-72, the following wild-type 5'-UTR elements differ from the 5'-UTR elements known from public databases (NCBI ): SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49.

В группе, состоящей из мышиных 5'-UTR-элементов, имеющих SEQ ID NO: 73-136, следующие 5'-UTR-элементы дикого типа отличаются от 5'-UTR-элементов, известных из публичных баз данных (NCBI): SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135.In the group consisting of mouse 5'-UTR elements having SEQ ID NO: 73-136, the following wild-type 5'-UTR elements differ from the 5'-UTR elements known from public databases (NCBI): SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO : 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135.

В группе, состоящей из мышиных 3'-UTR-элементов, имеющих SEQ ID NO: 174-203, следующие 3'-UTR-элементы дикого типа отличаются от 3'-UTR-элементов, известных из публичных баз данных (NCBI): SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200.In the group consisting of mouse 3'-UTR elements having SEQ ID NO: 174-203, the following wild-type 3'-UTR elements differ from 3'-UTR elements known from public databases (NCBI): SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200.

Отличия новых идентифицированных 5'-UTR-элементов и новых идентифицированных 3'-UTR-элементов от известных 5'-UTR-элементов и известных 3'-UTR-элементов соответственно представлены в таблицах 1 и 2. В частности, эти новые идентифицированные элементы не были ранее описаны в качестве 3'-UTR-элементов или 5'-UTR-элементов соответственно.The differences between the newly identified 5'UTR elements and the newly identified 3'UTR elements from the known 5'UTR elements and the known 3'UTR elements, respectively, are shown in Tables 1 and 2. In particular, these newly identified elements do not have been previously described as 3'-UTR elements or 5'-UTR elements, respectively.

Figure 00000251
Figure 00000251

Figure 00000252
Figure 00000252

Искусственные 5'-UTR-элементы и искусственные 3'-UTR-элементыArtificial 5'-UTR elements and artificial 3'-UTR elements

В некоторых случаях получали искусственные 5'-UTR-элементы и искусственные 3'-UTR-элементы. Это осуществляли путем модификации 5'-UTR-элементов и 3'-UTR-элементов дикого типа с помощью основанного на ПЦР подхода с использованием модифицированных праймеров следующим образом:In some cases, artificial 5'-UTR elements and artificial 3'-UTR elements were obtained. This was done by modifying the 5'-UTR elements and wild-type 3'-UTR elements using a PCR-based approach using modified primers as follows:

(I) Некоторые триплеты ATG в последовательностях 5'-UTR (если они присутствовали) конвертировали в триплет TAG. (II) Кроме того, наличие определенного сайта, расщепляемого специфической рестриктазой (если он присутствовал), рассматривали как нежелательное, в том случае, когда считали, что указанный определенный сайт расщепления будет мешать последующим экспериментам по клонированию. Считали, что сайт расщепления, присутствующий в последовательности дикого типа, будет мешать последующим экспериментам по клонированию (таким, которые описаны в примерах 2 и 3), если рестриктаза применяемая в последующих экспериментах по клонированию, может распознавать и расщеплять 3'-UTR-элемент дикого типа или 5'-UTR-элемент дикого типа. Поскольку такое внутреннее расщепление 5'-UTR-элементов и 3'-UTR-элементов было нежелательным, то сайты, расщепляемые указанной специфической рестриктазой, удаляли путем замены одного нуклеотида в сайте, расщепляемом указанной специфической рестриктазой, на комплементарный нуклеотид, удаляя тем самым сайт, расщепляемый указанной специфической рестриктазой.(I) Some ATG triplets in the 5'UTR sequences (if present) were converted to a TAG triplet. (II) In addition, the presence of a certain specific restriction enzyme cleavage site (if present) was considered undesirable when it was believed that said specific cleavage site would interfere with subsequent cloning experiments. It was believed that a cleavage site present in the wild-type sequence would interfere with subsequent cloning experiments (such as described in Examples 2 and 3) if the restriction enzyme used in subsequent cloning experiments could recognize and cleave the wild-type 3'-UTR element. type or wild-type 5'-UTR element. Since such internal cleavage of 5'-UTR elements and 3'-UTR elements was undesirable, the sites cleaved by said specific restriction enzyme were removed by replacing one nucleotide in the site cleaved by said specific restriction enzyme with a complementary nucleotide, thereby removing the site cleaved by the specified specific restriction enzyme.

SEQ ID NO: 137 (на основе SEQ ID NO: 3), SEQ ID NO: 138, (на основе SEQ ID NO: 9), SEQ ID NO: 139 (на основе SEQ ID NO: 14), SEQ ID NO: 140 - (на основе SEQ ID NO: 17), SEQ ID NO: 141 (на основе SEQ ID NO: 18), SEQ ID NO: 142 (на основе SEQ ID NO: 29),SEQ ID NO: 143 (на основе SEQ ID NO: 31), SEQ ID NO: 144 (на основе SEQ ID NO: 42), SEQ ID NO: 145 (на основе SEQ ID NO: 43), SEQ ID NO: 146 (на основе SEQ ID NO: 52), SEQ ID NO: 147 (на основе SEQ ID NO: 109), SEQ ID NO: 148 (на основе SEQ ID NO: 110), SEQ ID NO: 149 (на основе SEQ ID NO: 119), SEQ ID NO: 150 (на основе SEQ ID NO: 120) и SEQ ID NO: 151 (на основе SEQ ID NO: 136) представляют собой искусственные 5'-UTR-элементы. SEQ ID NO: 204 (на основе SEQ ID NO: 192) представляет собой искусственный 3'-UTR-элемент. Точные отличия от соответствующих последовательностей дикого типа указаны выше.SEQ ID NO: 137 (based on SEQ ID NO: 3), SEQ ID NO: 138, (based on SEQ ID NO: 9), SEQ ID NO: 139 (based on SEQ ID NO: 14), SEQ ID NO: 140 - (based on SEQ ID NO: 17), SEQ ID NO: 141 (based on SEQ ID NO: 18), SEQ ID NO: 142 (based on SEQ ID NO: 29), SEQ ID NO: 143 (based on SEQ ID NO: 31), SEQ ID NO: 144 (based on SEQ ID NO: 42), SEQ ID NO: 145 (based on SEQ ID NO: 43), SEQ ID NO: 146 (based on SEQ ID NO: 52 ), SEQ ID NO: 147 (based on SEQ ID NO: 109), SEQ ID NO: 148 (based on SEQ ID NO: 110), SEQ ID NO: 149 (based on SEQ ID NO: 119), SEQ ID NO : 150 (based on SEQ ID NO: 120) and SEQ ID NO: 151 (based on SEQ ID NO: 136) are artificial 5'UTR elements. SEQ ID NO: 204 (based on SEQ ID NO: 192) is an artificial 3'UTR element. The exact differences from the corresponding wild-type sequences are noted above.

В целом, SEQ ID NO: 1-136 можно рассматривать как 5'-UTR последовательности дикого типа, a SEQ ID NO: 137-151 можно рассматривать как искусственные последовательности 5'-UTR; SEQ ID NO: 152-203 можно рассматривать как 3'-UTR последовательности дикого типа, a SEQ ID NO: 204 можно рассматривать как искусственную последовательность 3'-UTR.In general, SEQ ID NOs: 1-136 can be considered wild-type 5'UTR sequences, and SEQ ID NOs: 137-151 can be considered artificial 5'UTR sequences; SEQ ID NO: 152-203 can be considered as wild-type 3'-UTR sequences, and SEQ ID NO: 204 can be considered as artificial 3'-UTR sequence.

В целом, в данном примере представлены несколько 5'-UTR-элементов и 3'-UTR-элементов (дикого типа и искусственные), каждый из которых можно тестировать в отношении их относительного влияния на эффективность трансляции, по сравнению с референс-UTR-элементами (как описано ниже в примерах 2 и 3).In summary, this example presents several 5'-UTR elements and 3'-UTR elements (wild-type and artificial), each of which can be tested for their relative effect on translation efficiency, compared to the reference UTR elements. (as described below in examples 2 and 3).

Пример 2: Референс-UTR-элементы и содержащая их референс-конструкцияExample 2: Reference UTR elements and their containing reference construct

На фиг. 1А представлена последовательность РНК референс-конструкции, используемой в настоящем изобретении. Конструировали также вектор для транскрипции in vitro, содержащий последовательность ДНК, соответствующую последовательности РНК, представленной на фиг. 1А. Вектор содержал промотор Т7, искусственный вариант 5'-нетранслируемой области (5'-UTR) 32L4 (рибосомальный белок большой субъединицы 32), GC-обогащенную последовательность (открытую рамку считывания, ОРС), кодирующую ген люциферазы Photinus pyralis (PpLuc(GC)), искусственный вариант 3'-нетранслируемой области (3'-UTR) человеческого альбумина (ALB), альбумин7. Поли(А)-последовательность А64, за которой следовали С30 и последовательность гистоновой структуры типа «стебель-петля», располагались с 3'-стороны относительно альбумина7. За последовательностью гистоновой структуры типа «стебель-петля» находился сайт рестрикции, используемый для линеаризации вектора перед осуществлением транскрипции in vitro.In FIG. 1A shows the RNA sequence of the reference construct used in the present invention. A vector for in vitro transcription was also constructed containing a DNA sequence corresponding to the RNA sequence shown in FIG. 1A. The vector contained the T7 promoter, an artificial variant of the 5'-untranslated region (5'-UTR) 32L4 (ribosomal protein of large subunit 32), a GC-rich sequence (open reading frame, ORF) encoding the Photinus pyralis luciferase gene (PpLuc(GC)) , an artificial variant of the 3'-untranslated region (3'-UTR) of human albumin (ALB), albumin7. The poly(A) sequence of A64 followed by C30 and a stem-loop histone sequence was located 3' to albumin7. Behind the histone stem-loop sequence was a restriction site used to linearize the vector prior to in vitro transcription.

ПЦР-фрагменты, соответствующие последовательностям, описанным в примере 1, индивидуально клонировали в векторе, содержащем последовательность ДНК, которая соответствовала последовательности РНК, представленной на фиг. 1. В тех случаях, когда последовательности дикого типа, описанные в примере 1, содержали триплеты ATG в 5'-UTR и/или нежелательные сайты рестрикции в 5'-UTR или 3'-UTR, применяли соответствующие искусственные последовательности, идентифицированные в примере 1 (например, SEQ ID NO: 137 применяли вместо SEQ ID NO: 3).PCR fragments corresponding to the sequences described in Example 1 were individually cloned into a vector containing a DNA sequence that corresponded to the RNA sequence shown in FIG. 1. Where the wild-type sequences described in Example 1 contained ATG triplets in the 5'-UTR and/or unwanted restriction sites in the 5'-UTR or 3'-UTR, the corresponding artificial sequences identified in Example 1 were used. (for example, SEQ ID NO: 137 was used instead of SEQ ID NO: 3).

Более подробно, для создания конструкции для тестирования 5'-UTR-элемента-кандидата, подчеркнутый одной линией 5'-UTR-элемент, представленный на фиг. 1А, заменяли на подлежащий тестированию (дикого типа или искусственный) 5'-UTR-элемент-кандидат (пример 1) (соответствующий пример представлен на фиг. 1Б); и для создания конструкции для тестирования 3'-UTR-элемента-кандидата, подчеркнутый двойной линией 3'-UTR-элемент, представленный на фиг. 1А, заменяли на подлежащий тестированию (дикого типа или искусственный) 5'-UTR-элемент-кандидат (пример 1) (соответствующий пример представлен на фиг. 1В). Полученные векторы или плазмиды (содержащие ДНК, соответствующую, например, последовательности РНК, например, РНК, представленной на фиг. 1А-В) можно обозначать также как ДНК-матрицы.In more detail, to create a construct for testing a candidate 5'UTR element, the single line underlined 5'UTR element shown in FIG. 1A was replaced with the candidate 5'UTR element to be tested (wild-type or artificial) (Example 1) (the corresponding example is shown in FIG. 1B); and to generate a construct for testing a candidate 3'UTR element, the double-lined 3'UTR element shown in FIG. 1A was replaced with the candidate 5'UTR element to be tested (wild-type or artificial) (Example 1) (a corresponding example is shown in FIG. 1B). The resulting vectors or plasmids (containing DNA corresponding to, for example, an RNA sequence, such as the RNA shown in Figures 1A-B) may also be referred to as DNA templates.

ДНК-матрицы линеаризовали и транскрибировали in vitro с использованием РНК-полимеразы Т7 (WO 2015/101416). Затем ДНК-матрицу расщепляли путем обработки ДНКазой. Транскрипты мРНК содержали 5'-кэп-структруру, полученную путем добавления избытка N7-метилгуанозин-5'-трифосфат-5'-гуанозина к реакционной смеси для транскрипции. Полученную таким путем мРНК очищали и ресуспендировали в воде. Полученные таким путем мРНК для тестирования UTR-элементов соответствовали мРНК, представленной на фиг. 1А (референс-конструкция), за исключением того, что 5'-UTR-элемент или 3'-UTR-элемент референс-конструкции был заменен на соответствующий подлежащий тестированию UTR-элемент.DNA templates were linearized and transcribed in vitro using T7 RNA polymerase (WO 2015/101416). The template DNA was then digested by treatment with DNase. The mRNA transcripts contained a 5'-cap structure prepared by adding an excess of N 7 -methylguanosine-5'-triphosphate-5'-guanosine to the transcription reaction mixture. The mRNA thus obtained was purified and resuspended in water. The mRNAs thus obtained for testing the UTR elements corresponded to the mRNA shown in FIG. 1A (reference construct), except that the 5'-UTR element or 3'-UTR element of the reference construct has been replaced with the corresponding UTR element to be tested.

Пример 3: Эффективность трансляции UTR-элементов-кандидатов в сравнении с референс-конструкциейExample 3: Translation Efficiency of Candidate UTR Elements Compared to Reference Construct

Экспериментально тестировали 5'-UTR-элементы человеческого происхождения или мышиного происхождения или 3'-UTR-элементы человеческого происхождения или мышиного происхождения. В контексте данного примера понятие «человеческое происхождение» может относиться либо к человеческой последовательности дикого типа (например, SEQ ID NO: 1), либо к искусственной последовательности, сконструированной на основе человеческой последовательности дикого типа путем замены одного или большего количества оснований (например, SEQ ID NO: 137), соответствующим образом применяют и понятие «мышиное происхождение». Более подробные данные о том, каким образом искусственные последовательности созданы на основе последовательностей дикого типа, представлены в таблицах 3 и 4 в примере 1.Experimentally tested 5'-UTR elements of human origin or murine origin or 3'-UTR elements of human origin or murine origin. In the context of this example, "human origin" may refer to either a human wild-type sequence (e.g., SEQ ID NO: 1) or an artificial sequence constructed from a human wild-type sequence by substitution of one or more bases (e.g., SEQ ID NO: 137), the concept of "murine origin" is used accordingly. More details on how the artificial sequences are created based on the wild type sequences are presented in tables 3 and 4 in example 1.

Экспериментально тестировали, оказывают ли 5'- или 3'-UTR (таблицы 3 и 4, ниже) благоприятное действие на эффективность трансляции. Это осуществляли с помощью способа, включающего стадии, на которых:Whether 5' or 3' UTRs (Tables 3 and 4 below) have a beneficial effect on translation efficiency was experimentally tested. This was carried out using a method comprising the steps in which:

(I) трансфектируют клетки млекопитающих искусственной молекулой нуклеиновой кислоты и измеряют количества экспрессированного белка, кодируемого ОРС искусственной молекулы нуклеиновой кислоты в один или два определенных момента времени после трансфекции (через 24 и 48 ч),(i) transfecting mammalian cells with the artificial nucleic acid molecule and measuring the amounts of expressed protein encoded by the ORF of the artificial nucleic acid molecule at one or two specific time points after transfection (24 and 48 hours),

(II) трансфектируют клетки млекопитающих референс-молекулой нуклеиновой кислоты (фиг. 1А) и измеряют количества экспрессированного белка, кодируемого ОРС референс-молекулы нуклеиновой кислоты в те же самые один или два момента времени после трансфекции (через 24 и 48 ч),(II) transfecting mammalian cells with the reference nucleic acid molecule (FIG. 1A) and measuring the amounts of expressed protein encoded by the ORF of the reference nucleic acid molecule at the same one or two time points after transfection (24 and 48 h),

(III) рассчитывают отношение количества белка, экспрессированного с искусственной молекулы нуклеиновой кислоты, к количеству белка, экспрессированного с референс-молекулы нуклеиновой кислоты,(iii) calculate the ratio of the amount of protein expressed from the artificial nucleic acid molecule to the amount of protein expressed from the reference nucleic acid molecule,

При этом величина отношения, рассчитанного на стадии (III), составляет ≥1.In this case, the value of the ratio calculated in step (III) is ≥1.

Указанное отношение ассоциировано с высокой эффективностью трансляции.This ratio is associated with high translation efficiency.

Все последовательности UTR, экспериментально тестированные в рассматриваемом примере, обозначали также как «экспериментально тестированные UTR-элементы» или «тестированные UTR-элементы», или «экспериментально тестированные UTR» или «тестированные UTR».All UTR sequences experimentally tested in this example were also referred to as "experimental tested UTR elements" or "tested UTR elements" or "experimental tested UTRs" or "tested UTRs".

Искусственная молекула нуклеиновой кислоты, указанная в пункте (I), содержала тестированный UTR-элемент. В частности, искусственная молекула нуклеиновой кислоты (мРНК) не отличалась по своей структуре от референс-молекулы нуклеиновой кислоты (фиг. 1А), за исключением того, что либо 5'-UTR-элемент, либо 3'-UTR-элемент референс-молекулы нуклеиновой кислоты заменен на тестированный UTR-элемент (иллюстративные примеры представлены на фиг. 1Б и 1В).The artificial nucleic acid molecule referred to in paragraph (I) contained the tested UTR element. In particular, the artificial nucleic acid molecule (mRNA) did not differ in structure from the reference nucleic acid molecule (FIG. 1A), except that either the 5'-UTR element or the 3'-UTR element of the reference molecule nucleic acid is replaced with the tested UTR element (illustrative examples are presented in Fig. 1B and 1C).

3.1 UTR-элементы человеческого происхождения3.1 UTR elements of human origin

Подробные данные о UTR-элементах человеческого происхождения, которые подвергали экспериментальному тестированию, представлены ниже в таблице 3. Экспериментальное тестирование осуществляли, проводя сравнение с референс-конструкцией, подробно описанной выше и в разделе «Подробное описание конструкции».Details of the UTR elements of human origin that were subjected to experimental testing are shown in Table 3 below. Experimental testing was performed by comparing with the reference construct detailed above and in the Detailed Design section.

Figure 00000253
Figure 00000253

Figure 00000254
Figure 00000254

Figure 00000255
Figure 00000255

Figure 00000256
Figure 00000256

Figure 00000257
Figure 00000257

Figure 00000258
Figure 00000258

Figure 00000259
Figure 00000259

Figure 00000260
Figure 00000260

3.2 UTR-элементы мышиного происхождения3.2 UTR elements of murine origin

Подробные данные о UTR-элементах мышиного происхождения, которые подвергали экспериментальному тестированию, представлены ниже в таблице 4.Details of the murine UTRs that were experimentally tested are shown in Table 4 below.

Экспериментальное тестирование осуществляли, проводя сравнение с референс-конструкцией, подробно описанной выше и в разделе «Подробное описание конструкции».Experimental testing was performed by comparing with the reference design, detailed above and in the section "Detailed description of the design".

Figure 00000261
Figure 00000261

Figure 00000262
Figure 00000262

Figure 00000263
Figure 00000263

Figure 00000264
Figure 00000264

Figure 00000265
Figure 00000265

Figure 00000266
Figure 00000266

3.3 Подробное описание конструкции3.3 Detailed design description

При тестировании 5'-UTR заменяли 5'-UTR референс-конструкции (т.е. 32L4 - PpLuc(GC) - альбумин7- А64 - С30 - hSL; фиг. 1) на «тестируемую» 5'-UTR - т.е. либо на последовательность 5'-UTR дикого типа (последовательность мРНК, соответствующая последовательности ДНК, представленная в таблице 3 или 4, первый столбец), либо на искусственную последовательность 5'-UTR, созданную на ее основе (последовательность мРНК, соответствующая последовательности ДНК, представленная в таблице 3 или 4, второй столбец). Остальные элементы последовательности референс-конструкции оставались без изменений.When testing the 5'-UTR, the 5'-UTR of the reference construct (i.e. 32L4 - PpLuc(GC) - albumin7-A64 - C30 - hSL; Fig. 1) was replaced with the "tested" 5'-UTR - i.e. . either to the wild-type 5'-UTR sequence (mRNA sequence corresponding to the DNA sequence presented in Table 3 or 4, first column), or to an artificial 5'-UTR sequence created on its basis (mRNA sequence corresponding to the DNA sequence presented in table 3 or 4, second column). The remaining elements of the reference construct sequence remained unchanged.

В свою очередь, при тестировании 3'-UTR заменяли 3'-UTR референс-конструкции (т.е. 32L4 - PpLuc(GC) - альбумин7- А64 - С30 - hSL; фиг. 1) на «тестируемую» 3'-UTR - т.е. либо на последовательность 3'-UTR дикого типа (последовательность мРНК, соответствующая последовательности ДНК, представленная в таблице 3 или 4, третий столбец), либо на искусственную последовательность 5'-UTR, созданную на ее основе (последовательность мРНК, соответствующая последовательности ДНК, представленная в таблице 3 или 4, четвертый столбец). Остальные элементы последовательности референс-конструкции оставались без изменений.In turn, when testing the 3'-UTR, the 3'-UTR of the reference construct (i.e., 32L4 - PpLuc(GC) - albumin7-A64 - C30 - hSL; Fig. 1) was replaced with the "tested" 3'-UTR - i.e. either to the wild-type 3'-UTR sequence (mRNA sequence corresponding to the DNA sequence presented in Table 3 or 4, third column), or to an artificial 5'-UTR sequence created on its basis (mRNA sequence corresponding to the DNA sequence presented in table 3 or 4, fourth column). The remaining elements of the reference construct sequence remained unchanged.

3.4. Анализ люциферазной активности для определения эффективности трансляции3.4. Luciferase activity assay to determine translation efficiency

Эффективность трансляции тестировали экспериментально с помощью анализа на основе трансфекции клеток с использованием различных линий клеток млекопитающих (человеческих, мышиных), а именно, HDF, L929, HepG2 и Hela (см. фиг. 2-9).Translation efficiency was experimentally tested in a cell transfection based assay using various mammalian (human, mouse) cell lines, namely HDF, L929, HepG2 and Hela (see FIGS. 2-9).

Человеческие кожные фибробласты (HDF), L929-клетки, HepG2-клетки и HeLa-клетки высевали в 86-луночные планшеты с плотностью 1×104 клеток на лунку. На следующий день клетки промывали в среде Opti-MEM и затем трансфектировали, используя по 25 нг на лунку мРНК, кодирующей PpLuc, включенной в комплекс с липофектамином 2000, в среде Opti-MEM. Нетрансфектированые клетки служили в качестве контроля. Для контроля эффективности трансфекции наряду с мРНК PpLuc (1 нг мРНК RrLuc на лунку) осуществляли трансфекцию мРНК, кодирующей люциферазу Renilla reniformis (RrLuc). Через 90 мин после начала трансфекции осуществляли замены среды Opti-MEM. Через 24 и 48 ч после трансфекции среду удаляли путем аспирации и клетки лизировали в 100 мкл буфера для лизиса (буфер для пассивного лизиса, фирма Promega). Лизаты хранили при -80° до осуществления измерений люциферазной активности.Human dermal fibroblasts (HDF), L929 cells, HepG2 cells and HeLa cells were seeded in 86-well plates at a density of 1×10 4 cells per well. The next day, cells were washed in Opti-MEM and then transfected using 25 ng per well of mRNA encoding PpLuc complexed with Lipofectamine 2000 in Opti-MEM. Untransfected cells served as controls. To control transfection efficiency, along with PpLuc mRNA (1 ng RrLuc mRNA per well), mRNA encoding Renilla reniformis luciferase (RrLuc) was transfected. 90 min after the start of transfection, the Opti-MEM medium was replaced. At 24 and 48 hours after transfection, the medium was removed by aspiration and the cells were lysed in 100 μl of lysis buffer (passive lysis buffer, Promega). The lysates were stored at -80° until the measurement of luciferase activity.

Люциферазную активность измеряли в относительных световых единицах (RLU) с помощью ридера для планшетов Hidex Chameleon. Активности Ppluc и Rrluc измеряли последовательно в одном образце с помощью двойного анализа люциферазы. Сначала измеряли активность PpLuc в течение периода измерения, равного 2 с с использованием 20 мкл лизата и 50 мкл буферной системы Beetle-Juice (фирма PJK GmbH). Спустя 1500 мс, измеряли активность RrLuc с использованием 50 мкл буферной системы Renilla-Juice (фирма PJK GmbH).Luciferase activity was measured in relative light units (RLU) using a Hidex Chameleon plate reader. Ppluc and Rrluc activities were measured sequentially in the same sample using a dual luciferase assay. First, PpLuc activity was measured over a 2 second measurement period using 20 μl of lysate and 50 μl of Beetle-Juice buffer system (PJK GmbH). After 1500 ms, RrLuc activity was measured using 50 μl of Renilla-Juice buffer system (PJK GmbH).

Эту процедуру осуществляли в 96-луночных планшетах, и каждый тестируемый UTR-элемент (в каркасе содержащей его конструкции, см. раздел 3.3) помещали в соответствующее положение на 96-луночном планшете. Использовали два 96-луночных планшета, один для тестирования UTR-элементов человеческого происхождения и один для тестирования UTR-элементов мышиного происхождения. В каждом планшете референс-конструкция (соответствующая последовательности мРНК, представленной на фиг. 1А) находилась в положениях G12 и Н12. Тестируемые UTR-элементы находились в положениях, указанных в последней колонке в Таблицах 3 и 4 соответственно. Например, конструкция, содержащая 3'-UTR мышиного Aarsd1 (SEQ ID NO: 186) находилась в положении F12 (см. таблицу 4).This procedure was performed in 96-well plates, and each UTR element to be tested (in the framework of its containing construct, see section 3.3) was placed in the appropriate position on the 96-well plate. Two 96-well plates were used, one for testing human-derived UTR elements and one for testing murine-derived UTR elements. In each plate, the reference construct (corresponding to the mRNA sequence shown in FIG. 1A) was at positions G12 and H12. The tested UTR elements were in the positions indicated in the last column in Tables 3 and 4, respectively. For example, the construct containing the murine Aarsd1 3'UTR (SEQ ID NO: 186) was at position F12 (see Table 4).

Люциферазную активность измеряли через 24 ч (1d, 24 ч) после трансфекции клеток и затем еще раз через 48 ч (2d, 48 ч) после трансфекции клеток.Luciferase activity was measured 24 h (1d, 24 h) after cell transfection and then again 48 h (2d, 48 h) after cell transfection.

Результаты этого анализа описаны ниже в разделе 3.5.The results of this analysis are described below in Section 3.5.

3.5 Результаты - Определение UTR-элементов, ассоциированных с высокой эффективностью трансляции3.5 Results - Identification of UTR Elements Associated with High Translation Efficiency

Результаты оценки экспрессии с помощью указанного анализа (см. раздел 3.4, выше), измеренные через 24 ч (1d, 24 ч) и еще раз через 48 ч (2d, 48 ч) после трансфекции в различных линиях клеток млекопитающих (HDF, L929, HepG2 и Hela), представлены на фиг. 2-9. Следует отметить, что в данном случае применяли два набора 96-луночных планшетов, один был предназначен для UTR-элементов человеческого происхождения и один был предназначен для UTR-элементов мышиного происхождения.Expression results using this assay (see Section 3.4 above) measured 24 h (1d, 24 h) and again 48 h (2d, 48 h) after transfection in various mammalian cell lines (HDF, L929, HepG2 and Hela) are shown in FIG. 2-9. It should be noted that two sets of 96-well plates were used here, one for human UTRs and one for mouse UTRs.

В то время как данные на фиг. 2-9 относятся к конкретным положениям на 96-луночном планшете (например, А1), в таблицах 3 и 4 конкретные протестированные 5'- или 3'-UTR-элементы соотнесены с конкретными положениями на 96-луночном планшете. Например, из таблицы 3 можно установить, что в положении А1 96-луночного планшета с протестированными человеческими UTR-элементами, тестировали ZNF460-5'-UTR-элемент (SEQ ID NO: 1) и т.д.While the data in FIG. 2-9 refer to specific positions on a 96-well plate (eg, A1), in tables 3 and 4, specific 5' or 3'-UTR elements tested are assigned to specific positions on a 96-well plate. For example, it can be seen from Table 3 that at position A1 of the 96-well plate with human UTR elements tested, the ZNF460-5'-UTR element (SEQ ID NO: 1) was tested, and so on.

Определяли группу наиболее предпочтительных UTR-элементов (которые обозначали также как группу «конечного отбора»). Эта группа содержала 5'-UTR-элементы и 3'-UTR-элементы, которые характеризовались эффективностью трансляции, измеренной через 1 день (24 ч), равной или более высокой, предпочтительно более высокой, чем эффективность референс-конструкции (фиг. 1А), по меньшей мере для одной из протестированных клеточных линий. Эту группа подразделяли на четыре подгруппы: (I) 5'-UTR-элементы человеческого происхождения (см. таблицу 5), (II) 3'-UTR-элементы человеческого происхождения (см. таблицу 6), (III) 5'-UTR-элементы мышиного происхождения (см. таблицу 7), (IV) 3'-UTR-элементы мышиного происхождения (см. таблицу 8)A group of the most preferred UTR elements (which is also referred to as the "final selection" group) was determined. This group contained 5'-UTR elements and 3'-UTR elements that had a translation efficiency, measured after 1 day (24 h), equal to or greater, preferably greater than the efficiency of the reference construct (Fig. 1A) , for at least one of the tested cell lines. This group was divided into four subgroups: (I) 5'-UTR elements of human origin (see Table 5), (II) 3'-UTR elements of human origin (see Table 6), (III) 5'-UTR - elements of mouse origin (see table 7), (IV) 3'-UTR elements of mouse origin (see table 8)

Figure 00000267
Figure 00000267

Figure 00000268
Figure 00000268

Figure 00000269
Figure 00000269

Таким образом, 5'-UTR человеческих генов из группы, состоящей из ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'-UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR, рассматривали как обеспечивающие высокую эффективность трансляции.Thus, the 5'-UTR of human genes from the group consisting of ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2 -5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'-UTR, PYSL2- 5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5 '-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5' -UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'- UTR, AMN-5'-UTR, MAP1S-5'-UTR, were considered to provide high translation efficiency.

Также считали, что 5'-UTR, имеющие SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (или ее эквивалент дикого типа SEQ ID NO: 3), SEQ ID NO: 138 (или ее эквивалент дикого типа SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (или ее эквивалент дикого типа SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (или ее эквивалент дикого типа SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (или ее эквивалент дикого типа SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO:37, SEQ ID NO: 144 (или ее эквивалент дикого типа SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62, обеспечивают высокую эффективность трансляции.It was also considered that 5'-UTRs having SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (or its wild-type equivalent of SEQ ID NO: 3), SEQ ID NO: 138 (or its wild-type equivalent SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (or its wild-type equivalent SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (or its wild type equivalent SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (or its wild-type equivalent SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (or its wild-type equivalent SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62, provide high translation efficiency.

Figure 00000270
Figure 00000270

Figure 00000271
Figure 00000271

Таким образом, 3'-UTR человеческих генов из группы, состоящей из NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR рассматривали как обеспечивающие высокую эффективность трансляции.Thus, the 3'-UTR of human genes from the group consisting of NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B -3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, SCAND1- 3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR were considered to provide high translation efficiency.

Также считали, что 3'-UTR, имеющие SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173, обеспечивают высокую эффективность трансляции.It was also considered that 3'-UTRs having SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173 provide high translation efficiency.

Figure 00000272
Figure 00000272

Figure 00000273
Figure 00000273

Figure 00000274
Figure 00000274

Figure 00000275
Figure 00000275

Таким образом, 5'-UTR мышиных генов из группы, состоящей из Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR, рассматривали как обеспечивающие высокую эффективность трансляции.Thus, the 5'-UTR of mouse genes from the group consisting of Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1 -5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp- 5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5 '-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5' -UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'- UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR , Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR were considered to provide high translation efficiency.

Также 5'-UTR, имеющие SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (или ее эквивалент дикого типа SEQ ID NO: 109), SEQ ID NO: 148 (или ее эквивалент дикого типа SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (или ее эквивалент дикого типа SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (или ее эквивалент дикого типа SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (на основе SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125, рассматривали как обеспечивающие высокую эффективность трансляции.Also 5'UTRs having SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO : 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102 , SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (or its wild-type equivalent SEQ ID NO: 109), SEQ ID NO: 148 (or its wild-type equivalent SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO : 149 (or its wild-type equivalent SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130 , SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (or its wild-type equivalent SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 1 50 (based on SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125 were considered to provide high translation efficiency.

Figure 00000276
Figure 00000276

Figure 00000277
Figure 00000277

Таким образом, 3'-UTR мышиных генов из группы, состоящей из Асох2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, рассматривали как обеспечивающие высокую эффективность трансляции.Thus, the 3'-UTR of mouse genes from the group consisting of Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3 -3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Pole- 3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3 '-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, were considered to provide high translation efficiency.

Также 3'-UTR, имеющие SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (или ее эквивалент дикого типа SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, рассматривали как обеспечивающие высокую эффективность трансляции.Also 3'UTRs having SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (or its wild type equivalent SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200 , SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, were considered to provide high translation efficiency.

Claims (41)

1. Искусственная молекула нуклеиновой кислоты для обеспечения высокой эффективности трансляции полипептида или пептида, содержащая 1. An artificial nucleic acid molecule to ensure high translation efficiency of a polypeptide or peptide, containing a. по меньшей мере одну открытую рамку считывания - ОРС;a. at least one open reading frame - ORF; б. по меньшей мере один элемент 3’-нетранслируемой области -3’-UTR-элемент, который содержит нуклеотидную последовательность, полученную из 3’-UTR транскрипта гена, выбранного из группы, которая состоит из NDUFS7-3’-UTR, PHGDH-3’-UTR, TSPO-3’-UTR, ATP5D-3’-UTR, EXOSC4-3’-UTR, TUBB4B-3’-UTR, TUBA4A-3’-UTR, EMP3-3’-UTR, CRIP2-3’-UTR, BRAT1-3’-UTR, CD9-3’-UTR, CDK9-3’-UTR, PSMB3-3’-UTR, PSMB6-3’-UTR, PRSS56-3’-UTR, SCAND1-3’-UTR, AMN-3’-UTR, CYBA-3’-UTR, PCOLCE-3’-UTR, MAP1S-3’-UTR, VTN-3’-UTR, ALDH16A1-3’-UTR - предпочтительно все человеческие, и Acox2-3’-UTR,Ubc-3’-UTR, Slpi-3’-UTR, Pcyox1l-3’-UTR, Igf2bp1-3’-UTR, Tmem37-3’-UTR, Slc7a3-3’-UTR, Cst6-3’-UTR, Ebp-3’-UTR, Sf3b5-3’-UTR, Plk1-3’-UTR, Cdca8-3’-UTR, Kif22-3’-UTR, Cad-3’-UTR, Cth-3’-UTR, Pole-3’-UTR, Kif2c-3’-UTR, Scand1-3’-UTR, Gpr84-3’-UTR, Tpgs1-3’-UTR, Ccl17-3’-UTR, Alkbh7-3’-UTR, Ms4a8a-3’-UTR, Mrpl34-3’-UTR, Comtd1-3’-UTR, Armc6-3’-UTR, Atp5d-3’-UTR, 1110001J03Rik-3’-UTR, Nudt22-3’-UTR, Aarsd1-3’-UTR - предпочтительно все мышиные; иb. at least one 3'-untranslated region element -3'-UTR element which contains a nucleotide sequence derived from the 3'-UTR of a gene transcript selected from the group consisting of NDUFS7-3'-UTR, PHGDH-3' -UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'- UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR , AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR - preferably all human, and Acox2- 3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3 '-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3' -UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'- UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR , Aarsd1-3'-UTR - preferably all mice others; and в. необязательно по меньшей мере один элемент 5’-нетранслируемой области-5’-UTR-элемент, в которой по меньшей мере одна открытая рамка считывания является гетерологичной по отношению к 3’-UTR и/или 5’-UTR-элементу, и где указанная искусственная молекула нуклеиновой кислоты отличается высокой эффективностью трансляции по сравнению с эффективностью трансляции референс-молекулы нуклеиновой кислоты, которая идентична искусственной молекуле нуклеиновой кислоты за исключением 3’-UTR-элемента, а эффективность трансляции искусственной молекулы нуклеиновой кислоты и эффективность трансляции референс-молекулы нуклеиновой кислоты сравнивают с помощью способа, включающего стадии, на которых:in. optionally at least one 5'-untranslated region element-5'-UTR element in which at least one open reading frame is heterologous with respect to the 3'-UTR and/or 5'-UTR element, and where the specified the artificial nucleic acid molecule has a high translation efficiency compared to the translation efficiency of the reference nucleic acid molecule, which is identical to the artificial nucleic acid molecule except for the 3'-UTR element, and the translation efficiency of the artificial nucleic acid molecule and the translation efficiency of the reference nucleic acid molecule are compared using a method comprising the steps of: (I) трансфектируют клетки млекопитающих искусственной молекулой нуклеиновой кислоты и измеряют количества экспрессированного белка, кодируемого ОРС искусственной молекулы нуклеиновой кислоты после трансфекции,(I) transfecting mammalian cells with the artificial nucleic acid molecule and measuring the amount of expressed protein encoded by the ORF of the artificial nucleic acid molecule after transfection, (II) трансфектируют клетки млекопитающих референс-молекулой нуклеиновой кислоты и измеряют количества экспрессируемого белка, кодируемого ОРС референс-молекулы нуклеиновой кислоты, в тот же самый момент времени после трансфекции, (ii) transfecting mammalian cells with the reference nucleic acid molecule and measuring the amounts of expressed protein encoded by the ORF of the reference nucleic acid molecule at the same time point after transfection, (III) рассчитывают отношение количества белка, экспрессированного с искусственной молекулы нуклеиновой кислоты, к количеству белка, экспрессированного с референс-молекулы нуклеиновой кислоты, где величина отношения, рассчитанного на стадии III, составляет > 1.(III) calculate the ratio of the amount of protein expressed from the artificial nucleic acid molecule to the amount of protein expressed from the reference nucleic acid molecule, where the value of the ratio calculated in step III is > 1. 2. Искусственная молекула нуклеиновой кислоты по п. 1, в которой по меньшей мере один 3’-UTR-элемент содержит или состоит из нуклеотидной последовательности SEQ ID NO: 164 или соответствующей последовательности РНК.2. An artificial nucleic acid molecule according to claim 1, in which at least one 3'-UTR element contains or consists of the nucleotide sequence of SEQ ID NO: 164 or the corresponding RNA sequence. 3. Искусственная молекула нуклеиновой кислоты по п. 1, в которой по меньшей мере один 3’-UTR-элемент содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 99% нуклеотидной последовательности SEQ ID NO: 164 или соответствующей последовательности РНК.3. An artificial nucleic acid molecule according to claim 1, in which at least one 3'-UTR element contains or consists of a nucleotide sequence that is at least 95%, even more preferably at least 99% identical to the nucleotide sequence of SEQ ID NO: 164 or the corresponding RNA sequence. 4. Искусственная молекула нуклеиновой кислоты по п. 1, где 3’-UTR-элемент референс-молекулы нуклеиновой кислоты имеет последовательность, представленную в SEQ ID NO: 207, или соответствующую последовательность РНК.4. The artificial nucleic acid molecule according to claim 1, wherein the 3'-UTR element of the reference nucleic acid molecule has the sequence shown in SEQ ID NO: 207 or the corresponding RNA sequence. 5. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-4, в которой по меньшей мере один 3’-UTR-элемент и/или по меньшей мере один 5’-UTR-элемент повышает эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно по меньшей мере в 2 раза, еще более предпочтительно по меньшей мере в 2,5 раза по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3’-UTR и/или по меньшей мере одна 5’-UTR соответственно, и/или в которой по меньшей мере один 3’-UTR-элемент и/или по меньшей мере один 5’-UTR-элемент обеспечивает высокую эффективность трансляции указанной искусственной молекулы нуклеиновой кислоты, превышающую по меньшей мере в 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза производство белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3’-UTR и/или по меньшей мере одна 5’-UTR соответственно.5. An artificial nucleic acid molecule according to any one of paragraphs. 1-4, in which at least one 3'-UTR element and/or at least one 5'-UTR element increases the translation efficiency of said artificial nucleic acid molecule by at least 1.2 times, preferably at least 1.5-fold, more preferably at least 2-fold, even more preferably at least 2.5-fold, compared to the production of a protein from a reference nucleic acid molecule lacking a 3'-UTR and/or at least at least one 5'-UTR, respectively, and/or in which at least one 3'-UTR element and/or at least one 5'-UTR element provides a high translation efficiency of said artificial nucleic acid molecule, exceeding at least 1.5-fold, preferably at least 2-fold, more preferably at least 2.5-fold protein production from a nucleic acid reference molecule lacking a 3'-UTR and/or at least one 5'- UTR respectively. 6. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-5, в которой по меньшей мере один 5’-UTR-элемент содержит или состоит из нуклеотидной последовательности, которая получена из 5’-UTR транскрипта гена, выбранного из группы, которая состоит из ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3 5’-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 - предпочтительно все человеческие, и Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 - предпочтительно все мышиные.6. An artificial nucleic acid molecule according to any one of paragraphs. 1-5, in which at least one 5'-UTR element contains or consists of a nucleotide sequence that is derived from a 5'-UTR of a gene transcript selected from the group consisting of ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3 5'-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 - preferably all human, and Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22 , Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Ccl17, Ms4ah7, Acox2, Ubc, Slpi, Pcyox1l, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 - preferably all mouse. 7. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-6, в которой по меньшей мере один 5’-UTR-элемент содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, выбранной из группы, которая состоит из SEQ ID NO: 1-151 или соответствующей последовательности РНК, или в которой по меньшей мере один 5’-UTR-элемент содержит или состоит из фрагмента нуклеотидной последовательности, идентичного по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% фрагменту нуклеотидной последовательности, выбранной из группы, которая состоит из SEQ ID NO: 1-151 или соответствующей последовательности РНК.7. Artificial nucleic acid molecule according to any one of paragraphs. 1-6, in which at least one 5'-UTR element contains or consists of a nucleotide sequence that is at least about 50% identical, preferably at least about 60%, preferably at least about 70% identical, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of a nucleotide sequence selected from the group consisting of of SEQ ID NO: 1-151 or the corresponding RNA sequence, or in which at least one 5'-UTR element contains or consists of a nucleotide sequence fragment that is at least about 40% identical, preferably at least about 50 %, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of a fragment of a nucleotide sequence selected from the group consisting of SEQ ID NO: 1-151 or the corresponding RNA sequence . 8. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-7, дополнительно содержащая 8. Artificial nucleic acid molecule according to any one of paragraphs. 1-7, additionally containing г. поли(A)-последовательность и/или сигнал полиаденилирования, который находится с 3’-стороны относительно 3’-UTR-элемента.d. a poly(A) sequence and/or a polyadenylation signal that is 3' to the 3' UTR element. 9. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-8, дополнительно содержащая 5’-кэп-структуру, поли(C)-последовательность, гистоновую структуру типа «стебель-петля» и/или IRES-мотив. 9. An artificial nucleic acid molecule according to any one of paragraphs. 1-8, additionally containing a 5' cap structure, a poly(C) sequence, a histone stem-loop structure, and/or an IRES motif. 10. Искусственная молекула нуклеиновой кислоты по любому из пп. 1–9, в которой нуклеотидная последовательность содержит 5’-TOP UTR.10. An artificial nucleic acid molecule according to any one of paragraphs. 1–9, in which the nucleotide sequence contains the 5'-TOP UTR. 11. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-10, в открытой рамке считывания которой по меньшей мере частично модифицировано содержание G/C, где предпочтительно содержание G/C открытой рамки считывания повышено по сравнению с открытой рамкой считывания дикого типа и/или в которой открытая рамка считывания содержит область с оптимизированными кодонами, предпочтительно в которой открытая рамка считывания имеет оптимизированные кодоны.11. An artificial nucleic acid molecule according to any one of paragraphs. 1-10, in which the G/C content is at least partially modified in the open reading frame, where preferably the G/C content of the open reading frame is increased compared to the wild-type open reading frame and/or in which the open reading frame contains a codon-optimized region , preferably in which the open reading frame has optimized codons. 12. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-11, которая представляет собой РНК, предпочтительно молекулу мРНК.12. An artificial nucleic acid molecule according to any one of paragraphs. 1-11 which is an RNA, preferably an mRNA molecule. 13. Вектор экспрессии полипептида или пептида, содержащий искусственную молекулу нуклеиновой кислоты по любому из пп. 1-12.13. Expression vector of a polypeptide or peptide containing an artificial nucleic acid molecule according to any one of paragraphs. 1-12. 14. Клетка для получения полипептида или пептида, содержащая искусственную молекулу нуклеиновой кислоты по любому из пп. 1-12 или вектор по п. 13.14. Cell to obtain a polypeptide or peptide containing an artificial nucleic acid molecule according to any one of paragraphs. 1-12 or vector according to item 13. 15. Фармацевтическая композиция для вакцинации, содержащая эффективное количество искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12, или вектора по п. 13, или клетки по п. 14 и один или более фармацевтически приемлемых носителей, разбавителей и/или эксципиентов и/или один или большее количество адъювантов.15. Pharmaceutical composition for vaccination containing an effective amount of an artificial nucleic acid molecule according to any one of paragraphs. 1-12, or a vector according to claim 13, or a cell according to claim 14 and one or more pharmaceutically acceptable carriers, diluents and/or excipients and/or one or more adjuvants. 16. Фармацевтическая композиция для генной терапии, содержащая эффективное количество искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12, или вектора по п. 13, или клетки по п. 14 и один или более фармацевтически приемлемых носителей, разбавителей и/или эксципиентов и/или один или большее количество адъювантов.16. Pharmaceutical composition for gene therapy, containing an effective amount of an artificial nucleic acid molecule according to any one of paragraphs. 1-12, or a vector according to claim 13, or a cell according to claim 14 and one or more pharmaceutically acceptable carriers, diluents and/or excipients and/or one or more adjuvants. 17. Применение искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12 в качестве вакцины.17. The use of an artificial nucleic acid molecule according to any one of paragraphs. 1-12 as a vaccine. 18. Применение искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12 в генной терапии.18. The use of an artificial nucleic acid molecule according to any one of paragraphs. 1-12 in gene therapy. 19. Применение вектора по п. 13 в качестве вакцины.19. Use of the vector according to claim 13 as a vaccine. 20. Применение вектора по п. 13 в генной терапии.20. Use of the vector according to claim 13 in gene therapy. 21. Применение клетки по п. 14 в качестве вакцины.21. Use of a cell according to claim 14 as a vaccine. 22. Применение клетки по п. 14 в генной терапии.22. Use of a cell according to claim 14 in gene therapy. 23. Применение фармацевтической композиции по п. 15 в качестве вакцины.23. The use of a pharmaceutical composition according to claim 15 as a vaccine. 24. Применение фармацевтической композиции по п. 16 в генной терапии.24. The use of a pharmaceutical composition according to claim 16 in gene therapy. 25. Способ получения искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12, предусматривающий объединение 25. The method of obtaining an artificial nucleic acid molecule according to any one of paragraphs. 1-12, providing for the union a. по меньшей мере одной открытой рамки считывания - ОРС;a. at least one open reading frame - ORF; б. по меньшей мере одного элемента 3’-нетранслируемой области -3’-UTR-элемента, который содержит нуклеотидную последовательность, которая получена из 3’-UTR транскрипта человеческого гена, выбранного из группы, которая состоит из NDUFS7-3’-UTR, PHGDH-3’-UTR, TSPO-3’-UTR, ATP5D-3’-UTR, EXOSC4-3’-UTR, TUBB4B-3’-UTR, TUBA4A-3’-UTR, EMP3-3’-UTR, CRIP2-3’-UTR, BRAT1-3’-UTR, CD9-3’-UTR, CDK9-3’-UTR, PSMB3-3’-UTR, PSMB6-3’-UTR, PRSS56-3’-UTR, SCAND1-3’-UTR, AMN-3’-UTR, CYBA-3’-UTR, PCOLCE-3’-UTR, MAP1S-3’-UTR, VTN-3’-UTR, ALDH16A1-3’-UTR - предпочтительно все человеческие, и Acox2-3’-UTR, Ubc-3’-UTR, Slpi-3’-UTR, Pcyox1l-3’-UTR, Igf2bp1-3’-UTR, Tmem37-3’-UTR, Slc7a3-3’-UTR, Cst6-3’-UTR, Ebp-3’-UTR, Sf3b5-3’-UTR, Plk1-3’-UTR, Cdca8-3’-UTR, Kif22-3’-UTR, Cad-3’-UTR, Cth-3’-UTR, Pole-3’-UTR, Kif2c-3’-UTR, Scand1-3’-UTR, Gpr84-3’-UTR, Tpgs1-3’-UTR, Ccl17-3’-UTR, Alkbh7-3’-UTR, Ms4a8a-3’-UTR, Mrpl34-3’-UTR, Comtd1-3’-UTR, Armc6-3’-UTR, Atp5d-3’-UTR, 1110001J03Rik-3’-UTR, Nudt22-3’-UTR, Aarsd1-3’-UTR - предпочтительно все мышиные, и b. at least one element of the 3'-untranslated region -3'-UTR element, which contains a nucleotide sequence that is derived from the 3'-UTR of a human gene transcript selected from the group consisting of NDUFS7-3'-UTR, PHGDH- 3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3 '-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3' -UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR - preferably all human, and Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6 -3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth- 3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3 '-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3' -UTR, Aarsd1-3'-UTR - preferably all murine, and в. необязательно по меньшей мере одного элемента 5’-нетранслируемой области -5’-UTR-элемента, причем по меньшей мере одна открытая рамка считывания является гетерологичной по отношению 3’-UTR и/или 3’-UTR –элементу.in. optionally at least one element of the 5'-untranslated region of the -5'-UTR element, wherein at least one open reading frame is heterologous with respect to the 3'-UTR and/or 3'-UTR element. 26. Способ по п. 25, в котором применяют вектор по п. 13.26. The method of claim 25, wherein the vector of claim 13 is used. 27. Способ обеспечения повышенной эффективности трансляции полипептида или пептида, предусматривающий получение искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12.27. A method for providing improved translation efficiency of a polypeptide or peptide, comprising obtaining an artificial nucleic acid molecule according to any one of paragraphs. 1-12. 28. Набор для вакцинации, содержащий искусственную молекулу нуклеиновой кислоты по любому из пп. 1-12, или вектор по п. 13, или клетку по п. 14, или фармацевтическую композицию по п. 15 и инструкцию по его применению.28. Kit for vaccination containing an artificial nucleic acid molecule according to any one of paragraphs. 1-12, or a vector according to claim 13, or a cell according to claim 14, or a pharmaceutical composition according to claim 15 and instructions for its use. 29. Набор для генной терапии, содержащий искусственную молекулу нуклеиновой кислоты по любому из пп. 1-12, или вектор по п. 13, или клетку по п. 14, или фармацевтическую композицию по п. 16 и инструкцию по его применению. 29. Set for gene therapy containing an artificial nucleic acid molecule according to any one of paragraphs. 1-12, or a vector according to claim 13, or a cell according to claim 14, or a pharmaceutical composition according to claim 16 and instructions for its use. 30. Набор по п. 28 или 29, который содержит адьювант, средства для трансфекции клетки, средства для введения фармацевтической композиции, фармацевтически приемлемый носитель и/или фармацевтически приемлемый раствор для растворения или разведения искусственной молекулы нуклеиновой кислоты, или вектора, или клеток, или фармацевтической композиции.30. The kit according to claim 28 or 29, which contains an adjuvant, a means for transfecting a cell, a means for administering a pharmaceutical composition, a pharmaceutically acceptable carrier and / or a pharmaceutically acceptable solution for dissolving or diluting an artificial nucleic acid molecule, or a vector, or cells, or pharmaceutical composition. 31. Применение 3’-UTR-элемента, содержащегося в молекуле искусственной нуклеиновой кислоты по любому из пп. 1-12 или в векторе по п. 13, для обеспечения высокой эффективности трансляции полипептида или пептида.31. The use of a 3'-UTR element contained in an artificial nucleic acid molecule according to any one of paragraphs. 1-12 or in the vector according to claim 13, to ensure high translation efficiency of the polypeptide or peptide.
RU2018110872A 2015-08-28 2016-08-22 Artificial nucleic acid molecules RU2772349C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EPPCT/EP2015/001755 2015-08-28
EP2015001755 2015-08-28
PCT/EP2016/001417 WO2017036580A1 (en) 2015-08-28 2016-08-22 Artificial nucleic acid molecules

Publications (3)

Publication Number Publication Date
RU2018110872A RU2018110872A (en) 2019-10-01
RU2018110872A3 RU2018110872A3 (en) 2020-07-24
RU2772349C2 true RU2772349C2 (en) 2022-05-19

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2660565C2 (en) * 2012-03-27 2018-07-06 Кьюрвак Аг Artificial nucleic acid molecules comprising 5'top utr

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2660565C2 (en) * 2012-03-27 2018-07-06 Кьюрвак Аг Artificial nucleic acid molecules comprising 5'top utr

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GAVIN S.WILKIE et al. Regulation of mRNA translation by 5′- and 3′-UTR-binding factors, 2003, Vol.28, N4, pp.182-188. КИМИССЕ М.Г. и др. Вклад консенсусной 5’-нетранслируемой области в эффективность трансляции гетерологичных генов в растительных клетках, Вестник Российского университета дружбы народов. Агрономия и животноводство, 2015, н.3, стр. 56-68. КОЧЕТОВ А.В. и др. Энхансеры трансляции для генной инженерии растений, Вавиловский журнал генетики и селекции, 2014, т.18, н.4/1, стр.610-617. ВОЛКОВА О.А. и др. Оценка трансляционной значимости характеристик нуклеотидной последовательности мРНК млекопитающих на основе данных рибосомного профилирования, Вавиловский журнал генетики и селекции, 2016, т.20, н.6, стр.779-786. *

Similar Documents

Publication Publication Date Title
JP7245878B2 (en) Artificial nucleic acid molecule
JP6997251B2 (en) Artificial nucleic acid molecule
AU2015373404B2 (en) Artificial nucleic acid molecules
EP3230458B1 (en) Artificial nucleic acid molecules for improved protein expression
JP6584414B2 (en) Artificial nucleic acid molecule
AU2014375402A1 (en) Artificial nucleic acid molecules
US11254951B2 (en) Artificial nucleic acid molecules
EP3090053B1 (en) Artificial nucleic acid molecules
RU2772349C2 (en) Artificial nucleic acid molecules
EP3415629A1 (en) Artificial nucleic acid molecules