EA044676B1 - NUCLEIC ACID CONSTRUCTION FOR GENE EXPRESSION IN VITRO AND IN VIVO - Google Patents

NUCLEIC ACID CONSTRUCTION FOR GENE EXPRESSION IN VITRO AND IN VIVO Download PDF

Info

Publication number
EA044676B1
EA044676B1 EA202091536 EA044676B1 EA 044676 B1 EA044676 B1 EA 044676B1 EA 202091536 EA202091536 EA 202091536 EA 044676 B1 EA044676 B1 EA 044676B1
Authority
EA
Eurasian Patent Office
Prior art keywords
gene
seq
dna
promoter
expression
Prior art date
Application number
EA202091536
Other languages
Russian (ru)
Inventor
Маргит Педерсен
Манос Пападакис
Original Assignee
Глюком А/С
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Глюком А/С filed Critical Глюком А/С
Publication of EA044676B1 publication Critical patent/EA044676B1/en

Links

Description

Область техники, к которой относится изобретениеField of technology to which the invention relates

Настоящее изобретение относится к области рекомбинантной продукции биологических молекул в клетках-хозяевах. Изобретение относится к нуклеотидным конструкциям, которые позволяют модифицировать экспрессию желаемого гена с использованием систем экспрессии генов как in vitro, так и in vivo. Эти конструкции могут преимущественно использоваться для получения множества биологических молекул рекомбинантным способом в промышленных масштабах, например олигосахаридов грудного молока (НМО).The present invention relates to the field of recombinant production of biological molecules in host cells. The invention relates to nucleotide constructs that allow modification of the expression of a desired gene using both in vitro and in vivo gene expression systems. These constructs can be advantageously used to produce a variety of biological molecules recombinantly on an industrial scale, such as human milk oligosaccharides (HMOs).

Уровень техникиState of the art

Коммерческая важность бактериальных клеток для получения рекомбинантных молекул возрастает. В настоящее время для продукции рекомбинантных белков в бактериальных хозяевах, в частности в Е.coli, в основном используются плазмидные системы экспрессии. Поскольку эти системы обеспечивают высокое содержание генного материала и хорошо известны, они стали широко распространенными, в том числе благодаря простоте доступных протоколов клонирования. Однако использование систем экспрессии на основе плазмид, особенно в производственных масштабах, также имеет ряд недостатков.The commercial importance of bacterial cells for the production of recombinant molecules is increasing. Currently, plasmid expression systems are mainly used for the production of recombinant proteins in bacterial hosts, in particular E. coli. Because these systems provide high gene content and are well known, they have become widespread, also due to the simplicity of the available cloning protocols. However, the use of plasmid-based expression systems, especially on a production scale, also has several disadvantages.

Плазмидные прокариотические системы экспрессии обычно характеризуются высоким числом копий плазмиды, например, до нескольких сотен на клетку. Экспрессионные плазмиды обычно несут представляющий интерес ген под контролем промотора, точку инициации репликации (ori) и маркерный ген для отбора клонов, несущих плазмиду. Кроме того, в указанных плазмидах (т.е. векторах) часто присутствуют кодирующие или некодирующие или нефункциональные каркасные последовательности. Присутствие плазмид и соответствующий механизм репликации изменяют метаболизм клетки-хозяина (DiazRizzi and Hernandez (2000), Crit. Rev. Biotechnol., 20(2):79-108) и налагают высокую метаболическую нагрузку на клетки, тем самым ограничивая их ресурсы для производства рекомбинантного белка. Кроме того, использование сильных промоторов в сочетании с высоким содержанием генного материала дают скорость образования рекомбинантного белка, которая обычно оказывается слишком высокой для клетки-хозяина, и поэтому может привести к быстрому и необратимому нарушению клеточного метаболизма. Следовательно, потенциал клеток-хозяев не может полностью использоваться в системах на основе плазмид, что приводит к низкому выходу и качеству рекомбинантного белка. Таким образом, один из основных недостатков систем экспрессии на основе плазмид может быть объяснен повышенной потребностью в питательных веществах и энергии, которая требуется для репликации и поддержания плазмид.Plasmid-based prokaryotic expression systems are typically characterized by high plasmid copy numbers, for example up to several hundred per cell. Expression plasmids typically carry a gene of interest under the control of a promoter, an origin of replication (ori), and a marker gene for selecting clones carrying the plasmid. In addition, these plasmids (ie vectors) often contain coding or non-coding or non-functional framework sequences. The presence of plasmids and the associated replication machinery alters host cell metabolism (DiazRizzi and Hernandez (2000), Crit. Rev. Biotechnol., 20(2):79-108) and imposes a high metabolic burden on cells, thereby limiting their resources for production recombinant protein. In addition, the use of strong promoters in combination with a high content of gene material gives a rate of recombinant protein production that is usually too high for the host cell, and therefore can lead to rapid and irreversible disruption of cellular metabolism. Consequently, the potential of host cells cannot be fully exploited in plasmid-based systems, resulting in low yield and quality of recombinant protein. Thus, one of the major disadvantages of plasmid-based expression systems can be attributed to the increased nutrient and energy requirements that are required for plasmid replication and maintenance.

Другим типичным явлением в системах на основе плазмид является изменение количества копий плазмиды в процессе культивирования. Продукция рекомбинантного белка при высоких скоростях экспрессии сопровождается голоданием и клеточным стрессом, которые приводят к увеличению пулов ненагруженных тРНК. Это приводит к вмешательству в механизм контроля количества копий плазмиды (PCN). В результате PCN быстро увеличивается и вызывает нарушение процесса культивирования (так называемый эффект убегания).Another common phenomenon in plasmid-based systems is the change in plasmid copy number during culture. Recombinant protein production at high expression rates is accompanied by starvation and cellular stress, which lead to an increase in pools of unloaded tRNA. This results in interference with the plasmid copy number (PCN) control mechanism. As a result, the PCN increases rapidly and causes disruption of the culture process (the so-called escape effect).

Сегрегационная нестабильность (т.е. появление не содержащих плазмиду клеток-хозяев) и структурная нестабильность (т.е. мутации в плазмидной последовательности) представляют собой дополнительные проблемы, часто наблюдаемые в системах на основе плазмид. Во время клеточного деления клетки могут терять плазмиду и, следовательно, также и представляющий интерес ген. Такая потеря плазмиды зависит от нескольких внешних факторов и усиливается с увеличением количества клеточных делений (поколений). Это означает, что ферментация на основе плазмид ограничена количеством поколений или удвоений клеток.Segregation instability (ie, the emergence of plasmid-free host cells) and structural instability (ie, mutations in the plasmid sequence) are additional problems often observed in plasmid-based systems. During cell division, cells may lose the plasmid and therefore also the gene of interest. This loss of plasmid depends on several external factors and increases with the number of cell divisions (generations). This means that plasmid-based fermentation is limited by the number of generations or cell doublings.

В целом эти свойства плазмидных экспрессионных систем лимитируют выход рекомбинантного белка и снижают управляемость и экономичность процесса.In general, these properties of plasmid expression systems limit the yield of recombinant protein and reduce the controllability and efficiency of the process.

В поиске эффективной альтернативы плазмидной экспрессии в WO 1996/40722, посвященном геномной экспрессии, описан способ, в котором используется интеграция кольцевого вектора (так называемого кольцевая ДНК-переносчик в хромосому, CTD), включающего селектируемый маркер, в бактериальную хромосому (т.е. в сайт attB E.coli)). В этом способе с использованием дуплицированных последовательностей ДНК, фланкирующих маркер селекции, была достигнута амплификация содержания хромосомного гена. Таким образом, полученное содержание хромосомного гена составляло приблизительно 15-40 копий на клетку, что было аналогично количеству, которое достигаются с традиционно используемыми плазмидными векторами. Культивирование клонов, содержащих ДНК-переносчик в хромосому, интегрированную в бактериальный геном, обеспечивало уровень рекомбинантных белков, аналогичный уровню, получаемому с помощью систем на основе плазмид (Olson et al., 1998). В этом способе требовалось in vitro лигирование CTD, и он относительно встраивания был ограничен сайтом attB.In the search for an effective alternative to plasmid expression, WO 1996/40722 on genomic expression describes a method that uses the integration of a circular vector (called a circular chromosomal transfer DNA, CTD) containing a selectable marker into a bacterial chromosome (i.e. to the site attB E. coli)). In this method, using duplicated DNA sequences flanking a selection marker, amplification of chromosomal gene content was achieved. Thus, the resulting chromosomal gene content was approximately 15-40 copies per cell, which was similar to the amount achieved with traditionally used plasmid vectors. Cultivation of clones containing carrier DNA into the chromosome integrated into the bacterial genome provided levels of recombinant proteins similar to those obtained using plasmid-based systems (Olson et al., 1998). This method required in vitro ligation of the CTD and was relatively restricted to the attB site for insertion.

Геномные системы экспрессии, по-видимому, имеют большой потенциал для обеспечения стабильной экспрессии рекомбинантных генов без маркеров селекции. Однако часто экспрессия рекомбинантного гена в промышленном масштабе достижима только путем увеличения содержания копий гена в хромосоме до уровня копийности плазмиды, так как одна копия гена не способна обеспечить экспрессию в промышленном масштабе. Кроме того, выбор сайта интеграции является проблемой, а регулирование экспрессии часто является сложным и/или не подходит для промышленного получения. Таким образом, не существует простой и эффективной бактериальной системы экспрессии на основе генома для проGenomic expression systems appear to have great potential for providing stable expression of recombinant genes without selection markers. However, often the expression of a recombinant gene on an industrial scale is achievable only by increasing the content of gene copies in the chromosome to the copy level of the plasmid, since one copy of the gene is not capable of ensuring expression on an industrial scale. In addition, selection of the integration site is a challenge, and regulation of expression is often complex and/or not suitable for industrial production. Thus, there is no simple and efficient genome-based bacterial expression system for pro

- 1 044676 мышленного получения рекомбинантных полипептидов.- 1 044676 industrial production of recombinant polypeptides.

Одним из подходов к преодолению проблемы недостаточного уровня продукции и комплексной регуляции бактериальной геномной экспрессии гетерологичных полипептидов является использование сильных индуцибельных промоторов для контроля транскрипции встроенных рекомбинантных генов. Был описан ряд различных индуцибельных промоторов. Например, промоторы, индуцируемые высокой температурой, такие как λPR and λPL, истощением по триптофану, такой как tip, 1-арабинозой, такая как araBAD, маннитом, такой как mtsE, фосфатным голоданием, такой как phoA, налидиксовой кислотой, такой как recA осмолярностью, такой как proU, истощением глюкозы, такой как cst-1, тетрациклином, такой как tetA, pH, такой как cadA, анаэробными условиями, такой как nar, инфекцией Т4, такой как ген 32 фага Т4, алкил- или галогенбензоатами, такой как Pm, алкил- или галогентолуолами, такой как Pu, салицилатами, такой как Psal, и кислородом, такой как VHb, все были исследованы в качестве альтернативы индуцируемым IPTG промоторам (см., например, Makrides, S.C. (1996), Microbiol. Rev., 60, 512-538; Hannig G. & Makrides, S.C. (1998), TIBTECH, 16, 54-60; Stevens, R.C. (2000), Structures, 8, R177-R185; Hoffmann J. & Altenbuchner J. (2015), PLoS One, 10(7):e0133248; J. Sanchez-Romero & V. De Lorenzo, Genetic Engineering of Nonpathogenic Pseudomonas strains as Biocatalysts for Industrial and Environmental Processes, in Manual of Industrial Microbiology and Biotechnology (A. Demain & J. Davies, eds.), p. 460-74 (1999) (ASM Press, Washington, D.C.); H. Schweizer, Vectors to express foreign genes and techniques to monitor gene expression for Pseudomonads, Current Opinion in Biotechnology, 12:439-445 (2001); R. Slater & R. Williams, The Expression of Foreign DNA in Bacteria, in Molecular Biology and Biotechnology (J. Walker & R. Rapley, eds.), p. 125-54 (2000) (The Royal Society of Chemistry, Cambridge, UK). Однако у этих индуцибельных промоторов есть ряд проблем, такие как высокотемпературная индукция, которая вредна для клеток и со временем может оказаться непрактичной для крупномасштабной ферментации из-за ограничений оборудования; манипуляции с кислородом могут влиять на общую динамику аспектов плотности роста клеток в процессе ферментации, снижая идеальные условия; использование толуолов или других подобных типов потенциально токсичных химических веществ может потребовать дополнительной очистки, чтобы гарантировать, что эти соединения не присутствуют в конечном продукте; а рН может влиять на способность представляющего интерес пептида правильно сворачиваться или растворяться в клетке-хозяине, что делает очистку более дорогостоящей и трудоемкой, что делает плазмидные системы экспрессии по-прежнему предпочтительным выбором в случае промышленного производства.One approach to overcoming the problem of insufficient production and complex regulation of bacterial genomic expression of heterologous polypeptides is the use of strong inducible promoters to control the transcription of integrated recombinant genes. A number of different inducible promoters have been described. For example, promoters inducible by heat such as λP R and λP L , tryptophan depletion such as tip, l -arabinose such as araBAD, mannitol such as mtsE, phosphate starvation such as phoA, nalidixic acid such as recA osmolarity such as proU, glucose depletion such as cst-1, tetracycline such as tetA, pH such as cadA, anaerobic conditions such as nar, T4 infection such as T4 phage gene 32, alkyl or halogen benzoates, such as Pm, alkyl or halotoluenes such as Pu, salicylates such as Psal, and oxygen such as VHb have all been explored as alternatives to IPTG inducible promoters (see, for example, Makrides, SC (1996), Microbiol. Rev., 60, 512-538; Hannig G. & Makrides, S. C. (1998), TIBTECH, 16, 54-60; Stevens, R. C. (2000), Structures, 8, R177-R185; Hoffmann J. & Altenbuchner J. (2015), PLoS One, 10(7):e0133248; J. Sanchez-Romero & V. De Lorenzo, Genetic Engineering of Nonpathogenic Pseudomonas strains as Biocatalysts for Industrial and Environmental Processes, in Manual of Industrial Microbiology and Biotechnology (A. Demain & J. Davies, eds.), p. 460-74 (1999) (ASM Press, Washington, DC); H. Schweizer, Vectors to express foreign genes and techniques to monitor gene expression for Pseudomonas, Current Opinion in Biotechnology, 12:439-445 (2001); R. Slater & R. Williams, The Expression of Foreign DNA in Bacteria, in Molecular Biology and Biotechnology (J. Walker & R. Rapley, eds.), p. 125-54 (2000) (The Royal Society of Chemistry, Cambridge, UK). However, these inducible promoters have a number of problems, such as high temperature induction, which is harmful to cells and may eventually become impractical for large-scale fermentation due to equipment limitations; manipulation of oxygen can affect the overall dynamics of aspects of cell growth density during fermentation, reducing ideal conditions; the use of toluenes or other similar types of potentially toxic chemicals may require additional purification to ensure that these compounds are not present in the final product; and pH can affect the ability of the peptide of interest to fold correctly or dissolve in the host cell, making purification more costly and time-consuming, making plasmid expression systems still the preferred choice for industrial production.

Регуляция активности промотора источником углерода, вероятно, является наиболее привлекательным вариантом для контроля экспрессии целевого полипептида в промышленных условиях. Для этого есть несколько причин, например, более эффективное использование источника углерода и снижение длительных метаболических стрессов у клетки-хозяина. Однако в настоящее время выбор таких промоторов довольно ограничен, и большинство из них были адаптированы для плазмидной экспрессии (Terpe K. Appl. Microbiol. Biotechnol. (2006), 72:211-222). Однако геном бактериальной клетки, например E.coli, содержит тысячи промоторов, и многие из них регулируются изменениями в источнике углерода, что позволяет наличию углерода в окружающей среде влиять на характер экспрессии генов, находящихся под их контролем. Было высказано предположение, что глобальный регулятор транскрипции, cAMP-CRP, который формируется при снижении уровня глюкозы, регулирует как минимум 378 промоторов в бактериальной клетке (Shimada Т. et al., PloS One, 6(6):e20081 (2011)), однако нет данных, которые позволили бы предположить, какие из этих промоторов являются мощными, способными обеспечивать стабильную контролируемую геномную продукцию рекомбинантных полипептидов с высоким выходом в промышленных условиях.Regulation of promoter activity by a carbon source is probably the most attractive option for controlling the expression of a target polypeptide in an industrial setting. There are several reasons for this, such as more efficient use of the carbon source and reduction of long-term metabolic stress on the host cell. However, at present the choice of such promoters is quite limited, and most of them have been adapted for plasmid expression (Terpe K. Appl. Microbiol. Biotechnol. (2006), 72:211-222). However, the genome of a bacterial cell such as E. coli contains thousands of promoters, and many of them are regulated by changes in the carbon source, allowing the availability of carbon in the environment to influence the expression patterns of the genes under their control. It has been suggested that the global transcriptional regulator, cAMP-CRP, which is formed when glucose levels decrease, regulates at least 378 promoters in the bacterial cell (Shimada T. et al., PloS One, 6(6):e20081 (2011)), however, there is no data to suggest which of these promoters are powerful, capable of ensuring stable, controlled genomic production of recombinant polypeptides in high yield under industrial conditions.

Дыхательный метаболизм глицерина в Escherichia coli (E.coli) контролируется 12 генами, организованными в 5 glp-оперонов: glpFKX, glpABC, glpTQ, glpD и PglpEGR. Гены оперона glpFKX кодируют посредник диффузии глицерина, глицеринкиназу и фруктозо-1,6-бисфосфатазу. Ген оперона glpABC кодирует субъединицы анаэробной глицерин-3-фосфат дегидрогеназы - А, В и С. Гены оперона glpTQ кодируют носитель глицерин-3-фосфата и глицерофосфодиэстеразу. Ген glpD кодирует аэробную глицерин-3-фосфат дегидрогеназу. Ген glpR кодирует транскрипционный репрессор GlpR, glpE - тиосульфатсульфуртрансферазу, a glpG - сериновую протеазу. Транскрипция генов каждого из glp-оперонов контролируется промоторами pglpFKX, pglpABC, pglpTQ, pglpD и pglpEGR соответственно, активность которых строго катаболически регулируется (Larson T.J. et al. (1987), Biol. Chem., 262:15869-74; Zhao N. et al. (1994), J. Bacteriol., 176:2393-239). Недавно Selivano L. с соавт. (Microb. Cell Fact., 15:28 (2016)) в поисках новых промоторов, подходящих для экспрессии рекомбинантных генов, протестировали glp-промотор, pglpQ, из Streptomyces coelicolor в бактериальной плазмидной системе экспрессии, однако этот промотор продемонстрировал довольно низкую активность и поэтому был исключен из перспективных кандидатов для промышленного применения.Respiratory glycerol metabolism in Escherichia coli (E. coli) is controlled by 12 genes organized into 5 glp operons: glpFKX, glpABC, glpTQ, glpD, and PglpEGR. The glpFKX operon genes encode glycerol diffusion mediator, glycerol kinase, and fructose 1,6-bisphosphatase. The glpABC operon gene encodes the subunits of anaerobic glycerol-3-phosphate dehydrogenase - A, B and C. The glpTQ operon genes encode the glycerol-3-phosphate carrier and glycerophosphodiesterase. The glpD gene encodes an aerobic glycerol-3-phosphate dehydrogenase. The glpR gene encodes the transcriptional repressor GlpR, glpE a thiosulfate sulfur transferase, and glpG a serine protease. Transcription of the genes of each of the glp operons is controlled by the promoters pglpFKX, pglpABC, pglpTQ, pglpD and pglpEGR, respectively, the activity of which is strictly catabolically regulated (Larson T.J. et al. (1987), Biol. Chem., 262:15869-74; Zhao N. et al. al (1994), J. Bacteriol., 176:2393-239). Recently, Selivano L. et al. (Microb. Cell Fact., 15:28 (2016)) in search of new promoters suitable for the expression of recombinant genes, tested the glp promoter, pglpQ, from Streptomyces coelicolor in a bacterial plasmid expression system, however, this promoter showed rather low activity and therefore was excluded as a promising candidate for industrial application.

Сущность изобретенияThe essence of the invention

Первый аспект изобретения относится к нуклеотидной конструкции, содержащей синтетическую некодирующую последовательность ДНК (i), которая содержит первый фрагмент ДНК и второй фрагмент ДНК, где первый фрагмент ДНК представляет собой последовательность ДНК, полученную из 5'-нетранслируемой области (5'-UTR) glp-гена из Escherichia coli, а второй фрагмент ДНК представляет соA first aspect of the invention relates to a nucleotide construct comprising a synthetic non-coding DNA sequence (i) which comprises a first DNA fragment and a second DNA fragment, wherein the first DNA fragment is a DNA sequence derived from the 5' untranslated region (5'-UTR) of glp -gene from Escherichia coli, and the second DNA fragment represents

- 2 044676 бой ДНК-последовательность CAAGGAGGAAACAGCT (SEQ ID NO: 10) или вариант указанной последовательности, и где первый фрагмент расположен перед вторым фрагментом. В частности, изобретения относятся к нуклеотидной конструкции, содержащей три функционально связанных ДНК-последовательности: промоторную ДНК-последовательность (ii), синтетическую некодирующую ДНК-последовательность, содержащую сайт связывания рибосомы (RBS) (i), и кодирующую ДНК-последовательность (iii). Предпочтительно первый фрагмент ДНК происходит из ДНК-последовательности 5'UTR генов glpF, glpA или glpD и содержал первые 5-65 последовательных нуклеотидов после сайта инициации транскрипции в промоторах glpF, glpA или glpD. В одном предпочтительном варианте промоторная ДНК-последовательность (ii) соответствует ДНК-последовательности из промотора glp-оперона из Escherichia coli (E.coli), например из оперонов glpFKX, glpABC, glpTQ или glpD.- 2 044676 combat DNA sequence CAAGGAGGAAACAGCT (SEQ ID NO: 10) or a variant of the specified sequence, and where the first fragment is located before the second fragment. In particular, the inventions relate to a nucleotide construct containing three operably linked DNA sequences: a promoter DNA sequence (ii), a synthetic non-coding DNA sequence containing a ribosome binding site (RBS) (i), and a coding DNA sequence (iii) . Preferably, the first DNA fragment is derived from the 5'UTR DNA sequence of the glpF, glpA or glpD genes and contains the first 5-65 consecutive nucleotides after the transcription start site in the glpF, glpA or glpD promoters. In one preferred embodiment, the promoter DNA sequence (ii) corresponds to a DNA sequence from the glp operon promoter from Escherichia coli (E. coli), for example from the glpFKX, glpABC, glpTQ or glpD operons.

Во втором аспекте изобретение относится к рекомбинантной клетке, предпочтительно бактериальной рекомбинантной клетке, содержащей нуклеотидную конструкцию по изобретению.In a second aspect, the invention relates to a recombinant cell, preferably a bacterial recombinant cell, containing a nucleotide construct of the invention.

В третьем аспекте изобретение относится к системе экспрессии, содержащей конструкцию по изобретению или рекомбинантную клетку по изобретению.In a third aspect, the invention relates to an expression system comprising a construct of the invention or a recombinant cell of the invention.

В четвертом аспекте изобретение относится к способу получения одной или более биологических молекул, например белка, нуклеиновой кислоты, олигосахарида и т.п., с использованием конструкции по изобретению и/или рекомбинантной клетки по изобретению.In a fourth aspect, the invention relates to a method for producing one or more biological molecules, eg, a protein, nucleic acid, oligosaccharide, etc., using a construct of the invention and/or a recombinant cell of the invention.

Эти и другие аспекты изобретения подробно описаны ниже.These and other aspects of the invention are described in detail below.

Краткое описание чертежейBrief description of drawings

На фиг. 1 представлены (А) уровни экспрессии репортерного гена (lacZ) с нуклеотидных конструкций, содержащих семнадцать различных промоторных элементов, объединенных с SEQ ID NO: 10; каждая экспрессионная кассета, содержащая один промотор, также содержит нативную 5'UTR-последовательность (после промотора и перед SEQ ID NO: 10) из гена, который в природе транскрибируется с промотора конструкции;In fig. 1 shows (A) expression levels of a reporter gene (lacZ) from nucleotide constructs containing seventeen different promoter elements combined with SEQ ID NO: 10; each expression cassette containing one promoter also contains a native 5'UTR sequence (after the promoter and before SEQ ID NO: 10) from a gene that is naturally transcribed from the promoter construct;

(В) уровни экспрессии lacZ с экспрессионных кассет (А), содержащих выбранные промоторы PglpT, PglpA и PglpF (заштрихованные столбики; b) по сравнению с уровнями экспрессии lacZ с экспрессионных кассет, содержащих промотор и ДНК-фрагмент исходной 5'UTR соответствующего гена, т.е. glpT, glpA и glpF (незаштрихованные столбики; а).(B) lacZ expression levels from expression cassettes (A) containing selected promoters PglpT, PglpA and PglpF (shaded bars; b) compared with lacZ expression levels from expression cassettes containing the promoter and a DNA fragment of the original 5'UTR of the corresponding gene, those. glpT, glpA and glpF (open bars; a).

Данные показывают уровень активности экспрессированной β-галактозидазы в клетках-хозяевах. Активность измеряли в единицах Миллера (ед./OD/мл/мин).Data show the level of expressed β-galactosidase activity in host cells. Activity was measured in Miller units (units/OD/ml/min).

На фиг. 2 представлены (A) схематическое изображение варианта осуществления нуклеотидной конструкции по изобретению;In fig. 2 shows (A) a schematic representation of an embodiment of a nucleotide construct according to the invention;

(B) конструкция нуклеиновой кислоты по изобретению, содержащая ДНК-последовательность промотора glpF (SEQ ID NO: 54), синтетическую ДНК (i), содержащую SEQ ID NO: 36 и SEQ ID NO: 10.(B) a nucleic acid construct of the invention comprising a glpF promoter DNA sequence (SEQ ID NO: 54), synthetic DNA (i) comprising SEQ ID NO: 36 and SEQ ID NO: 10.

Указаны следующие структурные особенности:The following structural features are indicated:

сайт инициации транскрипции в положении +1 выделен полужирным шрифтом;the transcription initiation site at position +1 is shown in bold;

сайт связывания РНК-полимеразы, содержащий боксы -10 и -35, выделен полужирным шрифтом;the RNA polymerase binding site containing boxes -10 and -35 is shown in bold;

четыре операторных сайта, OR1, OR2, OR3 и OR4, для связывания белка-репрессора транскрипции GlpR выделены серым цветом;four operator sites, OR1, OR2, OR3 and OR4, for binding the transcriptional repressor protein GlpR are highlighted in gray;

два операторных сайта, CRP1 и CRP2, для связывания белка-активатора транскрипции CRP выделены рамкой;two operator sites, CRP1 and CRP2, for binding the transcription activator protein CRP are highlighted with a frame;

синтетическая ДНК-последовательность, включающая 54-нуклеотидный фрагмент 5'UTR гена glpF (выделены пунктирной рамкой) (SEQ ID NO: 36) и SEQ ID NO: 10 (подчеркнуты).a synthetic DNA sequence comprising a 54-nucleotide fragment of the 5'UTR of the glpF gene (in dotted frame) (SEQ ID NO: 36) and SEQ ID NO: 10 (underlined).

На фиг. 3 схематически представлена структура glp-промоторов (A) PglpA, (В) PglpD, (С) PglpF и (D) PglpT.In fig. Figure 3 schematically shows the structure of glp promoters (A) PglpA, (B) PglpD, (C) PglpF and (D) PglpT.

Относительное положение областей -35 и -10, распознаваемых РНК-полимеразой, показано черными прямоугольниками. Относительное положение сайтов связывания cAMP-CRP, GlpR, FNR и FIS, участвующих в транскрипционной регуляции промоторных элементов, указаны маленькими пустыми стрелками; относительное положение 16-нуклеотидного фрагмента 5'UTR, содержащего сайт связывания рибосомы (SD), указано маленькими закрашенными стрелками.The relative positions of the -35 and -10 regions recognized by RNA polymerase are shown as black boxes. The relative positions of cAMP-CRP, GlpR, FNR, and FIS binding sites involved in transcriptional regulation of promoter elements are indicated by small empty arrows; the relative position of the 16-nucleotide fragment of the 5′UTR containing the ribosome binding site (SD) is indicated by small filled arrows.

На фиг. 4 представлены данные, демонстрирующие уровень экспрессии гена lacZ, экспрессируемого в Е.coli, с одной копии интегрированной в геном экспрессионной кассеты, содержащей (a) фрагменты ДНК, соответствующие исходным промоторным последовательностям glpF, glpA или glpT, и ДНК-фрагментам 5'UTR из glpF, glpA или glpT, содержащим (нативный) сайт связывания рибосомы (RSB) (SEQ ID NO: 57, 56 и 55 соответственно) (незаштрихованные столбики);In fig. 4 presents data demonstrating the level of expression of the lacZ gene expressed in E. coli from one copy of a genome-integrated expression cassette containing (a) DNA fragments corresponding to the original glpF, glpA or glpT promoter sequences, and DNA fragments of the 5'UTR from glpF, glpA or glpT containing a (native) ribosome binding site (RSB) (SEQ ID NO: 57, 56 and 55, respectively) (open bars);

(b) фрагменты ДНК, содержащие исходные промоторные последовательности glpF, glpA или glpT, и ДНК-фрагменты 5'UTR из исходных glpF, glpA или glpT, в которых отсутствует нативный RBS (SEQ ID NO: 1, 2 и 4, соответственно), но связанные с SEQ ID NO: 10 (заштрихованные столбики);(b) DNA fragments containing the original glpF, glpA or glpT promoter sequences, and 5'UTR DNA fragments from the original glpF, glpA or glpT that lack the native RBS (SEQ ID NO: 1, 2 and 4, respectively), but associated with SEQ ID NO: 10 (shaded bars);

(c) фрагменты ДНК, содержащие исходные промоторные последовательности glpF, glpA или glpT (SEQ ID NO: 54, 48 и 49 соответственно), (каждая) функционально связанная с 54-нуклеотидным ДНК-фрагментом 5'UTR из glpF (SEQ ID NO: 36) и далее связанная с SEQ ID NO: 10 (заштрихованные(c) DNA fragments containing the original promoter sequences of glpF, glpA or glpT (SEQ ID NO: 54, 48 and 49, respectively), (each) operably linked to a 54 nucleotide DNA fragment of the 5'UTR of glpF (SEQ ID NO: 36) and further associated with SEQ ID NO: 10 (shaded

- 3 044676 крестиком столбики).- 3 044676 cross stitches).

Данные показывают уровень активности экспрессированной β-галактозидазы в клетках-хозяевах. Активность измеряют в единицах Миллера (ед./OD/мл/мин).Data show the level of expressed β-galactosidase activity in host cells. Activity is measured in Miller units (units/OD/ml/min).

На фиг. 5 представлены данные, демонстрирующие катаболическую репрессию PglpF (SEQ ID NO: 12), когда он функционально связан с репортерным геном lacZ, интегрированным (в единственной копии) в геном Е.coli. Активность β-галактозидазы измеряли после роста в различных средах, таких как LB с глюкозой или без нее, минимальная среда, содержащая глицерин, сорбит, мальтозу или глюкозу. Активность β-галактозидазы измеряют в единицах Миллера (единицы ONPG, конвертированные на OD600 на мл/мин).In fig. 5 shows data demonstrating catabolic repression of PglpF (SEQ ID NO: 12) when operably linked to the lacZ reporter gene integrated (in a single copy) into the E. coli genome. β-Galactosidase activity was measured after growth in various media such as LB with or without glucose, minimal medium containing glycerol, sorbitol, maltose or glucose. β-Galactosidase activity is measured in Miller units (ONPG units converted to OD 600 per ml/min).

На фиг. 6 показан уровень экспрессии lacZ из интегрированной в геном одной копии экспрессионной кассеты, содержащей либо промоторную последовательность glpF или glpT (SEQ ID NO: 54, либо SEQ ID NO: 50), 54-нуклеотидный фрагмент glpF-5'UTR (SEQ ID NO: 36) и SEQ ID NO: 10 или следующие ее варианты:In fig. 6 shows the level of lacZ expression from a single-copy expression cassette integrated into the genome containing either the glpF or glpT promoter sequence (SEQ ID NO: 54 or SEQ ID NO: 50), a 54-nucleotide fragment of glpF-5'UTR (SEQ ID NO: 36) and SEQ ID NO: 10 or the following variants:

(А) варианты SEQ ID NO: 10;(A) Variants SEQ ID NO: 10;

(В) измерения активности β-галактозидазы (репортерный ген экспрессируется с конструкций, содержащих 10 вариантов SEQ ID NO: 10, которые имеют модифицированный RBS. Активность β-галактозидазы измеряется в единицах Миллера (единицы ONPG, конвертированные на OD600 на мл/мин).(B) measurements of β-galactosidase activity (the reporter gene is expressed from constructs containing 10 variants of SEQ ID NO: 10 that have a modified RBS. β-galactosidase activity is measured in Miller units (ONPG units converted to OD 600 per ml/min) .

На фиг. 7 показано влияние на экспрессию lacZ (измеренную как уровень активности β-галактозидазы) после модификации области -10 промотора glpF. Семь различных конструкций, содержащих промотор glpF (SEQ ID NO: 12) и его варианты (PglpF_19, PglpF_20, PglpF_17, PglpF_11, PglpF_13 или PglpF_9), были функционально связаны с lacZ и встроены (в единственной копии) в геном Е.coli, и активность репортерного гена, lacZ, оценивали как уровень активности β-галактозидазы, измеренной в единицах Миллера (единицы ONPG, конвертированные на OD600 на мл/мин). Все конструкции содержат SEQ ID NO: 10.In fig. Figure 7 shows the effect on lacZ expression (measured as the level of β-galactosidase activity) after modification of the -10 region of the glpF promoter. Seven different constructs containing the glpF promoter (SEQ ID NO: 12) and its variants (PglpF_19, PglpF_20, PglpF_17, PglpF_11, PglpF_13 or PglpF_9) were functionally linked to lacZ and inserted (in a single copy) into the E. coli genome, and activity of the reporter gene, lacZ, was assessed as the level of β-galactosidase activity measured in Miller units (ONPG units converted to OD600 per ml/min). All designs contain SEQ ID NO: 10.

На фиг. 8 показано влияние укорачивания 5'-конца последовательности glpF на экспрессию гена lacZ. Укороченные варианты промотора glpF (SEQ ID NO: 54) (последовательность промотора была укорочена на 15, 140, 165 или 180 пар оснований с 5'-конца) функционально связаны с lacZ и экспрессируются с одной копии, встроенной в геном Е.coli. Все конструкции содержат 54-нуклеотидный фрагмент glpF-5'UTR (SEQ ID NO: 36) и SEQ ID NO: 10. Активность β-галактозидазы определяют в единицах Миллера (единицы ONPG, конвертированные на OD600 на мл/мин).In fig. Figure 8 shows the effect of shortening the 5' end of the glpF sequence on the expression of the lacZ gene. Truncated variants of the glpF promoter (SEQ ID NO: 54) (the promoter sequence was truncated by 15, 140, 165 or 180 base pairs from the 5' end) are functionally linked to lacZ and are expressed from a single copy integrated into the E. coli genome. All constructs contain the 54 nucleotide fragment glpF-5'UTR (SEQ ID NO: 36) and SEQ ID NO: 10. β-Galactosidase activity is determined in Miller units (ONPG units converted to OD 600 per ml/min).

На фиг. 9 показано влияние на уровень активности β-галактозидазы после разрушения гена glpR в клетке-хозяине с конструкции, содержащей lacZ, функционально связанный с промотором glpF (SEQ ID NO: 54, связанная с 54-нуклеотидным фрагментом glpF-5. UTR (SEQ ID NO: 36) и SEQ ID NO: 10. Активность β-галактозидазы измеряют в клетках, экспрессирующих белок-репрессор транскрипции, GlpR (т.е. содержащих нативный ген glpR), и в клетках, где ген был разрушен введением kanR (т.е. в клетки с низкой экспрессией или без экспрессии GlpR). Активность β-галактозидазы определяют в единицах Миллера (единицы ONPG, конвертированные на OD600 на мл/мин).In fig. Figure 9 shows the effect on the level of β-galactosidase activity after disruption of the glpR gene in a host cell from a construct containing lacZ operably linked to the glpF promoter (SEQ ID NO: 54, linked to a 54-nucleotide fragment of glpF-5. UTR (SEQ ID NO : 36) and SEQ ID NO: 10. β-Galactosidase activity is measured in cells expressing the transcriptional repressor protein, GlpR (i.e., containing the native glpR gene), and in cells where the gene has been disrupted by introduction of kanR (i.e. into cells with low or no GlpR expression.) β-Galactosidase activity is determined in Miller units (ONPG units converted to OD 600 per ml/min).

На фиг. 10 показаны результаты экспрессии гетерологичных генов в Е.coli, экспрессируемых с ДНК-конструкций либо под lac-промотором (Plac; серые кружки), либо glpF-промотором (PglpF; черные кружки), вставленными в виде единичных копий в геном Е.coli. Все конструкции содержат SEQ ID NO: 10 и нативные 5rUTR-фрагменты без RBS из соответствующих генов.In fig. 10 shows the results of expression of heterologous genes in E. coli expressed from DNA constructs either under the lac promoter (Plac; gray circles) or the glpF promoter (PglpF; black circles) inserted as single copies into the E. coli genome. All constructs contain SEQ ID NO: 10 and native 5 r UTR fragments without RBS from the corresponding genes.

(A) Продукция 6'-сиалиллактозы (6'SL), оцененная в неочищенных экстрактах клеток, экспрессирующих а-2,6-сиалилтрансферазу Pd2 (из Photobacterium damselae JT0160).(A) 6′-sialyllactose (6′SL) production assessed in crude extracts of cells expressing α-2,6-sialyltransferase Pd2 (from Photobacterium damselae JT0160).

(B) Продукция 3'-сиаллиллактозы (3'SL), оцененная в неочищенных экстрактах клеток, экспрессирующих а-2,3-сиалилтрансферазу NST (из Neisseria meningitides MC58).(B) 3′-Siallyllactose (3′SL) production assessed in crude extracts of cells expressing the α-2,3-sialyltransferase NST (from Neisseria meningitides MC58).

Активность сиалилтрансферазы измеряется как продукция в мМ/ч. На фиг. 11 показаны уровни экспрессии lacZ под контролем промоторов lac, glpF, glpA или glpT с мультикопийной плазмиды, содержащей одну копию соответствующей экспрессионной кассеты. Каждая из экспрессионных кассет содержит SEQ ID NO: 10 и нативные 5'UTR-фрагменты без RBS из соответствующих генов (т.е. glpF, glpA, glpT или lacZ соответственно). Активность β-галактозидазы измеряют после роста в различных средах, такие как LB с глюкозой или без нее (затемненные или закрашенные столбики, соответственно) в единицах Миллера (единицы ONPG, конвертированные на OD600 на мл/мин).Sialyltransferase activity is measured as production in mM/h. In fig. 11 shows the levels of expression of lacZ under the control of the lac, glpF, glpA or glpT promoters from a multicopy plasmid containing one copy of the corresponding expression cassette. Each of the expression cassettes contains SEQ ID NO: 10 and native 5'UTR fragments without RBS from the corresponding genes (ie glpF, glpA, glpT or lacZ, respectively). β-Galactosidase activity is measured after growth in various media, such as LB with or without glucose (shaded or filled bars, respectively) in Miller units (ONPG units converted to OD 600 per ml/min).

На фиг. 12 показаны результаты продукции LNnT в рекомбинантных Е.coli, экспрессирующих гетерологичные гены galT и lgtA, под контролем либо промотора Plac, либо PglpF (обе экспрессионные кассеты содержат SEQ ID NO: 10 и нативные 5rUTR-фрагменты без RBS из lacZ или glpF соответственно).In fig. 12 shows the results of LNnT production in recombinant E. coli expressing heterologous galT and lgtA genes under the control of either the Plac or PglpF promoter (both expression cassettes contain SEQ ID NO: 10 and native 5 r UTR fragments without RBS from lacZ or glpF, respectively ).

(A) MDO1 экспрессирует galT и lgtA с Plac в плазмиде с высоким и средним числом копий соответственно. МР1497 экспрессирует lgtA с одной хромосомной копии гена с использованием PglpF и galT в плазмиде с высоким числом копий с использованием Plac. MP1499 экспрессирует galT с одной копии хромосомного гена с использованием PglpF и lgtA в плазмиде со средним числом копий с использованием Plac.(A) MDO1 expresses galT and lgtA with Plac in a high- and medium-copy number plasmid, respectively. MP1497 expresses lgtA from one chromosomal copy of the gene using PglpF and galT in a high copy number plasmid using Plac. MP1499 expresses galT from a single copy of the chromosomal gene using PglpF and lgtA in a mid-copy number plasmid using Plac.

(В) МР2622 и МР166 экспрессируют lgtA и galT с одной или трех интегрированных в хромосому копий генов, соответственно, с использованием Plac; MP1825 экспрессирует lgtA и lgtA с одиночных хромосомных копий с использованием PglpF.(B) MP2622 and MP166 express lgtA and galT from one or three chromosomally integrated gene copies, respectively, using Plac; MP1825 expresses lgtA and lgtA from single chromosomal copies using PglpF.

- 4 044676- 4 044676

На фиг. 13 показаны результаты продукции LNT в рекомбинантных E.coli, экспрессирующих гетерологичные гены galTK и lgtA под контролем либо Plac, либо PglpF (обе экспрессионные кассеты содержат SEQ ID NO: 10 и лишенные RBS нативные 5rUTR-фрагменты из lacZ или glpF соответственно).In fig. 13 shows the results of LNT production in recombinant E. coli expressing heterologous galTK and lgtA genes under the control of either Plac or PglpF (both expression cassettes containing SEQ ID NO: 10 and RBS-less native 5 r UTR fragments from lacZ or glpF, respectively).

(A) MDO15 экспрессирует galTK и lgtA под контролем Plac в плазмидах с высоким и средним числом копий соответственно. МР1498 экспрессирует lgtA с одной встроенной в хромосому копии гена с использованием PglpF и galTK в высококопийной плазмиде с использованием Plac. MP1655 экспрессирует galTK с двух хромосомных копий гена с использованием PglpF, и lgtA в плазмиде со средним числом копий с использованием Plac.(A) MDO15 expresses galTK and lgtA under the control of Plac in high- and medium-copy number plasmids, respectively. MP1498 expresses lgtA with one chromosomally integrated copy of the gene using PglpF and galTK in a high copy plasmid using Plac. MP1655 expresses galTK from two chromosomal copies of the gene using PglpF, and lgtA in a mid-copy number plasmid using Plac.

(В) МР245 экспрессирует 3 и 2 встроенные в хромосому копии геннов lgtA и galTK, соответственно, с использованием Plac; MP1920 экспрессирует lgtA и galTK с одиночных встроенных в хромосому копий генов с использованием PglpF.(B) MP245 expresses 3 and 2 chromosomally integrated copies of the lgtA and galTK genes, respectively, using Plac; MP1920 expresses lgtA and galTK from single chromosomally integrated gene copies using PglpF.

На фиг. 14 показаны результаты продукции LNFP-I в рекомбинантных Е.coli, экспрессирующих гетерологичные гены galTK, lgtA и futC под контролем PglpF. MP2239 и МР2374 экспрессируют lgtA, galTK и futC с одиночных встроенных в хромосому копий генов с использованием PglpF. Кроме того, МР2374 содержит дополнительную копию генов колановой кислоты gmd, wcaJ (fcI), wcaH (gmm), wcaI, cpsB (manC) и cpsG (manB), которые все экспрессируются под контролем PglpF. Экспрессионные кассеты содержат SEQ ID NO: 10 и нативный лишенный RBS 5rUTR-фрагмент из glpF.In fig. 14 shows the results of LNFP-I production in recombinant E. coli expressing heterologous galTK, lgtA and futC genes under the control of PglpF. MP2239 and MP2374 express lgtA, galTK, and futC from single chromosomally integrated gene copies using PglpF. In addition, MP2374 contains an additional copy of the colanic acid genes gmd, wcaJ (fcI), wcaH (gmm), wcaI, cpsB (manC), and cpsG (manB), which are all expressed under the control of PglpF. The expression cassettes contain SEQ ID NO: 10 and a native RBS 5 r -less UTR fragment from glpF.

На фиг. 15 показаны результаты продукции 3'SL в рекомбинантных Е.coli, экспрессирующих гетерологичные гены nst, neuA, neuB и neuC. MAP425 экспрессирует 2 хромосомно интегрированные копии nst, а также neuA, neuB и neuC с высококопийной плазмиды с использованием Plac. MAP1214 экспрессирует nst, neuA, neuB и neuC с одной хромосомной копии гена с использованием PglpF. Экспрессионные кассеты содержат SEQ ID NO: 10 и нативные лишенные RBS 5rUTR-фрагменты из lacZ или glpF соответственно.In fig. 15 shows the results of 3'SL production in recombinant E. coli expressing heterologous nst, neuA, neuB and neuC genes. MAP425 expresses 2 chromosomally integrated copies of nst as well as neuA, neuB and neuC from a high copy number plasmid using Plac. MAP1214 expresses nst, neuA, neuB, and neuC from a single chromosomal copy of the gene using PglpF. Expression cassettes contain SEQ ID NO: 10 and native RBS 5 r -less UTR fragments from lacZ or glpF, respectively.

На фиг. 16 показаны результаты продукции 6'SL в модифицированных Е.coli, экспрессирующих гетерологичные гены Pd2, neuA, neuB и neuC. MAP265 экспрессирует одну хромосомную копию Pd2, а также neuA, neuB и neuC с высококопийной плазмиды с использованием Plac. MAP1200 экспрессирует Pd2, neuA, neuB и neuC с одной хромосомной копии гена с использованием PglpF. Экспрессионные кассеты содержат SEQ ID NO: 10 и нативные лишенные RBS 5rUTR-фрагменты из lacZ или glpF соответственно.In fig. 16 shows the results of 6'SL production in modified E. coli expressing the heterologous genes Pd2, neuA, neuB and neuC. MAP265 expresses one chromosomal copy of Pd2, as well as neuA, neuB, and neuC from a high-copy plasmid using Plac. MAP1200 expresses Pd2, neuA, neuB, and neuC from a single chromosomal copy of the gene using PglpF. Expression cassettes contain SEQ ID NO: 10 and native RBS 5 r -less UTR fragments from lacZ or glpF, respectively.

На фиг. 17 показаны результаты продукции 2'FL в рекомбинантных Е.coli, экспрессирующих гетерологичный ген futC: штамм FT18 содержит две плазмиды, экспрессирующие futC, и гены колановой кислоты gmd, fcl, manC и manB под контролем Plac, штамм МАР965 содержит одиночную копию futC и гены колановой кислоты: gmd, wcaJ (fcI), wcaH (gmm), wcaI, cpsB (manC) и cpsG (manB), которые экспрессируются под контролем PglpF. Экспрессионные кассеты содержат SEQ ID NO: 10 и нативные 5rUTR-фрагменты, лишенные RBS, из lacZ или glpF соответственно.In fig. Figure 17 shows the results of 2'FL production in recombinant E. coli expressing the heterologous futC gene: strain FT18 contains two plasmids expressing futC and the colanic acid genes gmd, fcl, manC and manB under the control of Plac, strain MAP965 contains a single copy of futC and genes colanic acid: gmd, wcaJ (fcI), wcaH (gmm), wcaI, cpsB (manC) and cpsG (manB), which are expressed under the control of PglpF. Expression cassettes contain SEQ ID NO: 10 and native 5 r UTR fragments lacking RBS from lacZ or glpF, respectively.

Подробное описание изобретенияDetailed Description of the Invention

Настоящее изобретение в целом относится к ДНК-конструкциям и экспрессионным системам, пригодным для рекомбинантного получения биологических молекул. В частности, настоящее изобретение относится к рекомбинантным бактериальным экспрессионным системам, способным обеспечить стабильную и исключительно высокую экспрессию гена, который функционально связан с промотором и синтетической некодирующей ДНК-последовательностью, расположенной выше гена, где указанная синтетическая ДНК-последовательность (взаимозаменяемо обозначаемая в настоящем описании как синтетическая/искусственная/рекомбинантная ДНК-последовательность (i)), содержит фрагмент 5'-нетранслируемой лидерной ДНК-последовательности (5'UTR-ДНК) гена glp из Escherichia coli (E.coli) и ДНК-последовательность CAAGGAGGAAACAGCT (SEQ ID NO: 10) или ее вариант. Последовательность CAAGGAGGAAACAGCT (SEQ ID NO: 10) представляет собой искусственную ДНК-последовательность, которая первоначально получена из 5'UTR lacZ из Е.coli и была модифицирована в последовательности сайта связывания рибосомы (RBS). Ранее последовательность была описана в связи с ее способностью усиливать экспрессию репортерного гена (lacZ) примерно в 6 раз в модельной системе экспрессии генов с использованием нуклеотидной конструкции, где эта последовательность была функционально связана с искусственным промотором и с 30-нуклеотидной ДНК-последовательностью, способной стабилизировать мРНК. (Meynial-Salles I. et al. (2005), Appl. Eviron. Mcrobiol., 71:2140-2144; WO 03/089605). Авторы изобретения неожиданно обнаружили, что SEQ ID NO: 10 или ее вариант, когда она не связана с описанной РНК-стабилизирующей последовательностью ДНК, не способна усиливать экспрессию репортерного гена (lacZ) из всех случайно выбранных промоторов, а только из нескольких из них. Однако, если SEQ ID NO: 10 связана с фрагментом 5'UTR-ДНК гена glp, преимущественно гена glpF, glpA, glpT или glpD, экспрессия репортерного гена значительно увеличивается и уровень экспрессии гена не зависит или намного менее зависит от выбора промотора, т.е. сила промотора оказывает меньшее влияние на уровень экспрессии гена, когда синтетическая последовательность ДНК по изобретению вставлена между промотором и геном.The present invention generally relates to DNA constructs and expression systems suitable for the recombinant production of biological molecules. In particular, the present invention relates to recombinant bacterial expression systems capable of providing stable and exceptionally high expression of a gene that is operably linked to a promoter and a synthetic non-coding DNA sequence located upstream of the gene, wherein said synthetic DNA sequence (interchangeably referred to herein as synthetic/artificial/recombinant DNA sequence (i)), contains a fragment of the 5' untranslated leader DNA sequence (5'UTR DNA) of the glp gene from Escherichia coli (E. coli) and the DNA sequence CAAGGAGGAAACAGCT (SEQ ID NO: 10) or its variant. The sequence CAAGGAGGAAACAGCT (SEQ ID NO: 10) is an artificial DNA sequence that was originally derived from the 5'UTR of lacZ from E. coli and was modified into a ribosome binding site (RBS) sequence. The sequence was previously described for its ability to enhance expression of a reporter gene (lacZ) by approximately 6-fold in a model gene expression system using a nucleotide construct, where the sequence was operably linked to an artificial promoter and to a 30-nucleotide DNA sequence capable of stabilizing mRNA. (Meynial-Salles I. et al. (2005), Appl. Eviron. Microbiol., 71:2140-2144; WO 03/089605). The inventors unexpectedly discovered that SEQ ID NO: 10 or a variant thereof, when not linked to a described RNA stabilizing DNA sequence, is not able to enhance expression of a reporter gene (lacZ) from all randomly selected promoters, but only from a few of them. However, if SEQ ID NO: 10 is associated with a fragment of the 5'UTR DNA of the glp gene, predominantly the glpF, glpA, glpT or glpD gene, the expression of the reporter gene is significantly increased and the level of gene expression is independent or much less dependent on the choice of promoter, i.e. e. promoter strength has less effect on the level of gene expression when the synthetic DNA sequence of the invention is inserted between the promoter and the gene.

Соответственно первый аспект изобретения относится к синтетической некодирующей ДНК-последовательности (i), содержащей первый фрагмент ДНК и второй фрагмент ДНК, где первый фрагментAccordingly, the first aspect of the invention relates to a synthetic non-coding DNA sequence (i) comprising a first DNA fragment and a second DNA fragment, wherein the first fragment

- 5 044676 представляет собой фрагмент 5'UTR-,HHK гена glp, преимущественно гена glpF, glpA, glpT или glpD, а второй фрагмент представляет собой SEQ ID NO: 10 или ее вариант, и где второй фрагмент расположен ниже первого фрагмента (т.е. второй фрагмент связан с концом первого фрагмента). Предпочтительно синтетическая некодирующая ДНК-последовательность (i) является частью нуклеотидной конструкции, где она функционально связана с последовательностью промоторной ДНК (ii) и необязательно с кодирующей последовательностью ДНК (iii) и где указанная синтетическая последовательность ДНК расположена ниже последовательности промоторной ДНК (ii) и необязательно выше последовательности кодирующей ДНК (iii). Термин необязательно в настоящем контексте означает, что в некоторых вариантах осуществления изобретение относится к нуклеотидным конструкциям, которые включают промоторную ДНК-последовательность (ii) и синтетическую ДНК-последовательность (i), но не кодирующую ДНК (iii). В других вариантах осуществления синтетическая ДНК-последовательность (i) может быть функционально связана с кодирующей последовательностью ДНК (iii), а промоторная ДНК не включена в конструкцию. Еще, в других вариантах осуществления конструкция может содержать синтетическую ДНК-последовательность (i) и не содержать ни промоторную ДНК, ни кодирующую ДНК-последовательность. Нуклеотидные конструкции, содержащие синтетическую последовательность ДНК (i), могут быть встроены в геном клетки-хозяина выше гена и ниже нативного промотора гена, например, заменяя существующую нативную ДНК-последовательность, или она может быть вставлена в геномную ДНК для замены любой из или обеих из промоторной и/или 5'UTR ДНК-последовательностей у представляющего интерес геномного гена. Конструкция по изобретению также может быть использована для модификации экспрессии представляющего интерес гена желаемым образом (т.е. для увеличения или уменьшения экспрессии гена) по сравнению с природной экспрессией гена, контролируемой нативными (не искусственно модифицированными) регуляторными последовательностями геномной ДНК. Как указано, в одном варианте осуществления конструкция может содержать только искусственную ДНК-последовательность (i), т.е. не иметь ни промоторной, ни кодирующей ДНК-последовательности, так как такая конструкция может быть вставлена в геном клетки-хозяина ниже последовательности геномного промотора и выше последовательности гена/кодирующей последовательности (замена существующей нативной последовательности или добавление/удлинение существующей последовательности), и за счет этого изменяется экспрессия гена (увеличивается или уменьшается) по сравнению с его природной экспрессией с соответствующего геномного промотора. В других вариантах осуществления конструкция по изобретению может содержать функционально связанные промоторную ДНК-последовательность (ii), последовательность синтетической ДНК (i) и кодирующую ДНК-последовательность (iii), которая кодирует гетерологичную или гомологичную (по отношению к клетке-хозяину) биологическую молекулу, где синтетическая ДНК-последовательность расположена между промоторной ДНК и кодирующими последовательностями ДНК.- 5 044676 is a 5'UTR-,HHK fragment of a glp gene, preferably a glpF, glpA, glpT or glpD gene, and the second fragment is SEQ ID NO: 10 or a variant thereof, and wherein the second fragment is located below the first fragment (i.e. i.e. the second fragment is connected to the end of the first fragment). Preferably, the synthetic non-coding DNA sequence (i) is part of a nucleotide construct where it is operably linked to a promoter DNA sequence (ii) and optionally to a coding DNA sequence (iii) and wherein said synthetic DNA sequence is located downstream of the promoter DNA sequence (ii) and optionally upstream of the coding DNA sequence (iii). The term does not necessarily mean in the present context that, in some embodiments, the invention relates to nucleotide constructs that include a promoter DNA sequence (ii) and a synthetic DNA sequence (i), but not coding DNA (iii). In other embodiments, the synthetic DNA sequence (i) may be operably linked to the coding DNA sequence (iii) and the promoter DNA is not included in the construct. Still, in other embodiments, the construct may comprise a synthetic DNA sequence (i) and contain neither a promoter DNA nor a coding DNA sequence. Nucleotide constructs containing a synthetic DNA sequence (i) can be inserted into the host cell genome upstream of the gene and downstream of the gene's native promoter, for example, replacing an existing native DNA sequence, or it can be inserted into the genomic DNA to replace either or both from the promoter and/or 5'UTR DNA sequences of the genomic gene of interest. The construct of the invention can also be used to modify the expression of a gene of interest in a desired manner (ie, to increase or decrease gene expression) relative to natural gene expression controlled by native (not artificially modified) genomic DNA regulatory sequences. As indicated, in one embodiment, the construct may contain only the artificial DNA sequence (i), i.e. have neither a promoter nor a coding DNA sequence, since such a construct can be inserted into the genome of the host cell below the genomic promoter sequence and above the gene/coding sequence (replacing an existing native sequence or adding/extending an existing sequence), and due to This changes the expression of the gene (increases or decreases) compared to its natural expression from the corresponding genomic promoter. In other embodiments, the construct of the invention may comprise an operably linked promoter DNA sequence (ii), a synthetic DNA sequence (i), and a coding DNA sequence (iii) that encodes a heterologous or homologous (with respect to the host cell) biological molecule, where the synthetic DNA sequence is located between the promoter DNA and the coding DNA sequences.

Если не указано иное, то все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно понимают специалисты в области техники, к которой относится это изобретение. Singleton et al. (1994), Dictionary of Microbiology and Molecular Biology, second edition, John Wiley and Sons (New York) дадут специалисту общий словарь многих терминов, используемых в данном изобретении. Хотя любые способы и материалы, подобные или эквивалентные тем, которые описаны в настоящем документе, могут использоваться при практическом применении или при проверке настоящего изобретения, описаны предпочтительные способы и материалы. Большинство номенклатуры и общих лабораторных методик, требуемых в этой заявке, можно найти в Sambrook et al., Molecular Cloning: A Laboratory Manual, vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (2012); Wilson K. and Walker J., Principles and Techniques of Biochemistry and Molecular Biology (2010), Cambridge University Press; или в Maniatise et al., Molecular Cloning A laboratory Manual, Cold Spring Harbor Laboratory (2012); или в Ausubel et al., Current protocols in molecular biology, John Wiley and Sohns (2010). В дальнейшем руководства называются Sambrook et al., Wilson & Walker, Maniatise et al., Ausubel et al. соответственно.Unless otherwise specified, all technical and scientific terms used herein have the same meaning as commonly understood by those skilled in the art to which this invention relates. Singleton et al. (1994), Dictionary of Microbiology and Molecular Biology, second edition, John Wiley and Sons (New York) will provide one skilled in the art with a general vocabulary of many of the terms used in this invention. Although any methods and materials similar or equivalent to those described herein may be used in the practice or testing of the present invention, preferred methods and materials are described. Most of the nomenclature and general laboratory procedures required in this application can be found in Sambrook et al., Molecular Cloning: A Laboratory Manual, vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (2012); Wilson K. and Walker J., Principles and Techniques of Biochemistry and Molecular Biology (2010), Cambridge University Press; or Maniatise et al., Molecular Cloning A laboratory Manual, Cold Spring Harbor Laboratory (2012); or in Ausubel et al., Current protocols in molecular biology, John Wiley and Sohns (2010). Hereafter, the guidelines are referred to as Sambrook et al., Wilson & Walker, Maniatise et al., Ausubel et al. respectively.

Если не указано иное, то термины, определенные в описании, относятся ко всем аспектам и вариантам осуществления изобретения. Все варианты осуществления, описанные в описании и рабочих примерах, относятся ко всем любым аспектам изобретения.Unless otherwise specified, the terms defined in the specification apply to all aspects and embodiments of the invention. All embodiments described in the specification and working examples apply to all any aspects of the invention.

Используемый в настоящем документе термин нуклеиновая кислота включает молекулы РНК, ДНК и к ДНК Понятно, что в результате вырожденности генетического кода может быть получено множество нуклеотидных последовательностей, кодирующих данный белок. Термин нуклеиновая кислота используется взаимозаменяемо с термином полинуклеотид. Олигонуклеотид представляет собой молекулу нуклеиновой кислоты с короткой цепью. Праймер представляет собой олигонуклеотид, встречающийся в природе, например, в очищенном продукте рестрикции или произведенный синтетическим путем, который способен выступать в качестве точки начала синтеза, когда находится в условиях, при которых происходит синтез продукта удлинения праймера, который комплементарен цепи нуклеиновой кислоты (т.е. в присутствии нуклеотидов и индуцирующего агента, такого как ДНК-полимераза, и при подходящей температуре и рН). Праймер предпочтительно является одноцепочечным для максимальной эффективности амплификации, но в альтернативном вариант может быть двухцепочечным. Если праймер являAs used herein, the term nucleic acid includes RNA, DNA, and DNA molecules. It is understood that, as a result of the degeneracy of the genetic code, a variety of nucleotide sequences encoding a given protein can be obtained. The term nucleic acid is used interchangeably with the term polynucleotide. An oligonucleotide is a short-chain nucleic acid molecule. A primer is an oligonucleotide, occurring naturally, for example in a purified restriction product or produced synthetically, that is capable of acting as a starting point for synthesis when exposed to conditions that produce a primer extension product that is complementary to the nucleic acid strand (i.e. e. in the presence of nucleotides and an inducing agent such as DNA polymerase, and at a suitable temperature and pH). The primer is preferably single-stranded for maximum amplification efficiency, but alternatively can be double-stranded. If the primer is

- 6 044676 ется двухцепочечным, то его сначала обрабатывают, чтобы разделить цепи, прежде чем использовать для получения продуктов удлинения цепи. Предпочтительно, чтобы праймер представлял собой дезоксирибонуклеотид. Праймер должен быть достаточно длинным, чтобы обеспечить синтез продуктов удлинения в присутствии индуцирующего агента. Точная длина праймеров будет зависеть от многих факторов, включая температуру, источник праймера и применение способа.- 6 044676 Since it is double-stranded, it is first processed to separate the chains before being used to produce chain extension products. Preferably, the primer is a deoxyribonucleotide. The primer must be long enough to allow synthesis of extension products in the presence of an inducing agent. The exact length of the primers will depend on many factors, including temperature, primer source, and method application.

Конструкция нуклеиновой кислоты означает искусственно сконструированный сегмент нуклеиновой кислоты, в частности сегмент ДНК, который предназначен для трансплантации в клеткумишень, например бактериальную клетку, для модификации экспрессии геномного гена или для экспрессии последовательности гена/кодирующей ДНК, которые могут быть включены в конструкцию. В контексте изобретения конструкция нуклеиновой кислоты содержит последовательность рекомбинантной ДНК, по существу состоящую из необязательно одной, двух или трех отдельных последовательностей ДНК: последовательности синтетической некодирующей ДНК (i), содержащей сайт связывания рибосомы (RBS), последовательности промоторной ДНК (ii) и последовательности кодирующей ДНК (iii). В вариантах осуществления, относящихся к конструкции, содержащей две или три из перечисленных последовательностей, последовательности в конструкции функционально связаны друг с другом. Функционально связанный определяется в настоящем документе как конфигурация, в которой регуляторная последовательность, т.е. промоторная последовательность и/или последовательность 5UTR, надлежащим образом размещены относительно последовательности кодирующей ДНК, так что регуляторные последовательности направляют транскрипцию кодирующей последовательности и трансляцию мРНК в полипептидную последовательность, кодируемую кодирующей ДНК. В варианте осуществления, где конструкция содержит последовательность кодирующей ДНК, предпочтительно, чтобы кодирующая ДНК кодировала по меньшей мере одну молекулу белка или РНК, которая обладает активностью, которая прямо или косвенно участвует в продукции одного или более НМО в клетке-хозяине (т.е. активность является существенной или полезной для продуцирования одного или более НМО). Неограничивающими примерами такой активности могут быть: ферментативная активность, регулирующая экспрессию генов активность, шаперонная активность. Неограничивающие примеры последовательностей кодирующей ДНК (iii) описаны ниже и в рабочих примерах. Конструкция ДНК по изобретению в некоторых вариантах осуществления называется экспрессионной кассетой по изобретению. Конструкции ДНК/экспрессионные кассеты по изобретению в некоторых вариантах осуществления могут содержать более одной кодирующей ДНК-последовательности, которая может кодировать разные биологические молекулы. Предпочтительно, чтобы конструкции (содержащие одну или более кодирующих последовательностей ДНК (iii)) содержали одну копию последовательности промоторной ДНК (ii) и одну копию последовательности синтетической ДНК (i). ДНК-конструкции по настоящему изобретению могут быть вставлены в плазмидную ДНК/вектор, перенесены в клетку-мишень/хозяина и экспрессированы с плазмид и/или с хромосом. Конструкции ДНК могут быть линейными или кольцевыми. Линейная или кольцевая конструкция ДНК, встроенная в бактериальный геном или экспрессионную плазмиду, взаимозаменяемо обозначается в данном документе как экспрессионная кассета, экспрессионный картридж или картридж. В одном варианте осуществления картридж представляет собой линейную конструкцию ДНК, содержащую три последовательности ДНК: промоторную (ДНК-последовательность (ii)), последовательность синтетической ДНК (i)) ниже промотора, и кодирующую ДНК-последовательность (последовательность (iii)), кодирующую биологическую молекулу, представляющую интерес. Конструкция также может содержать дополнительные последовательности, например последовательность терминатора транскрипции, и две терминально фланкирующие области, которые гомологичны геномной области, и которые обеспечивают гомологичную рекомбинацию, и/или другие последовательности, описанные в настоящем документе. Картридж может быть получен способами, хорошо известными в данной области техники, например, с использованием стандартных способов, описанных в Wilson & Walker. Использование линейного экспрессионного картриджа может обеспечить преимущество, заключающееся в том, что сайт встраивания в геном может быть свободно выбран с помощью соответствующего подбора фланкирующих гомологичных областей картриджа. Таким образом, встраивание линейного экспрессионного картриджа обеспечивает большую вариабельность в отношении области генома. Линейные картриджи включены в предпочтительные варианты осуществления изобретения.Nucleic acid construct means an artificially engineered segment of nucleic acid, particularly a segment of DNA, that is intended to be transplanted into a target cell, such as a bacterial cell, to modify the expression of a genomic gene, or to express a gene/coding DNA sequence that may be included in the construct. In the context of the invention, the nucleic acid construct comprises a recombinant DNA sequence essentially consisting of optionally one, two or three distinct DNA sequences: a synthetic non-coding DNA sequence (i) containing a ribosome binding site (RBS), a promoter DNA sequence (ii) and a coding sequence DNA (iii). In embodiments involving a construct comprising two or three of the listed sequences, the sequences in the construct are operably linked to each other. Functionally linked is defined herein as a configuration in which a regulatory sequence, i.e. the promoter sequence and/or the 5UTR sequence are suitably positioned relative to the coding DNA sequence such that the regulatory sequences direct transcription of the coding sequence and translation of the mRNA into the polypeptide sequence encoded by the coding DNA. In an embodiment where the construct comprises a coding DNA sequence, it is preferred that the coding DNA encodes at least one protein or RNA molecule that has an activity that is directly or indirectly involved in the production of one or more HMOs in a host cell (i.e. activity is essential or beneficial for the production of one or more HMOs). Non-limiting examples of such activities include: enzymatic activity, gene expression regulating activity, chaperone activity. Non-limiting examples of coding DNA sequences (iii) are described below and in the working examples. The DNA construct of the invention is, in some embodiments, referred to as an expression cassette of the invention. The DNA constructs/expression cassettes of the invention, in some embodiments, may contain more than one DNA coding sequence, which may encode different biological molecules. Preferably, the constructs (containing one or more DNA coding sequences (iii)) contain one copy of the promoter DNA sequence (ii) and one copy of the synthetic DNA sequence (i). The DNA constructs of the present invention can be inserted into a plasmid DNA/vector, transferred into a target/host cell, and expressed from plasmids and/or chromosomes. DNA constructs can be linear or circular. A linear or circular DNA construct inserted into a bacterial genome or expression plasmid is interchangeably referred to herein as an expression cassette, expression cartridge, or cartridge. In one embodiment, the cartridge is a linear DNA construct containing three DNA sequences: a promoter (DNA sequence (ii)), a synthetic DNA sequence (i)) downstream of the promoter, and a coding DNA sequence (sequence (iii)) encoding a biological molecule of interest. The construct may also contain additional sequences, such as a transcription terminator sequence and two terminal flanking regions that are homologous to the genomic region and that allow homologous recombination, and/or other sequences described herein. The cartridge can be produced by methods well known in the art, for example, using standard methods described in Wilson & Walker. The use of a linear expression cartridge may provide the advantage that the genomic insertion site can be freely selected by appropriate selection of flanking homologous regions of the cartridge. Thus, insertion of a linear expression cartridge allows for greater variability per region of the genome. Linear cartridges are included in preferred embodiments of the invention.

Под термином сайт связывания рибосомы (RBS) подразумевается короткая нуклеотидная последовательность, обычно включающая около 4-16 нуклеиновых оснований, которая функционирует путем позиционирования рибосомы на молекуле мРНК для трансляции кодируемого белка. Сайт модифицированного связывания рибосомы представляет собой сайт связывания рибосомы, в котором одна или несколько пар оснований были изменены. Согласно изобретению синтетическая некодирующая ДНКпоследовательность (i) содержит RBS в SEQ ID NO: 10 или ее вариант. Варианты SEQ ID NO: 12 могут использоваться в другом варианте осуществления, например, с целью модификации экспрессии представляющей интерес последовательности геномной ДНК, как, например, авторы показывают в настоящем документе, что некоторые варианты могут усиливать экспрессию гена в еще большей степени по сравнению с достигнутой экспрессией с использованием SEQ ID NO: 10, тогда как другие варианты могут снижать экспрессию гена. Полезные, но не ограничивающие варианты осуществления последоваThe term ribosome binding site (RBS) refers to a short nucleotide sequence, typically of about 4-16 nucleobases, that functions by positioning the ribosome on the mRNA molecule for translation of the encoded protein. A modified ribosome binding site is a ribosome binding site in which one or more base pairs have been changed. According to the invention, the synthetic non-coding DNA sequence (i) contains RBS in SEQ ID NO: 10 or a variant thereof. Variants of SEQ ID NO: 12 may be used in another embodiment, for example, to modify the expression of a genomic DNA sequence of interest, as, for example, we show herein that some variants may enhance gene expression to an even greater extent than achieved expression using SEQ ID NO: 10, while other variants may reduce gene expression. Useful but non-limiting embodiments of placenta

- 7 044676 тельностей ДНК, которые включают RBS, можно найти в приведенной ниже табл. 1 и описаны в спецификации.- 7 044676 DNA bodies that include RBS can be found in the table below. 1 and described in the specification.

Для целей данного изобретения промотор или промоторная область или промоторный элемент представляет собой нуклеотидную последовательность, которая распознается и связывается ДНКзависимой РНК-полимеразой во время инициации транскрипции. Промотор вместе с другими транскрипционными и трансляционными регуляторными нуклеотидными последовательностями (также называемыми регуляторными последовательностями) необходим для экспрессии данного гена или группы генов (оперона). В общем транскрипционные и трансляционные регуляторные последовательности включают, но не ограничиваются ими, промоторные последовательности, сайты связывания рибосомы, последовательности инициации и терминации транскрипции, последовательности инициации и терминации трансляции и энхансерные или активаторные последовательности. Сайт начала транскрипции означает первый нуклеотид, который должен быть транскрибирован, и обозначается +1. Нуклеотиды вниз от сайта начала пронумерованы как +2, +3, +4 и т.д., а нуклеотиды в противоположном 5'-направлении (вверх) пронумерованы -1, -2, -3 и т.д. Промотором по изобретению является отдельную последовательность ДНК. Термин отдельная ДНК-последовательность означает, что последовательности представляют собой не интегрированный фрагмент геномной ДНК, а искусственный/клонированный фрагмент ДНК, который идентичен или гомологичен последовательности геномной ДНК; следуя этому определению, промоторная ДНК конструкции/экспрессионной кассеты, описанная в настоящем документе, рассматривается как полученная из последовательности геномной ДНК, содержащейся в промоторной области гена. Последовательность промоторной ДНК конструкции по изобретению может происходить из промоторной области любого гена из генома выбранного вида, предпочтительно, из промоторной области геномной ДНК Е.coli. Согласно изобретению любая последовательность промоторной ДНК, которая способна связываться с РНК-полимеразой и инициировать транскрипцию, является подходящей для осуществления изобретения. Как уже было указано, нуклеотидная последовательность промоторной ДНК конструкции может быть идентичной или иметь определенный процент идентичности, такой как примерно 65-70% идентичности, предпочтительно по меньшей мере 80% идентичности, предпочтительно от примерно 90% до примерно 99,9% идентичности с нуклеотидной последовательностью фрагмента последовательности геномной ДНК, предпочтительно последовательности бактериальной геномной ДНК, которая рассматривается как промоторная область одного гена или оперона, например, glp или lac-оперонов Е.coli. Термины примерно, около и приблизительно используются взаимозаменяемо и означают отклонение от указанного значения на 1-10% или незначительное отклонение, которое не влияет на соответствующий признак. Под опероном подразумевается функционирующая единица геномной ДНК, содержащая кластер генов под контролем одного промотора. Под glp-опероном подразумевается группа генов, участвующих в дыхательном метаболизме глицерина бактерий. Изобретение в предпочтительных вариантах осуществления относится к четырем glp-оперонам Е.coli, в частности glpFKX, glpABC, glpTQ и glpD. Промоторы указанных оперонов указаны в настоящем документе как промоторы glpF, glpA, glpT и glpD и сокращены в настоящем документе как PglpF, PglpA, PglpT и PglpD соответственно. В некоторых других вариантах осуществления изобретение относится к lac-оперону Е.coli, содержащему гены Z, Y и А и их промотор lac (сокращенно обозначаемый в настоящем документе как Plac). Предпочтительно, чтобы промоторная последовательность оперона glp, содержащаяся в промоторной ДНК конструкции по изобретению, была идентична или имела по меньшей мере 80% идентичности, предпочтительно 90-99,9% идентичности с нуклеотидной последовательностью фрагмента геномной ДНК Е.coli, расположенной перед последовательностями имеющими идентификаторы (ID) Genetic Bank: EG10396 (glpF), EG10391 (glpA), EG10394 (glpD), EG10401 (glpT), EG10527 (lacZ). Геном Е.coli в настоящем документе относится к полной последовательности геномной ДНК Е.coli K-12 MG1655 (ID GenBank: U00096.3). Избранные, но не ограниченные варианты осуществления последовательностей промоторной ДНК по изобретению можно найти в приведенной ниже табл. 1 и описаны в заявке.For purposes of this invention, a promoter or promoter region or promoter element is a nucleotide sequence that is recognized and bound by DNA-dependent RNA polymerase during transcription initiation. A promoter, together with other transcriptional and translational regulatory nucleotide sequences (also called regulatory sequences), is required for the expression of a given gene or group of genes (operon). In general, transcriptional and translational control sequences include, but are not limited to, promoter sequences, ribosome binding sites, transcription initiation and termination sequences, translation initiation and termination sequences, and enhancer or activator sequences. The transcription start site refers to the first nucleotide to be transcribed and is designated +1. Nucleotides downstream of the start site are numbered +2, +3, +4, etc., and nucleotides in the opposite 5' direction (up) are numbered -1, -2, -3, etc. The promoter of the invention is a single DNA sequence. The term single DNA sequence means that the sequences are not an integrated fragment of genomic DNA, but an artificial/cloned DNA fragment that is identical or homologous to the genomic DNA sequence; Following this definition, the promoter DNA of the construct/expression cassette described herein is considered to be derived from the genomic DNA sequence contained in the promoter region of the gene. The promoter DNA sequence of the construct of the invention may be derived from the promoter region of any gene from the genome of the selected species, preferably from the promoter region of the genomic DNA of E. coli. According to the invention, any promoter DNA sequence that is capable of binding to RNA polymerase and initiating transcription is suitable for practicing the invention. As already indicated, the nucleotide sequence of the promoter DNA construct may be identical or have a certain percentage identity, such as about 65-70% identity, preferably at least 80% identity, preferably from about 90% to about 99.9% identity with the nucleotide the sequence of a fragment of a genomic DNA sequence, preferably a bacterial genomic DNA sequence, which is considered to be the promoter region of a single gene or operon, for example the glp or lac operons of E. coli. The terms about, around and approximately are used interchangeably and mean a deviation from a specified value of 1-10% or a slight deviation that does not affect the corresponding characteristic. An operon is a functional unit of genomic DNA containing a cluster of genes under the control of a single promoter. The glp operon refers to a group of genes involved in the respiratory metabolism of glycerol in bacteria. The invention in preferred embodiments relates to four E. coli glp operons, in particular glpFKX, glpABC, glpTQ and glpD. The promoters of these operons are referred to herein as the glpF, glpA, glpT and glpD promoters and are abbreviated herein as PglpF, PglpA, PglpT and PglpD, respectively. In some other embodiments, the invention provides an E. coli lac operon comprising the Z, Y and A genes and their lac promoter (abbreviated herein as Plac). It is preferred that the promoter sequence of the glp operon contained in the promoter DNA construct of the invention be identical or have at least 80% identity, preferably 90-99.9% identity, with the nucleotide sequence of the E. coli genomic DNA fragment located before the sequences having identifiers (ID) Genetic Bank: EG10396 (glpF), EG10391 (glpA), EG10394 (glpD), EG10401 (glpT), EG10527 (lacZ). The E. coli genome herein refers to the complete genomic DNA sequence of E. coli K-12 MG1655 (GenBank ID: U00096.3). Selected, but not limited to, embodiments of the promoter DNA sequences of the invention can be found in the table below. 1 and described in the application.

Последовательность промоторной ДНК (ii) может содержать несколько структурных признаков/элементов, таких как регуляторные области, способные влиять (облегчать или ингибировать) связывание РНК-полимеразы в клетке и инициировать транскрипцию расположенной ниже (в 3'-направлении) кодирующей последовательности, таких как, например, сайты связывания белков-регуляторов транскрипции, таких как, например, транскрипционный репрессор, белок GlpR, или активатор транскрипции - белок CRP. Регуляторная область включает белок-связывающие домены (консенсусные последовательности), ответственные за связывание РНК-полимеразы, такие как бокс -35 и бокс -10 (бокс Прибнова). Все упомянутые регуляторные последовательности промоторной ДНК конструкции могут иметь определенный процент идентичности с соответствующими геномными последовательностями промотора, т.е. изобретение предусматривает исходные ДНК-последовательности (нативного/дикого типа) или их варианты. Некоторые неограничивающие полезные варианты осуществления вариантов последовательностей промоторной ДНК (ii) можно найти в приведенной ниже табл. 1 и описаны в спецификации.The promoter DNA sequence (ii) may contain several structural features/elements such as regulatory regions capable of influencing (facilitating or inhibiting) RNA polymerase binding in the cell and initiating transcription of the downstream (3' direction) coding sequence such as, for example, binding sites for transcriptional regulatory proteins, such as, for example, the transcriptional repressor protein GlpR, or the transcriptional activator protein CRP. The regulatory region includes protein-binding domains (consensus sequences) responsible for binding RNA polymerase, such as box -35 and box -10 (Pribnow box). All of the mentioned regulatory sequences of the promoter DNA construct may have a certain percentage of identity with the corresponding genomic promoter sequences, i.e. the invention provides the original DNA sequences (native/wild type) or variants thereof. Some non-limiting useful embodiments of promoter DNA sequence variants (ii) can be found in the table below. 1 and described in the specification.

Промоторная последовательность по изобретению предпочтительно содержит по меньшей мере 50 нуклеотидов, более предпочтительно по меньшей мере 60 нуклеотидов, например от примерно 65 до примерно 100 нуклеотидов, от примерно 75 до примерно 115 нуклеотидов, от примерно 85 до примерноThe promoter sequence of the invention preferably contains at least 50 nucleotides, more preferably at least 60 nucleotides, such as about 65 to about 100 nucleotides, about 75 to about 115 nucleotides, about 85 to about

- 8 044676- 8 044676

125 нуклеотидов, например от 90 до 115, 110-120, 120-130, 130-140, 140-150 или более 150 нуклеотидов, например 155-165, 165-175, 175-185, 185-195, 195-205, 205-215, 215-225, 225-235, 235-245 245-255, 255-265, 250-350. В некотором варианте промоторная последовательность может иметь длину до 500-1000 нуклеотидов. В некоторых вариантах осуществления выбранная промоторная последовательность также может быть короче, т.е. включать менее 50 нуклеотидов. Длина последовательности промоторной ДНК не является общим ограничивающим фактором изобретения, так как изобретение в другом варианте осуществления предусматривает любую последовательность промоторной ДНК (i), которая способна связываться с РНК-полимеразой и инициировать транскрипцию гена в экспрессионной кассете или представляющего интерес гена в геноме. В одном предпочтительном варианте осуществления промоторная ДНК получена из геномной промоторной области оперона glp, например из промоторной области glpF (PglpF), промоторной области glpA (PglpA), промоторной области glpT (PglpT), промоторной области glpD (PglpD). В некоторых предпочтительных вариантах осуществления промоторная ДНК-последовательность (i) может быть выбрана из любой из ДНК-последовательностей, указанных в настоящем документе как SEQ ID NO: 48, 49 или 54; в некоторых вариантах осуществления, вариант указанной последовательности может быть предпочтительным. Неограничивающие полезные примеры таких вариантов описаны в данном описании и приведены в табл. 1. В одном предпочтительном варианте осуществления последовательность промоторной ДНК имеет свое происхождение из геномной ДНК Е.coli (GenBank ID EG10396), в частности из области геномной ДНК, содержащей промоторный элемент оперона glpFXK (в частности 50-350-нуклеотидную ДНК-последовательность выше начала транскрипции оперона glpFXK или его вариант, который имеет по меньшей мере 90% идентичности по последовательности). Одним предпочтительным вариантом осуществления промоторной ДНК-последовательности (i) является SEQ ID NO: 54.125 nucleotides, for example from 90 to 115, 110-120, 120-130, 130-140, 140-150 or more than 150 nucleotides, for example 155-165, 165-175, 175-185, 185-195, 195-205, 205-215, 215-225, 225-235, 235-245 245-255, 255-265, 250-350. In some embodiment, the promoter sequence may be up to 500-1000 nucleotides in length. In some embodiments, the selected promoter sequence may also be shorter, i.e. include less than 50 nucleotides. The length of the promoter DNA sequence is not a general limiting factor of the invention, since the invention in another embodiment provides for any promoter DNA sequence (i) that is capable of binding to RNA polymerase and initiating transcription of a gene in an expression cassette or a gene of interest in the genome. In one preferred embodiment, the promoter DNA is derived from the genomic promoter region of the glp operon, for example, the glpF promoter region (PglpF), the glpA promoter region (PglpA), the glpT promoter region (PglpT), the glpD promoter region (PglpD). In some preferred embodiments, the promoter DNA sequence (i) may be selected from any of the DNA sequences set forth herein as SEQ ID NO: 48, 49, or 54; in some embodiments, a variant of said sequence may be preferred. Non-limiting useful examples of such embodiments are described herein and are shown in Table 1. 1. In one preferred embodiment, the promoter DNA sequence has its origin from E. coli genomic DNA (GenBank ID EG10396), in particular from the region of genomic DNA containing the promoter element of the glpFXK operon (in particular the 50-350 nucleotide DNA sequence upstream transcription of the glpFXK operon or a variant thereof that has at least 90% sequence identity). One preferred embodiment of the promoter DNA sequence (i) is SEQ ID NO: 54.

В различных вариантах осуществления изобретение может относиться к промотору, который является индуцибельным/регулируемым или постоянно активным. Термин индуцибельный промотор означает, что активность промотора, т.е. способность промотора инициировать и поддерживать транскрипцию функционально связанного гена на определенном уровне, регулируется внешним фактором, например молекулой источника углерода. В некоторых вариантах осуществления активность промотора по изобретению можно контролировать с помощью присутствия или отсутствия молекулы источника углерода в среде, например глицерина, глюкозы, арабинозы и т.д. Источник углерода в целом относится к углеводу, который может поглощаться и метаболизироваться бактериальной клеткой. Предпочтительно индуцибельный промотор по изобретению представляет собой индуцируемый источником углерода glp-промотор Е.coli, предпочтительно промотор glpF, glpA, glpD, glpT, или его вариант, который индуцируется тем же источником углерода, что и соответствующий исходный промотор. Предпочтительно промотор содержит по меньшей мере один сайт связывания с белком рецептора циклического АМФ (цАМФ-CRP). В других вариантах осуществления изобретение относится к промотору, который не индуцируется, т.е. к активности промотора, которая не зависит от индукции, например, источником углерода. Предпочтительно последний промотор представляет собой glp-промотор по изобретению, структура ДНК которого была модифицирована, чтобы сделать активность промотора независимой от источника углерода или сделать промотор конститутивно активным, например, путем удаления/модификации сайтов для связывания GlpR в промоторной последовательности.In various embodiments, the invention may relate to a promoter that is inducible/regulated or continuously active. The term inducible promoter means that the activity of the promoter, i.e. the ability of a promoter to initiate and maintain transcription of a functionally related gene at a certain level is regulated by an external factor, such as a carbon source molecule. In some embodiments, the activity of a promoter of the invention can be controlled by the presence or absence of a carbon source molecule in the medium, such as glycerol, glucose, arabinose, etc. A carbon source generally refers to a carbohydrate that can be taken up and metabolized by the bacterial cell. Preferably, the inducible promoter of the invention is a carbon source-inducible E. coli glp promoter, preferably a glpF, glpA, glpD, glpT promoter, or a variant thereof that is inducible by the same carbon source as the corresponding parent promoter. Preferably, the promoter contains at least one cyclic AMP receptor protein (cAMP-CRP) binding site. In other embodiments, the invention relates to a promoter that is not inducible, i.e. to promoter activity that is independent of induction, for example, by a carbon source. Preferably, the latter promoter is a glp promoter of the invention, the DNA structure of which has been modified to make the promoter activity carbon source independent or to make the promoter constitutively active, for example by removing/modifying GlpR binding sites in the promoter sequence.

Как указано выше, изобретение также относится к вариантам последовательностей промоторной ДНК, которые могут быть использованы в конструкциях по изобретению. Под вариантом в настоящем контексте подразумевается последовательность искусственной нуклеиновой кислоты, которая предпочтительно имеет сходство примерно на 70-99% с нуклеотидной последовательностью рассматриваемой последовательности промоторной ДНК. Процент сходства сравниваемых последовательностей нуклеиновых кислот указывает на долю последовательностей, которые имеют идентичную структуру, т.е. идентичный нуклеотидный состав. Процент сходства последовательностей для целей изобретения может быть определен с использованием любого метода, хорошо известного в данной области, например с помощью BLAST. Объем термина вариант включает нуклеотидные последовательности, комплементарные последовательностям ДНК, описанным в настоящем документе, последовательности мРНК и синтетические нуклеотидные последовательности, например, праймеры для ПЦР, и другие олигонуклеотиды, которые родственны нуклеотидным последовательностям конструкций по изобретению.As stated above, the invention also relates to variant promoter DNA sequences that can be used in the constructs of the invention. By variant in the present context is meant an artificial nucleic acid sequence that preferably has about 70-99% similarity to the nucleotide sequence of the promoter DNA sequence in question. The percentage of similarity of compared nucleic acid sequences indicates the proportion of sequences that have an identical structure, i.e. identical nucleotide composition. The percentage of sequence similarity for purposes of the invention can be determined using any method well known in the art, such as BLAST. The scope of the term variant includes nucleotide sequences complementary to the DNA sequences described herein, mRNA sequences and synthetic nucleotide sequences, for example, PCR primers, and other oligonucleotides that are related to the nucleotide sequences of the constructs of the invention.

Согласно изобретению, конструкция/экспрессионная кассета содержит синтетическую некодирующую ДНК-последовательность (i), которая содержит сайт связывания рибосомы (RBS). Термин синтетическая ДНК-последовательность в настоящем контексте означает рукотворную ДНК-последовательность, т.е. ДНК-последовательность сконструирована искусственно и состоит из по меньшей мере двух фрагментов ДНК, причем по меньшей мере один из фрагментов получен из геномной ДНК (т.е. она соответствует ДНК-последовательности геномной ДНК), а другой фрагмент ДНК представляет собой искусственную ДНК-последовательность, содержащую около 16 нуклеиновых оснований, которая предпочтительно не соответствует последовательности природной бактериальной геномной ДНК, содержащей RBS. В частности, синтетическая ДНК-последовательность (i) состоит из двух фрагментов ДНК: первого фрагмента ДНК и второго фрагмента ДНК. Первый фрагмент ДНК имеет примерно 70-100% идентичноAccording to the invention, the construct/expression cassette contains a synthetic non-coding DNA sequence (i) which contains a ribosome binding site (RBS). The term synthetic DNA sequence in the present context means a man-made DNA sequence, i.e. The DNA sequence is artificially constructed and consists of at least two DNA fragments, wherein at least one of the fragments is derived from genomic DNA (i.e., it corresponds to the DNA sequence of genomic DNA), and the other DNA fragment is an artificial DNA sequence , containing about 16 nucleic bases, which preferably does not correspond to the sequence of natural bacterial genomic DNA containing RBS. Specifically, the synthetic DNA sequence (i) consists of two DNA fragments: a first DNA fragment and a second DNA fragment. The first DNA fragment is approximately 70-100% identical

- 9 044676 сти по последовательности с фрагментом последовательности геномной ДНК, полученной из нетранслируемой ДНК-последовательности, расположенной ниже точки инициации транскрипции и выше начала трансляции гена, например в гене glp. Предпочтительно, чтобы первый фрагмент содержал цепочку из по меньшей мере от 5 до 80 непрерывных нуклеотидов, например 5-10 нуклеотидов, 10-15 нуклеотидов, 15-20 нуклеотидов, 20-30 нуклеотидов, 30-40 нуклеотидов, 40-50 нуклеотидов, 50-60 нуклеотидов после точки инициации транскрипции (начиная с нуклеотида +2) гена glp, предпочтительно, гена glpF, glpA или glpD. Последовательность ДНК первого фрагмента может быть гомологичной или гетерологичной по отношению к промотору ДНК (ii) и/или последовательности кодирующей ДНК (iii). Гомологичный в данном контексте означает, что ДНК-последовательность первого фрагмента получена из 5'UTRобласти гена, который в природе (в геноме исходного вида) расположен ниже промотора конструкции, или в природе она является встречающимся в природе фрагментом 5'UTR гена конструкции, или она в природе ассоциирована с обоими; гетерологичный означает, что первый фрагмент ДНК не соответствует фрагменту природной (геномной) 5'UTR-области, ассоциированной с геном или промотором конструкции. В одном предпочтительном варианте осуществления первый фрагмент ДНК имеет свое происхождение из геномной ДНК-последовательности 5'UTR гена glp, предпочтительно гена glpF. Предпочтительно, чтобы она была гетерологична по отношению к кодирующей ДНК-последовательности (iii). В некоторых вариантах осуществления может быть предпочтительным, чтобы ДНК-последовательность первого фрагмента ДНК была гомологичной относительно ДНК-последовательности промотора (ii); в других вариантах осуществления может быть предпочтительным, чтобы указанная первая последовательность была гетерологичной по отношению к ДНК-последовательности промотора (i). В одном предпочтительном варианте осуществления первый фрагмент ДНК представляет собой или содержит нуклеотидную последовательность, представленную в SEQ ID NO: 36.- 9 044676 sequence identity with a fragment of a genomic DNA sequence derived from an untranslated DNA sequence located downstream of the transcription initiation point and upstream of the start of translation of a gene, for example in the glp gene. Preferably, the first fragment contains a chain of at least 5 to 80 contiguous nucleotides, for example 5-10 nucleotides, 10-15 nucleotides, 15-20 nucleotides, 20-30 nucleotides, 30-40 nucleotides, 40-50 nucleotides, 50 -60 nucleotides after the transcription start point (starting at nucleotide +2) of the glp gene, preferably the glpF, glpA or glpD gene. The DNA sequence of the first fragment may be homologous or heterologous to the DNA promoter (ii) and/or the coding DNA sequence (iii). Homologous in this context means that the DNA sequence of the first fragment is derived from the 5'UTR region of a gene that is naturally located downstream of the promoter of the construct, or is a naturally occurring fragment of the 5'UTR of the gene of the construct, or is in nature associated with both; heterologous means that the first DNA fragment does not correspond to a fragment of the natural (genomic) 5'UTR region associated with the gene or promoter construct. In one preferred embodiment, the first DNA fragment has its origin from the genomic DNA sequence of the 5'UTR of the glp gene, preferably the glpF gene. Preferably, it is heterologous to the coding DNA sequence (iii). In some embodiments, it may be preferred that the DNA sequence of the first DNA fragment be homologous to the DNA sequence of the promoter (ii); in other embodiments, it may be preferable that said first sequence be heterologous to the DNA sequence of promoter (i). In one preferred embodiment, the first DNA fragment is or contains the nucleotide sequence set forth in SEQ ID NO: 36.

Второй фрагмент последовательности искусственной ДНК (i) представляет собой нуклеотидную последовательность CAAGGAGGAAACAGCT (SEQ ID NO: 10) или вариант указанной последовательности. Некоторыми полезными неограничивающими вариантами осуществления варианта SEQ ID NO: 10 являются нуклеотидные последовательности SEQ ID NO: 38-47. В некоторых вариантах осуществления конструкции по изобретению, первый фрагмент ДНК (ДНК-последовательность 5'-UTR) расположен ниже ДНК-последовательности промотора (ДНК-последовательности (ii)) (и выше второго фрагмента ДНК); и второй фрагмент ДНК расположен выше кодирующей ДНК-последовательности (iii) (т.е. до точки инициации трансляции), т.е. в искусственной ДНК-последовательности (i) первый фрагмент ДНК предшествует второму фрагменту ДНК. Одним предпочтительным вариантом осуществления последовательности синтетической ДНК (i) является SEQ ID NO: 37.The second artificial DNA sequence fragment (i) is the nucleotide sequence CAAGGAGGAAACAGCT (SEQ ID NO: 10) or a variant thereof. Some useful non-limiting embodiments of SEQ ID NO: 10 are the nucleotide sequences of SEQ ID NO: 38-47. In some embodiments of the construct of the invention, the first DNA fragment (DNA sequence 5'-UTR) is located downstream of the promoter DNA sequence (DNA sequence (ii)) (and upstream of the second DNA fragment); and the second DNA fragment is located upstream of the coding DNA sequence (iii) (i.e., before the translation initiation point), i.e. in an artificial DNA sequence (i) the first DNA fragment precedes the second DNA fragment. One preferred embodiment of the synthetic DNA sequence (i) is SEQ ID NO: 37.

Неограничивающие варианты последовательностей ДНК (i) и (ii), фрагментов, вариантов и их комбинаций, применимых в различных аспектах изобретения, описаны в табл. 1.Non-limiting DNA sequences (i) and (ii), fragments, variants and combinations thereof useful in various aspects of the invention are described in table. 1.

Таблица 1Table 1

Название·. Name·. SEQ ID: SEQ ID: Последовательность (5’->3’) Sequence (5’->3’) Описание Description PglpF 5’U TR-glpFd!6nb PglpF 5'U TR-glpFd!6nb SEQ ГО NO: 1 SEQ GO NO: 1 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA 284нуклеотидный фрагмент ДНК, полученный из геномной ДНК Е. сой (реф.послед. A 284-nucleotide DNA fragment obtained from the genomic DNA of E. soy (ref. sequence.

- 10 044676- 10 044676

GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA C GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA C ID U00096.3), расположенный на 16 нуклеотидов выше кодона инициации трансляции гена glpF ID U00096.3), located at 16 nucleotides upstream of the codon initiation of translation of the glpF gene PglpA 5’U TR-glpAdl6nb PglpA 5'U TR-glpAdl6nb SEQ ID NO: 2 SEQ ID NO: 2 GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGAAATCAAACAATTCATGTTTTT ACTATGGCTAAATGGTAAAAAACGAA GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGAAATCAAACAATTCATGTTTTTT ACTATGGCTAAATGGTAAAAAAACGAA 166- нуклеотидный фрагмент ДНК, полученный из геномной ДНК Е. сой (реф.послед. ID U00096.3), расположенный на 16 нуклеотидов выше кодона инициации трансляции гена glpA 166- nucleotide fragment of DNA obtained from the genomic DNA of E. soy (ref. sequence. ID U00096.3), located at 16 nucleotides upstream of the codon initiation of translation of the glpA gene PglpD 5’U TR-glpDdl6 nb PglpD 5’U TR-glpDdl6 nb SEQ ID NO: 3 SEQ ID NO: 3 TGCGTCTCTCTTTCTTTACAAACAAGTGG GCAAATTTACCGCACAGTTTACGTCGAA GCGGCAGATAAACGCCATAATGTTATAC ATATCACTCTAAAATGTTTTTTCAATGTT ACCTAAAGCGCGATTCTTTGCTAATATG TTCGATAACGAACATTTATGAGCTTTAA CGAA TGCGTCTCTCTTTCTTTACAAACAAGTGG GCAAATTTACCGCACAGTTTACGTCGAA GCGGCAGATAAACGCCATAATGTTATAC ATATCACTCTAAAATGTTTTTTCAATGTT ACCTAAAGCGCGATTCTTTGCTAATATG TTCGATAACGAACATTTATGAGCTTTAA CGAA 174- нуклеотидный фрагмент ДНК, полученный из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенный на 16 нуклеотидов выше кодона инициации трансляции гена 174- nucleotide fragment of DNA obtained from genomic DNA of E. coli (ref. sequence. ID U00096.3), located at 16 nucleotides upstream of the codon initiation of gene translation

- 11 044676- 11 044676

glpD glpD PglpT- 5’UTRglpT-dl6nb PglpT- 5'UTRglpT-dl6nb SEQ ID NO: 4 SEQ ID NO: 4 CCATTTAGCCATAGTAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCAAC TCAAGAAACGGCAGGTTCTCTCACTGAA TCAGGCTGTTAATCATAAATAAGACCAC GG CCATTTAGCCATAGTAAAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCAAC TCAAGAAACGGCAGGTTCTCTCACTGAA TCAGGCTGTTAATCATAAATAAGACCAC GG 229нуклеотидный фрагмент ДНК, полученный из геномной ДНК Е. сой (реф.послед. ID U00096.3), расположенный на 16 нуклеотидов выше кодона инициации трансляции гена glpT A 229-nucleotide DNA fragment obtained from the genomic DNA of E. soy (ref. sequence ID U00096.3), located at 16 nucleotides upstream of the codon initiation of translation of the glpT gene 16nb -glpF 16nb -glpF SEQ ID NO: 5 SEQ ID NO: 5 TCTTCAGGATCCGATT TCTTCAGGATCCGATT 16-нуклеотид ный фрагмент ДНК, полученный из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенный непосредственно выше кодона инициации трансляции гена glpF A 16-nucleotide DNA fragment obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located immediately upstream of the codon initiation of translation of the glpF gene 16nb -glpA 16nb-glpA SEQ ID NO: 6 SEQ ID NO: 6 CTTCAGAGGGATAACA CTTCAGAGGGATAACA 16-нуклеотид ный фрагмент ДНК, полученный из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенный непосредственно A 16-nucleotide DNA fragment obtained from the genomic DNA of E. coli (ref. sequence ID U00096.3), located directly

- 12 044676- 12 044676

выше кодона инициации трансляции гена glpA upstream codon initiation glpA gene translation 16nb-glpD 16nb-glpD SEQ ID NO: 7 SEQ ID NO: 7 AGTGAATGAGGGCAGC AGTGAATGAGGGCAGC 16-нуклеотид ный фрагмент ДНК, полученный из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенный выше кодона инициации трансляции гена glpD A 16-nucleotide DNA fragment obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located upstream of the codon initiation of translation of the glpD gene 16nb -glpT 16nb -glpT SEQ ID NO: 8 SEQ ID NO: 8 GCCACGGAGGCTATCA GCCACGGAGGCTATCA 16 -нуклеотидный фрагмент ДНК, полученный из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенный непосредственно выше кодона инициации трансляции гена glpT A 16-nucleotide DNA fragment obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located immediately upstream of the codon initiation of translation of the glpT gene 16bnb-lacZ 16bnb-lacZ SEQ ID NO: 9 SEQ ID NO: 9 CACACAGGAAACAGCT CACACAGGAAACAGCT 16-нуклеотид ный фрагмент ДНК, полученный из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенный выше lacZ A 16-nucleotide DNA fragment obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located upstream of lacZ

- 13 044676- 13 044676

mutl6bp lacZ (recRBS) mutl6bp lacZ (recRBS) SEQ ID NO: 10 SEQ ID NO: 10 CAAGGAGGAAACAGCT CAAGGAGGAAACAGCT Вариант SEQ ID NO: 9) (CAC -> AGG) Option SEQ ID NO: 9) (CAC -> AGG) Plac_org Plac_org SEQ ID NO: 11 SEQ ID NO: 11 TGTGAGTTAGCTCACTCATTAGGCACCC CAGGCTTTACACTTTATGCTTCCGGCTCG TATGTTGTGTGGAATTGTGAGCGGATAA CAATTTCACACAGGAAACAGCT TGTGAGTTAGCTCACTCATTAGGCACCC CAGGCTTTACACTTTATGCTTCCGGCTCG TATGTTGTGTGGAATTGTGAGCGGATAA CAATTTCACACAGGAAACAGCT 107нуклеотидный фрагмент ДНК, расположенный выше lacZ, полученного из геномной ДНК Е. сой (реф.послед. ID U00096.3); элемент промотора 1асоперона 107 nucleotide DNA fragment located upstream of lacZ, obtained from genomic DNA of E. soy (ref. sequence ID U00096.3); 1asoperon promoter element PglpF_54n b 5 ’URTglpF_recRB S (PglpF_rec ) PglpF_54n b 5 'URTglpF_recRB S (PglpF_rec ) SEQ ID NO: 12 SEQ ID NO: 12 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGGAGGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGGAGGAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ Ш NO: 1 и SEQ ID NO: 10 300 nucleotide DNA fragment containing SEQ Ш NO: 1 and SEQ ID NO: 10 PglpF_SDl PglpF_SDl SEQ ID NO:13 SEQ ID NO:13 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG 300нуклеотидный фрагмент ДНК, содержащий SEQ Ю NO: 1 и SEQ ID NO: 38 (см. фигуру 6) 300 nucleotide DNA fragment containing SEQ ID NO: 1 and SEQ ID NO: 38 (see figure 6)

- 14 044676- 14 044676

TGACTTTCACGCATACAACAAACATTAA CCAAATTCGAAACAGCT TGACTTTCACGCATACAACAAACATTAA CCAAATTCGAAACAGCT PglpF_SD2 PglpF_SD2 SEQ ID NO: 14 SEQ ID NO: 14 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGCGCAAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGCGCAAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ ID NO: 1 и SEQ ID NO: 39 (cm. фигуру 6) 300 nucleotide DNA fragment containing SEQ ID NO: 1 and SEQ ID NO: 39 (see figure 6) PglpF_SD3 PglpF_SD3 SEQ ID NO:15 SEQ ID NO:15 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGAACAAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGAACAAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ ID NO: 1 и SEQ Ш NO: 40 (см. фигуру 6) 300 nucleotide DNA fragment containing SEQ ID NO: 1 and SEQ Ш NO: 40 (see figure 6) PglpF_SD4 PglpF_SD4 SEQ ID NO:16 SEQ ID NO:16 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAACTAGGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAACTAGGAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ Ю NO: 1 и SEQ ГО NO:41 (см. фигуру 6) 300 nucleotide DNA fragment containing SEQ Yu NO: 1 and SEQ GO NO:41 (see figure 6)

- 15 044676- 15 044676

PglpF_SD5 PglpF_SD5 SEQ ID NO: 17 SEQ ID NO: 17 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAACCGAGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAACCGAGAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ ID NO: 1 и SEQ ID NO:42 (cm. фигуру 6) 300 nucleotide DNA fragment containing SEQ ID NO: 1 and SEQ ID NO: 42 (see figure 6) PglpF_SD6 PglpF_SD6 SEQ ID NO:18 SEQ ID NO:18 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGAGCTAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGAGCTAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ ID NO: 1 и SEQ ID NO:43 (cm. фигуру 6) 300 nucleotide DNA fragment containing SEQ ID NO: 1 and SEQ ID NO:43 (see figure 6) PglpF_SD7 PglpF_SD7 SEQ ID NO:19 SEQ ID NO:19 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGAGCAAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCAGCATACAACAAACATTAA CCAAGAGCAAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ ID NO: 1 и SEQ Ш NO:44 (см. фигуру 7)4 300 nucleotide DNA fragment containing SEQ ID NO: 1 and SEQ Ш NO:44 (see Figure 7)4 PglpF_SD8 PglpF_SD8 SEQ ID NO:20 SEQ ID NO:20 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT 300- нуклеотидный 300- nucleotide

- 16 044676- 16 044676

AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGAGAAAAACAGCT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGAAAAACAG C.T. фрагмент ДНК, содержащий SEQ ID NO: 1 и SEQ ID NO:45 (cm. фигуру 7) DNA fragment containing SEQ ID NO: 1 and SEQ ID NO:45 (see figure 7) PglpF_SD9 PglpF_SD9 SEQ ID NO:21 SEQ ID NO:21 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAAGGAAAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAAGGAAAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ ID NO: 1 и SEQ Ш NO:46 (см. фигуру 7) 300 nucleotide DNA fragment containing SEQ ID NO: 1 and SEQ Ш NO:46 (see figure 7) PglpF_SDl 0 PglpF_SDl 0 SEQ ID NO:22 SEQ ID NO:22 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAACTGAGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTA CAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAACTGAGAAACAGCT 300нуклеотидный фрагмент ДНК, содержащий SEQ Ю NO: 1 и SEQ Ш NO: 47 (см. фигуру 7) 300 nucleotide DNA fragment containing SEQ I NO: 1 and SEQ W NO: 47 (see figure 7) PglpF_9 PglpF_9 SEQ ID NO:23 SEQ ID NO:23 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA Вариант SEQ ID NO: 12, содержащий модификацию Variant SEQ ID NO: 12 containing modification

- 17 044676- 17 044676

TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATTTAATTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGGAGGAAACAGCT TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATTTAATTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGGAGGAAACAGCT области -10 (см. фигуру 7) area -10 (see figure 7) PglpF_l 1 PglpF_l 1 SEQ ID NO:24 SEQ ID NO:24 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATCAGAATAC AGCATGCCTACAAGCATCGTGGAGGTCC GTGACTTTCACGCATACAACAAACATTA ACCAAGGAGGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATCAGAATAC AGCATGCCTACAAGCATCGTGGAGGTCC GTGACTTTCACGCATACAACAAACATTA ACCAAGGAGAAACAGCT Вариант SEQ ID NO: 12, содержащий модификацию области -10 (см. фигуру 7) Variant SEQ ID NO: 12 containing modification of region -10 (see figure 7) PglpF_13 PglpF_13 SEQ ID NO:25 SEQ ID NO:25 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATATCCTTCCT ACAGCATGCCTACAAGCATCGTGGAGGT CCGTGACTTTCACGCATACAACAAACAT TAACCAAGGAGGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATATCCTTCCT ACAGCATGCCTACAAGCATCGTGGAGGT CCGTGACTTTCACGCATACAACAAACAT TAACCAAGGAGGAAACAGCT Вариант SEQ ID NO: 12, содержащий модификацию области -10 (см. фигуру 7) Variant SEQ ID NO: 12 containing modification of region -10 (see figure 7) PglpF_17 PglpF_17 SEQ ID NO:26 SEQ ID NO:26 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA Вариант SEQ ID NO: 12, содержащий модификацию области -10 (см. фигуру 7) Variant SEQ ID NO: 12 containing modification of region -10 (see figure 7)

- 18 044676- 18 044676

GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAATGATAC AGCATGCCTACAAGCATCGTGGAGGTCC GTGACTTTCACGCATACAACAAACATTA ACCAAGGAGGAAACAGCT GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAATGATAC AGCATGCCTACAAGCATCGTGGAGGTCC GTGACTTTCACGCATACAACAAACATTA ACCAAGGAGAAACAGCT PglpF_19 PglpF_19 SEQ ID NO:27 SEQ ID NO:27 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATGAAGCTAC AGCATGCCTACAAGCATCGTGGAGGTCC GTGACTTTCACGCATACAACAAACATTA ACCAAGGAGGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATGAAGCTAC AGCATGCCTACAAGCATCGTGGAGGTCC GTGACTTTCACGCATACAACAAACATTA ACCAAGGAGAAACAGCT Вариант SEQ ID NO: 12, содержащий модификацию области -10 (см. фигуру 7) Variant SEQ ID NO: 12 containing modification of region -10 (see figure 7) PglpF_20 PglpF_20 SEQ ID NO:28 SEQ ID NO:28 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATCAGTATACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGGAGGAAACAGCT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATCAGTATACA GCATGCC TACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CCAAGGAGGAAACAGCT Вариант SEQ ID NO: 12, содержащий модификацию области -10 (см. фигуру 7) Variant SEQ ID NO: 12 containing modification of region -10 (see figure 7) D15PglpF D15PglpF SEQ ID NO:29 SEQ ID NO:29 GATTACGGTTTGCCACACTTTTCATCCTT CTCCTGGTGACATAATCCACATCAATCG AAAATGTTAATAAATTTGTTGCGCGAAT GATCTAACAAACATGCATCATGTACAAT CAGATGGAATAAATGGCGCGATAACGCT CATTTTATGACGAGGCACACACATTTTA AGTTCGATATTTCTCGTTTTTGCTCGTTA ACGATAAGTTTACAGCATGCCTACAAGC GATTACGGTTTGCCACACTTTTCATCCTT CTCCTGGTGACATAATCCACATCAATCG AAAATGTTAATAAATTTGTTGCGCGAAT GATCTAACAAACATGCATCATGTACAAT CAGATGGAATAAATGGCGCGATAACGCT CATTTTATGACGAGGCACACACATTTTA AGTTCGATATTTCTCGTTTTTGCTCGTTA ACGATAAGTTTACAGCATGCCTACAAGC 285нуклеотидный фрагмент ДНК of SEQ ID NO: 12 285 nucleotide DNA fragment of SEQ ID NO: 12

- 19 044676- 19 044676

ATCGTGGAGGTCCGTGACTTTCACGCAT ACAACAAACATTAACCAAGGAGGAAAC AGCT ATCGTGGAGGTCCGTGACTTTCACGCAT ACAACAAACATTAACCAAGGAGGAAAC AGCT D140PglpF D140PglpF SEQ ID NO:30 SEQ ID NO:30 ATGGCGCGATAACGCTCATTTTATGACG AGGCACACACATTTTAAGTTCGATATTT CTCGTTTTTGCTCGTTAACGATAAGTTTA CAGCATGCCTACAAGCATCGTGGAGGTC CGTGACTTTCACGCATACAACAAACATT AACCAAGGAGGAAACAGCT ATGGCGCGATAACGCTCATTTTATGACG AGGCACACACATTTTAAGTTCGATATTT CTCGTTTTTGCTCGTTAACGATAAGTTTA CAGCATGCCTACAAGCATCGTGGAGGTC CGTGACTTTCACGCATACAACAAACATT AACCAAGGAGGAAACAGCT 160- ну клеотидный фрагмент ДНК of SEQ ID NO: 12 160- well cleotid DNA fragment of SEQ ID NO: 12 D165PglpF D165PglpF SEQ ID NO:31 SEQ ID NO:31 ACGAGGCACACACATTTTAAGTTCGATA TTTCTCGTTTTTGCTCGTTAACGATAAGT TTACAGCATGC CTACAAGCATCGTGGAGGTCCGTGACTT TCACGCATACAACAAACATTAACCAAGG AGGAAACAGCT ACGAGGCACACACATTTTAAGTTCGATA TTTCTCGTTTTTGCTCGTTAACGATAAGT TTACAGCATGC CTACAAGCATCGTGGAGGTCCGTGACTT TCACGCATACAACAAACATTAACCAAGG AGGAAACAGCT 135- ну клеотидный фрагмент ДНК of SEQ ID NO: 12 135- well cleotid DNA fragment of SEQ ID NO: 12 D180PglpF D180PglpF SEQ ID NO:32 SEQ ID NO:32 TTTAAGTTCGATATTTCTCGTTTTTGCTC GTTAACGATAAGTTTACAGCATGCCTAC AAGCATCG TGGAGGTCCGTGACTTTCACGCATACAA CAAACATTAACCAAGGAGGAAACAGCT TTTAAGTTCGATATTTCTCGTTTTTTGCTC GTTAACGATAAGTTTACAGCATGCCTAC AAGCATCG TGGAGGTCCGTGACTTTCACGCATACAA CAAACATTAACCAAGGAGGAAACAGCT 120- ну клеотидный фрагмент ДНК of SEQ ID NO: 12 120- well cleotid DNA fragment of SEQ ID NO: 12 PglpA_- 5’UTRglpA_recRB S (rec PglpA) PglpA_- 5'UTRglpA_recRB S (rec PglpA) SEQ ID NO:33 SEQ ID NO:33 GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGAAATCAAACAATTCATGTTTTT ACTATGGCTAAATGGTAAAAAACGAAC AAGGAGGAAACAGCT GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGAAATCAAACAATTCATGTTTTTT ACTATGGCTAAATGGTAAAAACGAAC AAGGAGGAAACAGCT 182- ну клеотидный фрагмент ДНК comprising SEQ ID NO: 2 and SEQ ID NO: 10 182- well cleotid DNA fragment comprising SEQ ID NO: 2 and SEQ ID NO: 10 PglpD 5’U TRglpD_recR BS (rec PglpD) PglpD 5'U TRglpD_recR B.S. (rec PglpD) SEQ ID NO:34 SEQ ID NO:34 TGCGTCTCTCTTTCTTTACAAACAAGTGG GCAAATTTACCGCACAGTTTACGTCGAA GCGGCAGATAAACGCCATAATGTTATAC ATATCACTCTAAAATGTTTTTTCAATGTT ACCTAAAGCGCGATTCTTTGCTAATATG TTCGATAACGAACATTTATGAGCTTTAA CGAACAAGGAGGAAACAGCT TGCGTCTCTCTTTCTTTACAAACAAGTGG GCAAATTTACCGCACAGTTTACGTCGAA GCGGCAGATAAACGCCATAATGTTATAC ATATCACTCTAAAATGTTTTTTCAATGTT ACCTAAAGCGCGATTCTTTGCTAATATG TTCGATAACGAACATTTATGAGCTTTAA CGAACAAGGAGGAAACAGCT 190- ну клеотидный фрагмент ДНК, содержащий SEQ ID NO: 3 и SEQ ID NO: 10 190- well cleotid DNA fragment containing SEQ ID NO: 3 and SEQ ID NO: 10 PglpT 5’U PglpT 5'U SEQ ID SEQ ID CCATTTAGCCATAGTAAAAACATGAATT CCATTTAGCCATAGTAAAAAAACATGAATT 245- 245-

- 20 044676- 20 044676

TRglpT_recRB S (rec PglpT TRglpT_recRB S (rec PglpT NO:35 NO:35 GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCAAC TCAAGAAACGGCAGGTTCTCTCACTGAA TCAGGCTGTTAATCATAAATAAGACCAC GGCAAGGAGGAAACAGCT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCAAC TCAAGAAACGGCAGGTTCTCTCACTGAA TCAGGCTGTTAATCATAAATAAGACCAC GGCAAGGAGGAAACAGCT нуклеотидный фрагмент ДНК, содержащий SEQ ID NO: 4 и SEQ ID NO: 10 nucleotide fragment of DNA containing SEQ ID NO: 4 and SEQ ID NO: 10 54nb 5’UTRglpF 54nb 5'UTRglpF SEQ ID NO:36 SEQ ID NO:36 TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAAC TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAAC 54-нуклеотидный фрагмент ДНК о 5’UTR-glpF, расположенный ниже сайта инициации транскрипции и на 16 нуклеотидов выше кодона инициации трансляции A 54-nucleotide fragment of DNA about the 5'UTR-glpF located downstream of the site initiation transcriptions and 16 nucleotides upstream codon initiation broadcasts synDNA(i) (70UTR) synDNA(i) (70UTR) SEQ ID NO:37 SEQ ID NO:37 TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA AGGAGGAAACAGCT TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA AGGAGGAAACAGCT 70-нуклеотидная синтетическая некодирующая последовательное ть ДНК (ii), содержащая SEQ ID NO: 36 и SEQ ID NO: 10 70-nucleotide synthetic non-coding sequence of DNA (ii) containing SEQ ID NO: 36 and SEQ ID NO: 10 recRBS_vl (SD1) recRBS_vl (SD1) SEQ ID NO:38 SEQ ID NO:38 CAAATTCGAAACAGCT CAAATTCGAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_v2 (SD2) recRBS_v2 (SD2) SEQ ID NO:39 SEQ ID NO:39 CAAGCGCAAAACAGCT CAAGCGCAAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_v3 recRBS_v3 SEQ ID SEQ ID CAAGAACAAAACAGCT CAAGAACAAAACAGCT Вариант SEQ ID Option SEQ ID

- 21 044676- 21 044676

(SD3) (SD3) NO:40 NO:40 NO: 10 (см. фиг.6, A) NO: 10 (see Fig.6, A) recRBS_v4 (SD4) recRBS_v4 (SD4) SEQ ID N0:41 SEQ ID N0:41 CAACTAGGAAACAGCT CAACTAGGAAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_v5 (SD5) recRBS_v5 (SD5) SEQ ID NO:42 SEQ ID NO:42 CAACCGAGAAACAGCT CAACCGAGAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_v6 (SD6) recRBS_v6 (SD6) SEQ ID NO:43 SEQ ID NO:43 CAAGAGCTAAACAGCT CAAGAGCTAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_v7 (SD7) recRBS_v7 (SD7) SEQ ID NO:44 SEQ ID NO:44 CAAGAGCAAAACAGCT CAAGAGCAAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_v8 (SD8) recRBS_v8 (SD8) SEQ ID NO:45 SEQ ID NO:45 CAAGAGAAAAACAGCT CAAGAGAAAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_v9 (SD9) recRBS_v9 (SD9) SEQ ID NO:46 SEQ ID NO:46 CAAAGGAAAAACAGCT CAAAGGAAAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) recRBS_vl 0 (SD10) recRBS_vl 0 (SD10) SEQ ID NO:47 SEQ ID NO:47 CAACTGAGAAACAGCT CAACTGAGAAACAGCT Вариант SEQ ID NO: 10 (см. фиг.6, A) Option SEQ ID NO: 10 (see Fig. 6, A) PglpA_org PglpA_org SEQ ID NO:48 SEQ ID NO:48 GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGA GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGA 119- нуклеотидный фрагмент ДНК, полученный из геномной ДНК Е. сой (реф.послед. ID U00096.3), расположенный выше точки инициации транскрипции 119- nucleotide fragment of DNA obtained from the genomic DNA of E. soy (ref. sequence. ID U00096.3), located above the point transcription initiation

-22044676-22044676

glpA; элемент промотора glpA glpA; element glpA promoter PglpT_org PglpT_org SEQ ID NO:49 SEQ ID NO:49 CCATTTAGCCATAGTAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCA CCATTTAGCCATAGTAAAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGGCA 169- нуклеотидный фрагмент ДНК, полученный из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенный выше точки инициации транскрипции glpT; элемент промотора glpT 169- nucleotide fragment of DNA obtained from genomic DNA of E. coli (ref. sequence. ID U00096.3), located above the point glpT transcription initiation; element glpT promoter PglpA_70U TR PglpA_70U TR SEQ ID NO:50 SEQ ID NO:50 GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGATGCCTACAAGCATCGTGGAGG TCCGTGACTTTCACGCATACAACAAACA TTAACCAAGGAGGAAACAGCT GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGATGCCTACAAGCATCGTGGAGG TCCGTGACTTTCACGCATACAACAAACA TTAACCAAGGAGGAAACAGCT 189нуклеотидный фрагмент ДНК, полученный путем объединения SEQ ID NO: 49 с SEQ ID NO 37 189 nucleotide DNA fragment obtained by combining SEQ ID NO: 49 with SEQ ID NO 37 PglpT_70U TR PglpT_70U TR SEQ ID NO: 51 SEQ ID NO: 51 CCATTTAGCCATAGTAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCA TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA AGGAGGAAACAGCT CCATTTAGCCATAGTAAAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGGCA TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA AGGAGGAAACAGCT 239нуклеотидный фрагмент ДНК, полученный путем объединения SEQ ID NO: 50 с синтетической некодирующей последовательное тью ДНК (и) (SEQ ID NO 37) 239 nucleotide DNA fragment obtained by combining SEQ ID NO: 50 with synthetic non-coding sequence DNA(s) (SEQ ID NO 37)

- 23 044676- 23 044676

PglpT_70U TR_SD4 PglpT_70U TR_SD4 SEQ ID NO:52 SEQ ID NO:52 CCATTTAGCCATAGTAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCA TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA ACTAGGAAACAGCT CCATTTAGCCATAGTAAAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGGCA TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA ACTAGGAAACAGCT 239нуклеотидный фрагмент ДНК SEQ ГО NO: 50 где 16 π.о., расположенные выше сайта инициации трансляции, идентичны SEQ ID NO 41 239 nucleotide DNA fragment SEQ GO NO: 50 where 16 π.o. located above the site translation initiations, identical to SEQ ID NO 41 PglpT_70U TR_SD9 PglpT_70U TR_SD9 SEQ ID NO:53 SEQ ID NO:53 CCATTTAGCCATAGTAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCA TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA AAGGAAAAACAGCT CCATTTAGCCATAGTAAAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGGCA TGCCTACAAGCATCGTGGAGGTCCGTGA CTTTCACGCATACAACAAACATTAACCA AAGGAAAAACAGCT 239нуклеотидный фрагмент ДНК SEQ ГО NO: 50, где 16 п.о., расположенные выше сайта инициации трансляции, идентичны SEQ ID NO 46 239 nucleotide DNA fragment SEQ GO NO: 50, where 16 bp, located above the site translation initiations, identical to SEQ ID NO 46 PglpF_org PglpF_org SEQ ID NO:54 SEQ ID NO:54 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCA GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCA 230- нуклеотидная последовательное ть ДНК, полученная из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенная выше точки инициации транскрипции glpF; элемент промотора glpF 230 nucleotide DNA sequence, obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located above the point glpF transcription initiation; element glpF promoter

- 24 044676- 24 044676

PglpT- 5 ’UTRglpT_org PglpT- 5 'UTRglpT_org SEQ ID NO:55 SEQ ID NO:55 CCATTTAGCCATAGTAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCAAC TCAAGAAACGGCAGGTTCTCTCACTGAA TCAGGCTGTTAATCATAAATAAGACCAC GGGCCACGGAGGCTATCA CCATTTAGCCATAGTAAAAAAACATGAATT GTTTGATTTCGCGCATATTCGCTCATAAT TCGAAAGTGAAACGTGATTTCATGCGTC ATTTTGAACATTTTGTAAATCTTATTTAA TAATGTGTGCGGCAATTCACATTTAATTT ATGAATGTTTTCTTAACATCGCGGCAAC TCAAGAAACGGCAGGTTCTCTCACTGAA TCAGGCTGTTAATCATAAATAAGACCAC GGGCCACGGAGGCTATCA 245-нуклеотидная последовательное ть ДНК, полученная из геномной ДНК Е. сой (реф.послед. ID U00096.3), расположенная выше сайта инициации трансляции glpT 245 nucleotide DNA sequence, obtained from the genomic DNA of E. soy (ref. sequence ID U00096.3), located upstream of the site glpT translation initiation PglpA- 5 ’UTRglpA_org PglpA- 5 'UTRglpA_org SEQ ID NO:56 SEQ ID NO:56 GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGAAATCAAACAATTCATGTTTTT ACTATGGCTAAATGGTAAAAAACGAA CTTCAGAGGGATAACA GAAAACATTCATAAATTAAATGTGAATT GCCGCACACATTATTAAATAAGATTTAC AAAATGTTCAAAATGACGCATGAAATCA CGTTTCACTTTCGAATTATGAGCGAATA TGCGCGAAATCAAACAATTCATGTTTTTT ACTATGGCTAAATGGTAAAAAAACGAA CTTCAGAGGGATAACA 182-нуклеотидная последовательное ть ДНК, полученная из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенная выше сайта инициации трансляции glpA 182 nucleotide DNA sequence, obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located upstream of the site glpA translation initiation PglpF 5’UTRglpF_org PglpF 5'UTRglpF_org SEQ ID NO:57 SEQ ID NO:57 GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CTCTTCAGGATCCGATT GCGGCACGCCTTGCAGATTACGGTTTGC CACACTTTTCATCCTTTCTCCTGGTGACAT AATCCACATCAATCGAAAATGTTAATAA ATTTGTTGCGCGAATGATCTAACAAACA TGCATCATGTACAATCAGATGGAATAAA TGGCGCGATAACGCTCATTTTATGACGA GGCACACACATTTTAAGTTCGATATTTCT CGTTTTTGCTCGTTAACGATAAGTTTACA GCATGCCTACAAGCATCGTGGAGGTCCG TGACTTTCACGCATACAACAAACATTAA CTCTTCAGGATCCGATT 300- нуклеотидная последовательное ть ДНК, полученная из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенная выше сайта инициации трансляции glpF 300 nucleotide DNA sequence, obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located upstream of the site glpF translation initiation PglpD 5’UTRglpD_org PglpD 5'UTRglpD_org SEQ ID NO: 10 4 SEQ ID NO: 10 4 TGCGTCTCTCTTTCTTTACAAACAAGTGG GCAAATTTACCGCACAGTTTACGTCGAA GCGGCAGATAAACGCCATAATGTTATAC ATATCACTCTAAAATGTTTTTTCAATGTT ACCTAAAGCGCGATTCTTTGCTAATATG TTCGATAACGAACATTTATGAGCTTTAA CGAA AGTGAATGAGGGCAGC TGCGTCTCTCTTTCTTTACAAACAAGTGG GCAAATTTACCGCACAGTTTACGTCGAA GCGGCAGATAAACGCCATAATGTTATAC ATATCACTCTAAAATGTTTTTTCAATGTT ACCTAAAGCGCGATTCTTTGCTAATATG TTCGATAACGAACATTTATGAGCTTTAA CGAA AGTGAATGAGGGCAGC 190-нуклеотидная последовательное ть ДНК, полученная из геномной ДНК Е. coli (реф.послед. ID U00096.3), расположенная выше точки инициации трансляции glpD 190 nucleotide DNA sequence, obtained from E. coli genomic DNA (ref. sequence ID U00096.3), located above the point glpD translation initiation

Как указано выше, в некоторых предпочтительных вариантах осуществления конструкция включает три функционально связанных ДНК-последовательности: премоторную ДНК-последовательность (й), последовательность синтетической некодирующей ДНК (i) и по меньшей мере одну последовательность кодирующей ДНК (iii) (ген). Кодирующая ДНК-последовательность (iii) представляет собой выделенную ДНК-последовательность, которая приблизительно на 70-100% идентична последовательности фрагмента геномной ДНК, содержащей ген, кодирующий биологическую молекулу, например белок или РНК. Кодирующая ДНК (iii) конструкции может быть гомологичной или гетерологичной промоторнойAs stated above, in some preferred embodiments, the construct includes three operably linked DNA sequences: a premotor DNA sequence(s), a synthetic non-coding DNA sequence (i), and at least one coding DNA sequence (iii) (gene). The coding DNA sequence (iii) is an isolated DNA sequence that is approximately 70-100% identical to the sequence of a fragment of genomic DNA containing a gene encoding a biological molecule, such as a protein or RNA. The coding DNA (iii) of the construct may be homologous or heterologous to the promoter

-25044676-25044676

ДНК-последовательности (ii). Гетерологичный в настоящем контексте означает, что экспрессия соответствующей геномной кодирующей ДНК-последовательности обычно контролируется другим промотором, а не промотором конструкции. Соответственно гомологичный в настоящем контексте означает, что соответствующие геномные последовательности промоторной последовательности ДНК (ii) и кодирующей последовательности ДНК (iii) естественным образом связаны в геноме исходного вида.DNA sequences (ii). Heterologous in the present context means that the expression of the corresponding genomic coding DNA sequence is typically controlled by a promoter other than the promoter of the construct. Accordingly, homologous in the present context means that the corresponding genomic sequences of the promoter DNA sequence (ii) and the coding DNA sequence (iii) are naturally related in the genome of the parent species.

Под термином кодирующая нуклеотидная последовательность подразумевается нуклеотидная последовательность, которая содержит набор последовательных неперекрывающихся триплетов (кодонов), которые транскрибируются в мРНК и транслируются в полипептид, когда находятся под контролем соответствующих контрольных последовательностей, т.е. промотора. Границы кодирующей последовательности обычно определяются сайтом связывания рибосомы, расположенным непосредственно перед открытой рамкой считывания на 5'-конце мРНК, стартовым кодоном транскрипции (AUG, GUG или UUG) и стоп-кодоном трансляции (UAA, UGA или UAG). Кодирующая последовательность может включать, но не ограничивается ими, геномную ДНК, кДНК, синтетические и рекомбинантные нуклеотидные последовательности.By the term coding nucleotide sequence is meant a nucleotide sequence that contains a set of consecutive non-overlapping triplets (codons) that are transcribed into mRNA and translated into a polypeptide when under the control of appropriate control sequences, i.e. promoter The boundaries of the coding sequence are usually defined by the ribosome binding site located immediately upstream of the open reading frame at the 5' end of the mRNA, the transcription start codon (AUG, GUG, or UUG), and the translation stop codon (UAA, UGA, or UAG). The coding sequence may include, but is not limited to, genomic DNA, cDNA, synthetic and recombinant nucleotide sequences.

В предпочтительном варианте кодирующая нуклеотидная последовательность конструкции по изобретению является гетерологичной по отношению к промотору и, в некоторых вариантах, также по отношению к первому фрагменту ДНК некодирующей ДНК-последовательности (i) в конструкции. Тем не менее в отношении клетки-хозяина, в которой должна экспрессироваться кодирующая ДНК, указанная ДНК может быть либо гетерологичной (т.е. полученной из другого биологического вида или рода), либо гомологичной (т.е. полученной из клетки-хозяина). Например, в одном варианте кодирующая ДНК-последовательность конструкции может кодировать биологическую молекулу, например белок, который является чужеродным для хозяина, т.е. нуклеотидная последовательность кодирующей ДНК является гетерологичной по отношению к виду-хозяину, поскольку она имеет свое происхождение из видадонора, который отличается от организма хозяина, или нуклеотидная последовательность кодирующей ДНК содержит модификацию, которая приводит к экспрессии полипептида, который не идентичен полипептиду, экспрессирующемуся с соответствующей немодифицированной ДНК-последовательности хозяина, т.е. искусственно модифицированная кодирующая последовательность ДНК, исходно полученная из хозяина, рассматривается в настоящем контексте как гетерологичная. В случае, если хозяином является конкретный прокариотический вид, гетерологичная нуклеотидная последовательность может иметь свое происхождение из другого рода семейства, другого порядка или класса, другого типа (отдела), или другого домена (надцарства) организмов. Гетерологичная нуклеотидная последовательность, происходящая от донора, отличного от хозяина, может быть модифицирована перед ее введением в клетку-хозяина мутациями, вставками, делециями или заменами отдельных нуклеиновых кислот или части гетерологичной нуклеотидной последовательности до тех пор, пока такие модифицированные последовательности обладают той же функцией (функционально эквивалентные), что и эталонная последовательность. Гетерологичная нуклеотидная последовательность, как указано в настоящем документе, охватывает также нуклеотидные последовательности, происходящие из другого домена (надцарства) организмов, таких как эукариоты (эукариотическое происхождение), такие как, например, ферменты, участвующие в синтезе или деградации олигосахаридов грудного молока (НМО). Тем не менее в других вариантах осуществления изобретения кодирующая нуклеиновая кислота может быть гомологичной по отношению к клеткехозяину. Термин гомологичная нуклеотидная последовательность (синонимично используемый в настоящем документе как нуклеотидная последовательность, нативная для хозяина или нуклеотидная последовательность, полученная из хозяина) в данном контексте означает, что нуклеотидная последовательность происходит (или получена) из того же самого организма, или того же рода семейства, или того же порядка или класса, того же типа (отдела) или того же домена (надцарства) организмов, что и организм-хозяин. В одном варианте осуществления кодирующая ДНК конструкции, описанной в настоящем документе, может кодировать фермент или белок-переносчик сахара, которые обычно экспрессируются бактериальной клеткой-хозяином, которая естественным образом содержит в своем геноме гены, кодирующие указанный белок-переносчик фермента или сахара.In a preferred embodiment, the coding nucleotide sequence of the construct of the invention is heterologous with respect to the promoter and, in some embodiments, also with respect to the first DNA fragment of non-coding DNA sequence (i) in the construct. However, with respect to the host cell in which the coding DNA is to be expressed, said DNA may be either heterologous (ie, derived from another species or genus) or homologous (ie, derived from a host cell). For example, in one embodiment, the DNA coding sequence of the construct may encode a biological molecule, such as a protein, that is foreign to the host, i.e. the nucleotide sequence of the coding DNA is heterologous with respect to the host species because it is of origin from a donor species that is different from the host organism, or the nucleotide sequence of the coding DNA contains a modification that results in the expression of a polypeptide that is not identical to the polypeptide expressed with the corresponding unmodified Host DNA sequences, i.e. an artificially modified DNA coding sequence originally derived from a host is considered heterologous in the present context. In the case where the host is a particular prokaryotic species, the heterologous nucleotide sequence may have its origin in another genus family, another order or class, another phylum (division), or another domain (superkingdom) of organisms. A heterologous nucleotide sequence derived from a donor other than the host may be modified before its introduction into a host cell by mutations, insertions, deletions or substitutions of individual nucleic acids or part of the heterologous nucleotide sequence as long as such modified sequences have the same function ( functionally equivalent) to the reference sequence. Heterologous nucleotide sequence as defined herein also includes nucleotide sequences originating from another domain (superkingdom) of organisms such as eukaryotes (eukaryotic origin), such as, for example, enzymes involved in the synthesis or degradation of human milk oligosaccharides (HMOs). . However, in other embodiments, the encoding nucleic acid may be homologous to the host cell. The term homologous nucleotide sequence (used synonymously herein as a nucleotide sequence native to a host or a nucleotide sequence derived from a host) as used herein means that the nucleotide sequence is derived from (or derived from) the same organism, or the same genus family, or the same order or class, the same phylum (division), or the same domain (superkingdom) of organisms as the host organism. In one embodiment, the coding DNA of a construct described herein may encode an enzyme or sugar transport protein that is typically expressed by a bacterial host cell that naturally contains in its genome genes encoding said enzyme or sugar transport protein.

В общем изобретение предусматривает любую кодирующую ДНК, поскольку любая кодирующая ДНК может быть включена в конструкцию по изобретению и транскрибирована с промотора, включенного в конструкцию. В некоторых предпочтительных вариантах кодирующая ДНК кодирует белок, например фермент, транспортный белок, регуляторный белок, шаперон и т.д. Термин белок взаимозаменяемо указывается в данном документе как полипептид. В других предпочтительных вариантах кодирующая ДНК может кодировать регуляторную (некодирующую) молекулу РНК (нкРНК), например, такую как функционально важные типы некодирующих РНК, таких как трансферные РНК (тРНК) и рибосомные РНК (рРНК), а также малые РНК, такие как микроРНК, миРНК и длинные нкРНК. В предпочтительном варианте осуществления по меньшей мере одна кодирующая ДНК конструкции по изобретению кодирует белок или РНК, связанные с синтезом, деградацией или транспортом олигосахаридов человеческого молока, их предшественников или производных. По меньшей мере одна кодирующая ДНК-последовательность означает, что конструкция в разных вариантах осуществления может содержать более одной кодирующей ДНК-последовательности, например две кодирующие последовательноIn general, the invention contemplates any coding DNA, since any coding DNA can be included in a construct of the invention and transcribed from a promoter included in the construct. In some preferred embodiments, the coding DNA encodes a protein, such as an enzyme, a transport protein, a regulatory protein, a chaperone, etc. The term protein is referred to interchangeably herein as a polypeptide. In other preferred embodiments, the coding DNA may encode a regulatory (non-coding) RNA molecule (ncRNA), such as, for example, functionally important types of non-coding RNAs such as transfer RNAs (tRNAs) and ribosomal RNAs (rRNAs), as well as small RNAs such as microRNAs , miRNAs and long ncRNAs. In a preferred embodiment, at least one DNA coding construct of the invention encodes a protein or RNA associated with the synthesis, degradation or transport of human milk oligosaccharides, precursors or derivatives thereof. At least one coding DNA sequence means that the construct in different embodiments may contain more than one coding DNA sequence, for example two coding sequences

- 26 044676 сти, такие как первая и вторая кодирующая последовательность; три кодирующие последовательности, такие как первая, вторая и третья кодирующие последовательности и т.д. Предпочтительно, чтобы множественные кодирующие ДНК-последовательности в этих вариантах осуществления экспрессировались в виде тандема, и транскрипция контролировалась одной копией промоторной ДНК (ii) конструкции. Первая, вторая, третья и т.д. кодирующие ДНК-последовательности могут в разных вариантах осуществления кодировать различные ферменты или другие белки, функция которых является существенной или полезной для продукции НМО клеткой-хозяином, например ферменты, транспортерные белки, регуляторные белки, шапероны и т.д. Под существенным в данном контексте подразумевается, что белок непосредственно участвует в синтезе НМО, например, он представляет собой фермент, который помогает процессу получения НМО из предшественника НМО, например фермент с активностью глюкозилтрансферазы. Под полезным в данном контексте подразумевается, что белок не участвует непосредственно в синтезе НМО, но он способствует процессу, который является полезным для продукции НМО клеткойхозяином, например это белок, который способствует транспорту (внутрь или наружу из клетки-хозяина) НМО или предшественника НМО. Некоторые неограничивающие варианты белков, которые рассматриваются в настоящем документе как существенные для получения одного или более НМО клеткойхозяином, можно найти в табл. 2, и белки, которые рассматриваются как полезные для получения одного или более НМО клеткой-хозяином приведены в табл. 3 ниже.- 26 044676 sti, such as the first and second coding sequence; three coding sequences, such as the first, second and third coding sequences, etc. Preferably, the multiple coding DNA sequences in these embodiments are expressed in tandem and transcription is controlled by a single copy of the promoter DNA (ii) construct. First, second, third, etc. The coding DNA sequences may, in various embodiments, encode various enzymes or other proteins whose function is essential or beneficial for HMO production by the host cell, such as enzymes, transporter proteins, regulatory proteins, chaperones, etc. By essential in this context is meant that the protein is directly involved in the synthesis of HMO, for example, it is an enzyme that assists in the process of producing HMO from a precursor of HMO, for example an enzyme with glucosyltransferase activity. By useful in this context is meant that the protein is not directly involved in the synthesis of HMO, but it contributes to a process that is beneficial for the production of HMO by the host cell, for example, a protein that facilitates the transport (into or out of the host cell) of HMO or a HMO precursor. Some non-limiting protein variants that are considered herein to be essential for the production of one or more HMOs by a host cell can be found in Table. 2, and proteins that are considered useful for the production of one or more HMOs by a host cell are listed in table. 3 below.

Таблица 2table 2

Ген Gene Последовательно сть, ID (GenBank) Sequence, ID (GenBank) Описание Description Пример НМО Example of CME IgtA IgtA WP_002248149.1 WP_002248149.1 β-1,3-Ν- ацетилглюкозаминилтранс фераза β-1,3-Ν- acetylglucosaminyltransferase LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFPV, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFPV, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH galT galT NP_207619.1 NP_207619.1 β-1,4- галактозилтрансфераза β-1,4- galactosyltransferase LNnT, LNFP-III, LNFP-VI, pLNH, F-pLNH I, pLNnH LNnT, LNFP-III, LNFP-VI, pLNH, F-pLNH I, pLNnH cpsIBJ cpsIBJ AB050723 AB050723 β-1,3- галактозилтрансфераза β-1,3- galactosyltransferase LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, F-pLNH I LNT, LNFP-I, LNFP-II, LNFP-V, LNDFH-I, LNDFH-II, pLNH, F-pLNH I MAMA_R 764 MAMA_R 764 AGC02224.1 AGC02224.1 α-1,3-фукозилтрансфераза α-1,3-fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I Mg791 Mg791 AEQ33441.1 AEQ33441.1 α-1,3-фукозилтрансфераза α-1,3-fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I Moumou_ 00703 Moumou_ 00703 AGC02224.1 AGC02224.1 α-1,3-фукозилтрансфераза α-1,3-fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I futA futA NP_207177.1 NP_207177.1 α-1,3-фукозилтрансфераза α-1,3-fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I futC futC CP003904 CP003904 α-1,2-фукоз илтрансфераза α-1,2-fucose yltransferase 2’FL, DFL, LNFP-I, LNDFH-I 2'FL, DFL, LNFP-I, LNDFH-I fucT fucT AAB81031.1 AAB81031.1 α-1,3-фукозилтрансфераза α-1,3-fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFPVI, LNDFH-II, F-pLNH I

- 27 044676- 27 044676

fucTIII fucTIII AY450598 AY450598 a-1,4-фукоз илтрансфераза a-1,4-fucose yltransferase LNDFH-I, LNDFH-II LNDFH-I, LNDFH-II fucTa fucTa AF194963 AF194963 a-1,3/4- фукозилтрансфераза a-1,3/4- fucosyltransferase LNFP-II, LNDFH-I, LNDFH-II LNFP-II, LNDFH-I, LNDFH-II Pd2,6ST Pd2.6ST BAA25316.1 BAA25316.1 а-2,6-сиалилтрансфераза a-2,6-sialyltransferase 6’SL 6'SL PspST6 PspST6 BAF92026.1 BAF92026.1 а-2,6-сиалилтрансфераза a-2,6-sialyltransferase 6’SL 6'SL PiST6_14 5 PiST6_14 5 BAF91416.1 BAF91416.1 а-2,6-сиалилтрансфераза a-2,6-sialyltransferase 6’SL 6'SL PiST6_ll 9 PiST6_ll 9 BAI49484.1 BAI49484.1 а-2,6-сиалилтрансфераза a-2,6-sialyltransferase 6’SL 6'SL NST NST AAC44541.1 AAC44541.1 а-2,3-сиалилтрансфераза a-2,3-sialyltransferase 3’SL 3'SL neuA neuA AF400048 AF400048 CMP-Neu5 Ас синтетаза CMP-Neu5 Ac synthetase 3’SL, 6’SL 3'SL, 6'SL neuB neuB AF400048 AF400048 Синтаза сиаловой кислоты Sialic acid synthase 3’SL, 6’SL, сиаловая кислота 3’SL, 6’SL, sialic acid neuC neuC AF400048 AF400048 О1сИАс-6-фосфат-2эпимераза O1cIAc-6-phosphate-2epimerase 3’SL, 6’SL, сиаловая кислота 3’SL, 6’SL, sialic acid

Таблица 3Table 3

Ген Gene Последовательность, ID (UniProt) Sequence, ID (UniProt) Описание Description Продукты НМО, описание CME products, description gmd gmd POAC88 POAC88 ООР-манноза-4,6- дегидратаза OOP-mannose-4,6- dehydratase 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI wcaG wcaG P32055 P32055 GDP-фукозосинтаза GDP fucose synthase 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI wcaH wcaH P32056 P32056 GDP-манноза- маннозилгидролаза GDP-mannose- mannosyl hydrolase 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI cpsB cpsB P24174 P24174 Манноза-1-фосфат гуанилилтрансфераза Mannose-1-phosphate guanylyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, 2'FL, 3'FL, DFL, LNFP-I, LNFP-II,

- 28 044676- 28 044676

LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNH I LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNH I cpsG cpsG P24175 P24175 Фосфоманномутаза Phosphomannomutase 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI glmS glmS P17169 P17169 Е-глутамин-О-фруктоза-6фосфат аминотрансфераза E-glutamine-O-fructose-6phosphate aminotransferase LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL glmU glmU P0ACC7 P0ACC7 Слитые N- ацетилглюкозамин-1-фосфатуридилтрансфераза и глюкозамин-1-фосфатацетилтрансфераза Merged N- acetylglucosamine-1-phosphate uridyltransferase and glucosamine-1-phosphate acetyltransferase LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL glmM glmM P3112O P3112O Фосфоглюкозамин-мутаза Phosphoglucosamine mutase LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL ampG ampG P0AE16 P0AE16 Муропептид: Н+симпортер Muropeptide: H+symporter LNT, LNnT, LNFP- I, LNFP-II, LNFP- III, LNFP-V, LNFP- VI, LNDFH-I, LNT, LNnT, LNFP- I, LNFP-II, LNFP- III, LNFP-V, LNFP- VI, LNDFH-I,

- 29 044676- 29 044676

nagA nagA P0AF18 P0AF18 N-ацетилглюкозамин-бфосфат-деацетилаза N-acetylglucosamine bphosphate deacetylase LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL N-ацетил-О- N-acetyl-O- LNT, LNnT, LNFP- LNT, LNnT, LNFP- глюкозаминакиназа glucosamine kinase I, LNFP-II, LNFP- I, LNFP-II, LNFP- III, LNFP-V, LNFP- III, LNFP-V, LNFP- nagK nagK P75959 P75959 β -N- ацетил гексозаминид аза β-N-acetyl hexosaminid aza VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- nagZ nagZ P75949 P75949 ДНК-связывающий DNA-binding VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFP- транскрипционный двойной transcription double I, LNFP-II, LNFP- I, LNFP-II, LNFP- регулятор PhoP PhoP regulator III, LNFP-V, LNFP- III, LNFP-V, LNFP- phop phop P23836 P23836 VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL Г лютаминсинтетаза Glutamine synthetase LNT, LNnT, LNFP- LNT, LNnT, LNFP- glnA glnA P0A9C5 P0A9C5 I, LNFP-II, LNFP- III, LNFP-V, LNFP- VI, LNDFH-I, I, LNFP-II, LNFP- III, LNFP-V, LNFP- VI, LNDFH-I,

- 30 044676- 30 044676

LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL ppk ppk P0A7B1 P0A7B1 Полифосфаткиназа Polyphosphate kinase LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL pykA pykA P21599 P21599 пируваткиназа II pyruvate kinase II LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL pgm pgm P36938 P36938 Фосфоглюкомутаза Phosphoglucomutase LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH galU galU P0AEP3 P0AEP3 UTP - глюкозо-1-Фосфатуридилилтрансфераза UTP - glucose-1-phosphaturidyl transferase LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFP- VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH galE galE P09147 P09147 иВР-глюкозо-4-эпимераза iBP-glucose-4-epimerase LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH LNT, LNnT, LNFPI, LNFP-II, LNFPIII, LNFP-V, LNFPVI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH

- 31 044676- 31 044676

ДНК-связывающий транскрипционный двойной регулятор NagC DNA-binding transcriptional dual regulator NagC LNT, LNnT, LNFP- I, LNFP-II, LNFP- III, LNFP-V, LNFP- LNT, LNnT, LNFP- I, LNFP-II, LNFP- III, LNFP-V, LNFP- nagC nagC P0AF20 P0AF20 Глюкокиназа Glucokinase VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, 3’SL, 6’SL 2'FL, 3'FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, glK glK P0A6V8 P0A6V8 6-фосфофруктокиназа II 6-phosphofructokinase II LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, pfkB pfkB P06999 P06999 Ксантин-гуанин фосфорибозилтрансфераза Xanthine-guanine phosphoribosyltransferase LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, gpt gpt P0A9M5 P0A9M5 Г уанилаткиназа G wanylate kinase LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, gmk gmk P60546 P60546 Нуклеозид-дифосфаткиназа Nucleoside diphosphate kinase LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-II, ndk ndk P0A763 P0A763 НАДФ+-зависимая глюкозо6-фосфатдегидрогеназа NADP+-dependent glucose 6-phosphate dehydrogenase LNFP-ΙΠ, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI 2’FL, 3’FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, LNFP-ΙΠ, LNFP-V, LNFP-VI, LNDFHI, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-II, LNFP-ΙΠ, LNFP-V, zwf zwf P0AC53 P0AC53 иТР:глюкозо-1-фосфатуридилилтрансфераза iTP: glucose-1-phosphate uridylyltransferase LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI LNT, LNnT, LNFP- I, LNFP-II, LNFP- III, LNFP-V, LNFP- LNFP-VI, LNDFH- I, LNDFH-II, FpLNHI LNT, LNnT, LNFP- I, LNFP-II, LNFP- III, LNFP-V, LNFP- galF galF P0AAB6 P0AAB6 VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH

- 32 044676- 32 044676

Термин олигосахарид грудного молока или НМО в данном контексте означает сложный углевод, содержащийся в грудном молоке человека (см. Urashima et al., Milk Oligosaccharides. Nova Science Publisher (2011); или Chen, Adv. Carbohydr. Chem. Biochem., 72, 113 (2015)). HMO имеют базовую структуру, содержащую лактозную единицу на восстанавливающем конце, которая может быть удлинена одним или несколькими e-N-ацетиллактозаминилами и/или одним или несколькими β-лакто-N-биозильными звеньями, и эта базовая структура может быть замещена a-L-фукопиранозильной и/или a-N-ацетилнейраминильной (сиалильной) группой. В этом отношении некислотные (или нейтральные) НМО лишены сиалильного остатока, а кислотные НМО имеют по меньшей мере один сиалильный остаток в своей структуре. Некислотные (или нейтральные) НМО могут быть фукозилированными или нефукозилированными. Примеры таких нейтральных нефукозилированных НМО включают лакто-N-тетраозу (LNT), лактоN-неотетраозу (LNnT), лакто-N-неогексаозу (LNnH), пара-лакто-N-неогексаозу (pLNnH), пара-лакто-Nгексаозу (pLNH) и лакто-N-гексаозу (LNH). Примеры нейтральных фукозилированных НМО включают 2'фукозиллактозу (2'-FL), лакто-N-фукопентаозу I (LNFP-I), лакто-N-дифукогексаозу I (LNDFH-I), 3-фукозиллактозу (3-FL), дифукозиллактозу (DFL), лакто-N-фукопентазу II (LNFP-II), лакто-Nфукопентаозу III (LNFP-II I), лакто-N-дифукогексаозу III (LNDFH-III), фукозил-лакто-N-гексаозу II (FLNHII), лакто-N-фукопентазу V (LNFP-V), лакто-N-дифукогексаозу II (LNDFH-II), фукозил-лакто-N-гексаозу I (FLNH-I), фукозил-пара-лакто-N-гексаозу I (FpLNH-I), фукозил-пара-лакто-N-неогексаоза II (F-pLNnH II) и фукозил-лакто-N-неогексаозу (FLNnH). Примеры кислых НМО включают З'-сиалиллактозу (3'-SL), 6'-сиалиллактозу (6'-SL), З-фукозил-З'-сиалиллактозу (FSL), 3'-О-сиалиллакто-N-тетраозу а (LST а), фукозил-LST а (FLST а), 6'-О-сиалиллакто-N-тетраозу b (LST b), фукозил-LST b (FLST b), б'-О-сиалиллакто-Nнеотетраозу (LST с), фукозил-LST с (FLST с), 3'-О-сиалиллакто-N-неотетраозу (LST d), фукозил-LST d (FLST d), сиалил-лакто-N-гексаозу (SLNH), сиалил-лакто-N-неогексаозу I (SLNH-I), сиалил-лакто-Nнеогексаозу II (SLNH-II) и дисиалил-лакто-14-тетраозу (DSLNT). В контексте настоящего изобретения лактозу рассматривают как представителя НМО.The term human milk oligosaccharide or HMO in this context refers to the complex carbohydrate found in human breast milk (see Urashima et al., Milk Oligosaccharides. Nova Science Publisher (2011); or Chen, Adv. Carbohydr. Chem. Biochem., 72, 113 (2015)). HMOs have a basic structure containing a lactose unit at the reducing end, which can be extended by one or more e-N-acetyllactosaminyl and/or one or more β-lacto-N-biosyl units, and this basic structure can be replaced by a-L-fucopyranosyl and/or a-N-acetylneuraminyl (sialyl) group. In this regard, non-acidic (or neutral) HMOs lack a sialyl residue, while acidic HMOs have at least one sialyl residue in their structure. Non-acidic (or neutral) HMOs can be fucosylated or non-fucosylated. Examples of such neutral non-fucosylated HMOs include lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-neohexaose (LNnH), para-lacto-N-neohexaose (pLNnH), para-lacto-N-hexaose (pLNH) and lacto-N-hexaose (LNH). Examples of neutral fucosylated HMOs include 2'fucosyllactose (2'-FL), lacto-N-fucopentaose I (LNFP-I), lacto-N-difucohexaose I (LNDFH-I), 3-fucosyllactose (3-FL), difucosyllactose ( DFL), lacto-N-fucopentase II (LNFP-II), lacto-N-fucopentaose III (LNFP-II I), lacto-N-difucohexaose III (LNDFH-III), fucosyl-lacto-N-hexaose II (FLNHII), lacto-N-fucopentase V (LNFP-V), lacto-N-difucohexaose II (LNDFH-II), fucosyl-lacto-N-hexaose I (FLNH-I), fucosyl-para-lacto-N-hexaose I (FpLNH -I), fucosyl-p-lacto-N-neohexaose II (F-pLNnH II) and fucosyl-lacto-N-neohexaose (FLNnH). Examples of acidic HMOs include 3'-sialyllactose (3'-SL), 6'-sialyllactose (6'-SL), 3-fucosyl-3'-sialyllactose (FSL), 3'-O-sialyllacto-N-tetraose ( LST a), fucosyl-LST a (FLST a), 6'-O-sialyllacto-N-tetraose b (LST b), fucosyl-LST b (FLST b), b'-O-sialyllacto-Nneotetraose (LST c) , fucosyl-LST c (FLST c), 3'-O-sialyllacto-N-neotetraose (LST d), fucosyl-LST d (FLST d), sialyl-lacto-N-hexaose (SLNH), sialyl-lacto-N -neohexaose I (SLNH-I), sialyl-lacto-Nneohexaose II (SLNH-II) and disialyl-lacto-14-tetraose (DSLNT). In the context of the present invention, lactose is considered as a representative of HMO.

Термин предшественник НМО в настоящем контексте относится к соединению, участвующему в пути биосинтеза одной или более НМО по изобретению, которые продуцируются и естественным образом присутствуют в клетке-хозяине или импортируются в клетку из внеклеточной среды. Некоторые неограничивающие примеры предшественников НМО перечислены ниже.The term HMO precursor in the present context refers to a compound involved in the biosynthetic pathway of one or more HMOs of the invention that are produced and naturally present in the host cell or imported into the cell from the extracellular environment. Some non-limiting examples of CME precursors are listed below.

Предшественник Predecessor Продукт Product UDP-GlcNAc UDP-GlcNAc LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, 3’SL, 6’SL, pLNnH, (F)LSTa, (F)LSTb, (F)LSTc, (F)LSTd LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, 3'SL, 6'SL, pLNnH, ( F)LSTa, (F)LSTb, (F)LSTc, (F)LSTd UDP-Gal UDP-Gal LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, LSTa, LSTb, LSTc, LSTd LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, pLNH, F-pLNH I, pLNnH, LSTa, LSTb, LSTc, LSTd GDP-фукоза GDP-fucose LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, F-pLNH I, 2’FL, 3’FL, DFL, FLSTa, FLSTb, FLSTc, FLSTd LNT, LNnT, LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LNDFH-I, LNDFH-II, F-pLNH I, 2'FL, 3'FL, DFL, FLSTa, FLSTb , FLSTc, FLSTd

Термин транспортер НМО означает биологическую молекулу, например белок, которая облегчает транспортировку/экспорт НМО, синтезированного клеткой-хозяином, через клеточную мембрану, например, в клеточную среду, или транспортировку/импорт НМО из клеточной среды в клеточный цитозоль.The term HMO transporter means a biological molecule, such as a protein, that facilitates the transport/export of HMO synthesized by a host cell across a cell membrane, for example, into the cellular environment, or the transport/import of HMO from the cellular environment into the cellular cytosol.

Термин производное НМО означает молекулу, которая получена из молекулы НМО или содержит группу НМО, например молекулу ганглиозида, структуру искусственного углевода/белка, содержащую группу НМО.The term HMO derivative means a molecule that is derived from an HMO molecule or contains an HMO group, for example a ganglioside molecule, an artificial carbohydrate/protein structure containing an HMO group.

Экспрессионная кассета по настоящему изобретению может быть использована для рекомбинантной продукции одной или более НМО либо интегрированной в геном, либо в составе плазмиды, или, в некоторых вариантах, клетка-хозяин может содержать как интегрированную в геном, так и плазмидную экспрессирующую кассету, где по меньшей мере одна или обе экспрессионных кассеты содержат один или несколько генов, которые необходимы и/или полезны для продуцирования одного или более НМО, и где экспрессия по меньшей мере одного из указанных генов находится под контролем промотора glp по изобретению (т.е. PglpF, PglpA, PglpD или PglpT, предпочтительно PglpF). Предпочтительно, чтобы интегрированная в геном кассета содержала по меньшей мере одну (или первый набор) кодирующих последовательностей ДНК, а плазмидная кассета содержала по меньшей мере одну вторую кодирующую ДНК (или второй набор кодирующих последовательностей ДНК), где по меньшей мере одна первая и/или по меньшей мере одна вторая кодирующие последовательности ДНК функционально связаны с промотором glp по изобретению. В некоторых предпочтительных вариантах осуществления по меньшей мере одна из экспрессионных кассет экспрессируется под контролем Pglp, например, кодирующая последовательность интегрированной в геном кассеты функционально связана с промотором glp по изобретению, например, PglpF, a плазмидная кодирующая последовательность функционально связана с другим промотором, например lac-промотором, или другим промотором. В некоторых вариантах осуществления,The expression cassette of the present invention can be used for the recombinant production of one or more HMOs, either genomically integrated or as part of a plasmid, or, in some embodiments, the host cell can contain both a genomically integrated and plasmidized expression cassette, wherein at least at least one or both expression cassettes contain one or more genes that are necessary and/or useful for the production of one or more HMOs, and wherein the expression of at least one of these genes is under the control of a glp promoter according to the invention (i.e. PglpF, PglpA , PglpD or PglpT, preferably PglpF). Preferably, the genome-integrated cassette contains at least one (or a first set) of DNA coding sequences, and the plasmid cassette contains at least one second coding DNA (or a second set of DNA coding sequences), wherein at least one first and/or at least one second DNA coding sequences are operably linked to the glp promoter of the invention. In some preferred embodiments, at least one of the expression cassettes is expressed under the control of Pglp, for example, the coding sequence of the genome-integrated cassette is operably linked to a glp promoter of the invention, for example PglpF, and the plasmid coding sequence is operably linked to another promoter, for example lac- promoter, or another promoter. In some embodiments,

- 33 044676 как интегрированные в геном, так и плазмидные кассеты, могут экспрессироваться под контролем одного и того же или другого промотора glp по изобретению, например, промотор интегрированной в геном кассеты представляет собой PglpF, а плазмидный промотор представляет собой PglpA В других вариантах осуществления все экспрессионные кассеты, содержащиеся в клетке-хозяине, могут содержать один и тот же промотор glp. В одном предпочтительном варианте осуществления клетка-хозяин содержит по меньшей мере одну копию интегрированной в геном экспрессионной кассеты по изобретению, содержащей PglpF. Предпочтительно, чтобы геном клетки-хозяина содержал одну или небольшое количество копий интегрированной в геном экспрессионной кассеты, например, две или три копии. Тем не менее в некоторых вариантах осуществления хозяин может содержать несколько копий экспрессионной плазмиды, где каждая плазмида содержит одну копию экспрессионной кассеты по изобретению. В некоторых вариантах осуществления клетка-хозяин может содержать несколько различных нуклеотидных конструкций по изобретению, как интегрированных в геном, так и/или плазмидных. Каждая из нескольких различных нуклеотидных конструкций может быть встроена в геном клетки-хозяина или в плазмиду в единственной копии или во множестве копий. В некоторых вариантах осуществления предпочтительно, чтобы конструкции встраивались в одной копии или с низким числом копий.- 33 044676 both genome-integrated and plasmid cassettes can be expressed under the control of the same or a different glp promoter of the invention, for example, the genome-integrated cassette promoter is PglpF and the plasmid promoter is PglpA. In other embodiments, all expression cassettes contained in a host cell may contain the same glp promoter. In one preferred embodiment, the host cell contains at least one copy of a genome-integrated expression cassette of the invention containing PglpF. Preferably, the host cell genome contains one or a small number of copies of the genome-integrated expression cassette, for example two or three copies. However, in some embodiments, the host may contain multiple copies of the expression plasmid, where each plasmid contains one copy of the expression cassette of the invention. In some embodiments, the host cell may contain several different nucleotide constructs of the invention, both genome-integrated and/or plasmid-based. Each of several different nucleotide constructs may be inserted into the genome of a host cell or into a plasmid in a single copy or in multiple copies. In some embodiments, it is preferable for the constructs to be embedded in a single copy or a low number of copies.

В соответствии с изобретением одна копия экспрессионной кассеты по изобретению, содержащаяся в клетке-хозяине, либо интегрированная в геном, либо в плазмиде, может обеспечить количество биологических молекул, кодируемых кодирующей последовательностью ДНК (ii) (предпочтительно под контролем промотора glp, например, PglpF), которое достаточно для обеспечения высокого уровня продукции одного или более НМО клеткой-хозяином. Удивительно, что одна интегрированная в геном копия экспрессионной кассеты по настоящему изобретению может обеспечить уровни продукции НМО, которые сопоставимы или выше (например, в 2-10 раз выше), чем уровни продукции, достигнутые с использованием экспрессии с той же кассеты в высококопийной плазмиде (100-500 копий). В некоторых вариантах осуществления может быть выгодно экспрессировать два или несколько генов, связанных с продукцией НМО, в клетке-хозяине. Гены, связанные с НМО, могут быть включены в одну конструкцию и экспрессированы в виде тандема с одной (или множества) копий в геноме или с плазмиды; или гены могут быть включены в различные конструкции по изобретению, и один ген экспрессируется с интегрированной в геном кассеты, а другой ген - с плазмиды. В других вариантах осуществления может быть предусмотрен другой способ экспрессии, состав или количество копий экспрессионных кассет. Предпочтительно, чтобы по меньшей мере один ген, включенный в вышеуказанные экспрессионные кассеты, кодирует белок с ферментативной активностью, которая необходима для синтеза НМО в клетке-хозяине. Неограничивающие варианты генов, которые могут быть преимущественно экспрессированы под контролем промотора glp, описаны в табл. 2 и 3 и в рабочих примерах.According to the invention, one copy of the expression cassette of the invention, contained in a host cell, either integrated into the genome or in a plasmid, can provide the number of biological molecules encoded by the DNA coding sequence (ii) (preferably under the control of a glp promoter, e.g. PglpF) , which is sufficient to ensure a high level of production of one or more HMOs by the host cell. Surprisingly, a single genome-integrated copy of the expression cassette of the present invention can provide levels of HMO production that are comparable to or higher (eg, 2-10 times higher) than the production levels achieved using expression from the same cassette in a high-copy plasmid ( 100-500 copies). In some embodiments, it may be advantageous to express two or more genes associated with HMO production in a host cell. Genes associated with NMO can be included in a single construct and expressed in tandem from one (or multiple) copies in the genome or from a plasmid; or the genes may be included in various constructs of the invention, and one gene is expressed from a cassette integrated into the genome and the other gene from a plasmid. In other embodiments, a different expression method, composition, or copy number of the expression cassettes may be provided. Preferably, at least one gene included in the above expression cassettes encodes a protein with enzymatic activity that is necessary for the synthesis of HMO in the host cell. Non-limiting gene variants that may be preferentially expressed under the control of the glp promoter are described in Table 1. 2 and 3 and in working examples.

В соответствии с вышеизложенным второй аспект изобретения относится к рекомбинантной клетке, содержащей нуклеотидную конструкцию по изобретению. Рекомбинантная клетка в настоящем документе взаимозаменяемо обозначается как клетка-хозяин. Предпочтительно клетка-хозяин представляет собой бактериальную клетку. Термины вид бактерий-хозяев, бактериальная клетка-хозяин используются взаимозаменяемо для обозначения бактериальной клетки, которая была трансформирована для содержания ДНК-конструкции по изобретению и способна экспрессировать гетерологичный полипептид, кодируемый соответствующей гетерологичной кодирующей последовательностью ДНК конструкции. Термины трансформация, трансформированный и трансплантированный являются синонимами и обозначают процесс, в котором внеклеточная нуклеиновая кислота, такая как вектор, содержащий конструкцию по изобретению, с сопутствующим материалом или без него, проникает в клетку-хозяина. Трансформация подходящих клеток-хозяев, например, вектором экспрессии может быть осуществлена хорошо известными способами, такими как электропорация, конъюгация, или химическими способами, такими как трансформация, опосредованная фосфатом кальция, и системами природной трансформации, описанными, например, в Maniatis et al. или в Ausubel et al.In accordance with the above, the second aspect of the invention relates to a recombinant cell containing a nucleotide construct according to the invention. A recombinant cell is referred to interchangeably herein as a host cell. Preferably the host cell is a bacterial cell. The terms bacterial host species and bacterial host cell are used interchangeably to refer to a bacterial cell that has been transformed to contain a DNA construct of the invention and is capable of expressing a heterologous polypeptide encoded by a corresponding heterologous DNA coding sequence of the construct. The terms transformation, transformed and transplanted are synonymous and refer to the process in which an extracellular nucleic acid, such as a vector containing a construct of the invention, with or without accompanying material, enters a host cell. Transformation of suitable host cells, for example, with an expression vector can be accomplished by well known methods such as electroporation, conjugation, or chemical methods such as calcium phosphate-mediated transformation and natural transformation systems described, for example, in Maniatis et al. or in Ausubel et al.

Что касается бактериальных клеток-хозяев, в принципе нет никаких ограничений; они могут быть эубактериями (грамположительными или грамотрицательными) или архебактериями, если они позволяют генетические манипуляции для вставки гена, представляющего интерес, и могут выращиваться в производственных масштабах. Предпочтительно, чтобы клетка-хозяин позволяла культивирование до высокой плотности клеток. Неограничивающими примерами бактериальных клеток-хозяев, которые подходят для рекомбинантного промышленного получения НМО по изобретению, могут быть Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum или Xanthomonas campestris. Бактерии рода Bacillus также могут быть использованы, включая Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus и Bacillus circulans. Также бактерии родов Lactobacillus и Lactococcus могут быть модифицированы с использованием способов по настоящему изобретению, включая, но не ограничиваясь этим, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispatus, Lactobacillus gasseri, Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii и Lactococcus lactis. Streptococcus thermophiles и Proprionibacterium freudenreichii также являютсяAs far as bacterial host cells are concerned, there are in principle no restrictions; they can be eubacteria (Gram-positive or Gram-negative) or archaebacteria if they allow genetic manipulation to insert a gene of interest and can be grown on a commercial scale. Preferably, the host cell allows cultivation to high cell densities. Non-limiting examples of bacterial host cells that are suitable for the recombinant industrial production of the HMOs of the invention include Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum or Xanthomonas campestris. Bacteria of the genus Bacillus can also be used, including Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus and Bacillus circulans. Also, bacteria of the genera Lactobacillus and Lactococcus can be modified using the methods of the present invention, including, but not limited to, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crisp atus, Lactobacillus gasseri, Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii and Lactococcus lactis. Streptococcus thermophiles and Proprionibacterium freudenreichii are also

- 34 044676 подходящими бактериальными видами для изобретения, описанного в настоящем документе. Также включены в качестве части этого изобретения штаммы, модифицированные, как описано в настоящем документе, из родов Enterococcus (например, Enterococcus faecium и Enterococcus thermophiles), Bifidobacterium (например, Bifidobacterium longum, Bifidobacterium infantis и Bifidobacterium bifidum), Sporolactobacillus spp., Micromomospora spp., Mcrococcus spp., Rhodococcus spp., и Pseudomonas (например, Pseudomonas fluorescens и Pseudomonas aeruginosa). Бактерии, обладающие характеристиками, описанными в настоящем документе, культивируют в присутствии лактозы, и НМО, продуцируемые клеткой, извлекают либо из самой бактерии, либо из культурального супернатанта бактерий. НМО очищают с использованием подходящей процедуры, доступной в данной области (например, такой, как описанная в WO 2015188834, WO 2017182965 или WO 2017152918).- 34 044676 suitable bacterial species for the invention described herein. Also included as part of this invention are strains modified as described herein from the genera Enterococcus (eg, Enterococcus faecium and Enterococcus thermophiles), Bifidobacterium (eg, Bifidobacterium longum, Bifidobacterium infantis, and Bifidobacterium bifidum), Sporolactobacillus spp., Micromomospora spp. ., Micrococcus spp., Rhodococcus spp., and Pseudomonas (eg, Pseudomonas fluorescens and Pseudomonas aeruginosa). Bacteria having the characteristics described herein are cultured in the presence of lactose, and the HMO produced by the cell is recovered either from the bacterium itself or from the culture supernatant of the bacteria. HMO is purified using a suitable procedure available in the art (for example, such as described in WO 2015188834, WO 2017182965 or WO 2017152918).

В предпочтительном варианте осуществления клеткой-хозяином является Е.coli. Однако, как уже упоминалось, для целей изобретения могут быть использованы различные клетки-хозяева.In a preferred embodiment, the host cell is E. coli. However, as already mentioned, various host cells can be used for the purposes of the invention.

Одно требование к клетке-хозяину состоит в том, что она содержит функциональную ДНК-зависимую РНК-полимеразу, которая может связываться с промотором и инициировать транскрипцию ДНК конструкции. РНК-полимераза может быть эндогенной (нативной), гомологичной (рекомбинантной) или чужеродной/гетерологичной (рекомбинантной) для клетки-хозяина.One requirement for the host cell is that it contains a functional DNA-dependent RNA polymerase that can bind to the promoter and initiate transcription of the DNA construct. The RNA polymerase can be endogenous (native), homologous (recombinant), or foreign/heterologous (recombinant) to the host cell.

Конструкция по изобретению, трансформированная в отобранного бактериального хозяина, может быть экспрессирована как интегрированная в геном экспрессионная кассета или клонирована в подходящий вектор экспрессии и экспрессирована в плазмиде. В различных вариантах осуществления может быть предпочтительным использовать систему экспрессии на основе генома, в других вариантах осуществления предпочтительной может быть экспрессия с плазмиды. Однако преимуществом является использование конструкции по изобретению в системе экспрессии на основе генома, поскольку, как ни удивительно, единственная копия конструкции, интегрированной в геном и экспрессируемой из него, может обеспечить высокий и стабильный уровень экспрессии встроенного генного продукт. Дополнительным преимуществом является то, что геномная экспрессия устойчива в течение длительных периодов времени. Для целей изобретения могут быть использованы стандартные способы для встраивания конструкций по изобретению в геном клетки-хозяина или в экспрессионные плазмиды, которые, например, описаны в Sambrook et al., Wilson & Walker, Maniatise et al. и Ausubel et al.The construct of the invention, transformed into a selected bacterial host, can be expressed as a genome-integrated expression cassette or cloned into a suitable expression vector and expressed in a plasmid. In various embodiments, it may be preferable to use a genome-based expression system; in other embodiments, expression from a plasmid may be preferred. However, it is advantageous to use the construct of the invention in a genome-based expression system because, surprisingly, a single copy of the construct integrated into and expressed from the genome can provide high and stable levels of expression of the inserted gene product. An additional advantage is that genomic expression is stable over long periods of time. For the purposes of the invention, standard methods can be used for inserting the constructs of the invention into the genome of a host cell or into expression plasmids, which, for example, are described in Sambrook et al., Wilson & Walker, Maniatise et al. and Ausubel et al.

Термины трансформация, трансформированный и трансплантированный являются синонимами и обозначают процесс, в котором внеклеточная нуклеиновая кислота, такая как вектор, содержащий конструкцию по изобретению, с сопутствующим материалом или без него, проникает в клетку-хозяина. Трансформация подходящих клеток-хозяев, например, экспрессионным вектором, может быть осуществлена хорошо известными способами, такими как электропорация, конъюгация, или химическими способами, такими как трансформация, опосредованная фосфатом кальция, и системами природной трансформации, описанными, например, в Maniatis et al. или в Ausubel et al.The terms transformation, transformed and transplanted are synonymous and refer to the process in which an extracellular nucleic acid, such as a vector containing a construct of the invention, with or without accompanying material, enters a host cell. Transformation of suitable host cells, for example with an expression vector, can be carried out by well known methods such as electroporation, conjugation, or chemical methods such as calcium phosphate-mediated transformation and natural transformation systems described, for example, in Maniatis et al. or in Ausubel et al.

Для экспрессии на основе генома существует требование к клетке-хозяину - клетка должна быть способна осуществлять гомологичную рекомбинацию (что важно для встраивания экспрессионного картриджа в геном). Следовательно, предпочтительно, чтобы клетка-хозяин имела функциональный рекомбинационный белок RecA. Однако, поскольку RecA может вызывать нежелательные события рекомбинации во время культивирования, предпочтительно, чтобы клетка-хозяин имела геномную мутацию в своем геномном сайте recA (что делает его дисфункциональным), но вместо этого имела функциональный RecA, обеспечиваемый последовательностью recA, присутствующей на хелперной плазмиде, которая может быть удалена (элиминирована) после рекомбинации с использованием термочувствительного репликона хелперной плазмиды (Datsenko К.А. & Wanner B.L. (2000), Proc. Natl. Acad. Sci., USA, 97(12):6640-5). С учетом рекомбинации, в дополнение к RecA, предпочтительно, чтобы клетка-хозяин содержала ДНК-последовательности, кодирующие рекомбинационные белки (например, Exo, Beta и Gam). В этом случае может быть выбрана клетка-хозяин, которая уже имеет эту функцию, или клетка-хозяин создается de novo с помощью генной инженерии для вставки этих последовательностей.For genome-based expression, there is a requirement for the host cell - the cell must be capable of homologous recombination (which is important for integrating the expression cartridge into the genome). Therefore, it is preferable that the host cell has a functional RecA recombination protein. However, since RecA can cause unwanted recombination events during culture, it is preferable that the host cell has a genomic mutation in its genomic recA site (rendering it dysfunctional) but instead has functional RecA provided by the recA sequence present on the helper plasmid. which can be removed (eliminated) after recombination using a thermosensitive replicon helper plasmid (Datsenko K.A. & Wanner B.L. (2000), Proc. Natl. Acad. Sci., USA, 97(12):6640-5). In view of recombination, in addition to RecA, it is preferable that the host cell contains DNA sequences encoding recombination proteins (eg, Exo, Beta and Gam). In this case, a host cell that already has this function can be selected, or a host cell can be created de novo by genetic engineering to insert these sequences.

Что касается локуса интеграции, то система экспрессии, используемая в изобретении, допускает широкую вариабельность. В принципе может быть выбран любой локус с известной последовательностью при условии, что функция последовательности либо необязательна, либо, если необходимо, может быть восполнена (как, например, в случае ауксотрофии). Многие локусы интеграции, подходящие для целей изобретения, описаны в прототипах (см., например, Francia VM & Lobo JMG (1996), J. Bacteriol., vl78, p. 894-898: Juhas M. et al. (2014), doi.org/10.1371/journal.pone.0111451; Juhas M & Aijoka FW (2015), Mcrobal. Biothechnol., v.8:617-748; Sabi A. et al. (2013), Mcrobial. Cell Factories, 12:60).With regard to the locus of integration, the expression system used in the invention allows for wide variability. In principle, any locus with a known sequence can be selected, provided that the sequence function is either optional or, if necessary, can be filled in (as in the case of auxotrophy, for example). Many integration loci suitable for the purposes of the invention are described in the prior art (see, for example, Francia VM & Lobo JMG (1996), J. Bacteriol., vl78, p. 894-898: Juhas M. et al. (2014), doi.org/10.1371/journal.pone.0111451; Juhas M & Aijoka FW (2015), Mcrobial. Biothechnol., v.8:617-748; Sabi A. et al. (2013), Mcrobial. Cell Factories, 12 :60).

ДНК-конструкция также может быть вставлена сайт-специфично. Принимая во внимание сайтспецифичную вставку гена, другое требование к клетке-хозяину состоит в том, чтобы она содержала по меньшей мере одну геномную область (либо кодирующую, либо некодирующую функциональную или нефункциональную область, либо область с неизвестной функцией), у которой известна ее последовательность, и структура которой может быть нарушена или иным образом модифицирована, чтобы позволить вставку гетерологичной последовательности, не нанося вреда клетке.The DNA construct can also be inserted in a site-specific manner. Considering site-specific gene insertion, another requirement for the host cell is that it contains at least one genomic region (either a coding or non-coding functional or non-functional region, or a region of unknown function) for which its sequence is known, and the structure of which can be disrupted or otherwise modified to allow insertion of a heterologous sequence without causing harm to the cell.

В некоторых вариантах осуществления клетка-хозяин несет в своем геноме маркерный ген для проIn some embodiments, the host cell carries in its genome a marker gene for

- 35 044676 ведения отбора.- 35 044676 conducting selection.

При выборе локуса интеграции необходимо учитывать, что частота мутаций ДНК, вызванная так называемой адаптивной эволюцией, варьирует по геному Е.coli, и что метаболическая нагрузка, запускаемая хромосомно кодируемой экспрессией рекомбинантного гена, может вызывать повышенную частоту мутаций в сайте интеграции. Чтобы получить экспрессирующую и стабильную клетку-хозяина, в качестве сайта интеграции предпочтительно выбрать высококонсервативную область генома, что обеспечивает сниженную частоту мутаций. Такими высоко консервативными областями генома Е.coli являются, например, гены, кодирующие компоненты рибосомы, или гены, участвующие в биосинтезе пептидогликана, и эти области предпочтительно могут быть выбраны для интеграции картриджа экспрессии.When choosing an integration locus, it must be taken into account that the frequency of DNA mutations caused by so-called adaptive evolution varies across the E. coli genome, and that the metabolic load triggered by chromosomally encoded expression of a recombinant gene can cause an increased frequency of mutations at the integration site. To obtain an expressing and stable host cell, it is preferable to select a highly conserved region of the genome as the integration site, which ensures a reduced mutation rate. Such highly conserved regions of the E. coli genome are, for example, genes encoding ribosomal components or genes involved in peptidoglycan biosynthesis, and these regions may preferably be selected for integration of the expression cartridge.

Геномная область с известной последовательностью, которая может быть выбрана для интеграции картриджа, может быть выбрана из кодирующей области несущественного гена или его части; из необязательной некодирующей функциональной области (т.е. промотора, транспозона и т.д.), из генов, удаление которых может иметь полезные эффекты с точки зрения продукции конкретного представляющего интерес белка, например определенных протеаз, белков наружных мембран, потенциальных загрязнителей продукта, генов, кодирующих метаболитические белки (например, важных для метаболизма сахарных молекул, который нежелателен или необязателен для данного штамма-хозяина и/или процесса ферментации) или белки путей передачи стрессовых сигналов, например, тех, которые возникают при ответе на жесткие условия культуры, механизма трансляционного контроля прокариот, который подавляет синтез тРНК и рРНК во время аминокислотного голодания. В альтернативном варианте, сайт интеграции может представлять собой маркерный ген, который позволяет проводить селекцию по исчезновению указанного маркерного фенотипа после интеграции. В альтернативном варианте, сайт, который можно выбрать для интеграции, представляет собой функцию, которая при удалении обеспечивает ауксотрофию, т.е. неспособность организма синтезировать конкретное органическое соединение, необходимое для его роста. В этом случае сайт интеграции может представлять собой фермент, участвующий в биосинтезе или метаболических путях, удаление такого фермента приводит к ауксотрофному штамму. Положительные клоны, т.е. те, которые несут экспрессионную кассету, могут быть отобраны по ауксотрофии по субстрату или молекулам-предшественникам указанных ферментов. В альтернативном варианте, сайт интеграции может представлять собой ауксотрофный маркер (нефункциональный, т.е. дефектный ген), который заменен/дополнен соответствующим прототрофным маркером (т.е. последовательностью, которая дополняет или заменяет дефектную последовательность), присутствующим в экспрессионной кассете, таким образом позволяя прототрофный отбор.The genomic region of known sequence that can be selected for cartridge integration can be selected from the coding region of a non-essential gene or part thereof; from an optional non-coding functional region (i.e. promoter, transposon, etc.), from genes whose deletion may have beneficial effects in terms of production of a particular protein of interest, e.g. certain proteases, outer membrane proteins, potential product contaminants, genes encoding metabolic proteins (for example, important for the metabolism of sugar molecules that are undesirable or dispensable for a given host strain and/or fermentation process) or proteins for stress signaling pathways, for example, those that arise in response to harsh crop conditions, mechanism translational control of prokaryotes, which suppresses the synthesis of tRNA and rRNA during amino acid starvation. Alternatively, the integration site may be a marker gene that allows selection for the disappearance of said marker phenotype following integration. Alternatively, the site that can be selected for integration is a feature that, when removed, provides auxotrophy, i.e. the inability of an organism to synthesize a specific organic compound needed for its growth. In this case, the integration site may be an enzyme involved in biosynthesis or metabolic pathways; removal of such an enzyme results in an auxotrophic strain. Positive clones, i.e. those that carry an expression cassette may be selected for auxotrophy on the substrate or precursor molecules of said enzymes. Alternatively, the integration site may be an auxotrophic marker (non-functional, i.e., defective gene) that is replaced/supplemented by a corresponding prototrophic marker (i.e., a sequence that complements or replaces the defective sequence) present in the expression cassette, such thus allowing prototrophic selection.

В одном аспекте область является несущественным геном. Согласно одному аспекту, это может быть ген, который сам по себе несущественен для клетки. Незаменимые бактериальные гены известны из литературы, например, из базы данных РЕС (профилирование хромосомы Е.coli) (http://www.shigen.nig.ac.jp/ecoli/pec/genes.jsp) или из так называемой Коллекции Кейо (Baba et al., Molecular Systems Biology (2006), 2, 2006.0008). Одним из примеров несущественного гена является RecA. Интеграция экспрессионной кассеты в этом сайте обеспечивает геномную мутацию, описанную выше в контексте требований к клеткам-хозяевам.In one aspect, the region is a nonessential gene. In one aspect, it may be a gene that itself is not essential to the cell. Essential bacterial genes are known from the literature, for example from the PEC (E. coli chromosome profiling) database (http://www.shigen.nig.ac.jp/ecoli/pec/genes.jsp) or from the so-called Keio Collection ( Baba et al., Molecular Systems Biology (2006), 2, 2006.0008). One example of a nonessential gene is RecA. Integration of the expression cassette at this site provides the genomic mutation described above in the context of the host cell requirements.

Подходящие сайты интеграции, например сайты, которые легко доступны и/или, как ожидается, обеспечивают более высокий уровень экспрессии, могут быть определены в предварительном скрининге. Такой скрининг может быть выполнен путем создания серии одиночных делеционных мутантов в соответствии с коллекцией Keio (Baba et al., 2006), в результате чего интеграционный картридж содержит в качестве переменных элементов различные рекомбинационные последовательности, которые были предварительно выбраны с учетом конкретных сайтов встраивания, и в качестве константных элементов базовые последовательности для интеграции и отбора, включая в качестве суррогатного гена, представляющего интерес ДНК-последовательность, кодирующую легко обнаруживаемый белок под контролем индуцибельного промотора, например, зеленый флуоресцентный белок. Уровень экспрессии созданных таким образом мутантов с одним нокаутом можно легко определить количественно с помощью измерения флуоресценции. На основании результатов этой процедуры может быть достигнут индивидуальный уровень экспрессии желаемого целевого белка путем изменения сайта интеграции и/или количества встраиваемых картриджей.Suitable integration sites, eg sites that are easily accessible and/or are expected to provide higher levels of expression, can be identified in a preliminary screen. Such screening can be accomplished by generating a series of single deletion mutants according to the Keio collection (Baba et al., 2006), whereby the integration cartridge contains as variable elements different recombination sequences that have been preselected for specific insertion sites, and as constant elements, base sequences for integration and selection, including as a surrogate gene of interest a DNA sequence encoding a readily detectable protein under the control of an inducible promoter, for example, green fluorescent protein. The expression level of single knockout mutants thus generated can be easily quantified by fluorescence measurements. Based on the results of this procedure, a customized level of expression of the desired target protein can be achieved by changing the integration site and/or the number of inserted cartridges.

В вариантах осуществления, в которых клетка-хозяин содержит ДНК-последовательности, кодирующие рекомбинационные белки (например, Exo, Beta и Gam -либо в качестве признака исходной клетки, либо полученные генной инженерией), интеграция может происходить в геномном сайте, где расположены эти последовательности рекомбинационных белков. При интеграции экспрессионного картриджа последовательности, кодирующие рекомбинационные белки, разрушаются или удаляются и, следовательно, нет необходимости, как в случае кодируемых плазмидой хелперных белков, удалять их на отдельном этапе.In embodiments in which the host cell contains DNA sequences encoding recombination proteins (e.g., Exo, Beta, and Gam as a feature of the parent cell or genetically engineered), integration may occur at the genomic site where these sequences are located recombination proteins. Upon integration of the expression cartridge, the sequences encoding the recombination proteins are destroyed or removed and therefore do not need to be removed in a separate step, as in the case of plasmid-encoded helper proteins.

Интеграция представляющего интерес гена в бактериальный геном может быть достигнута обычными способами, например, с использованием линейных картриджей, которые содержат фланкирующие последовательности, гомологичные определенному сайту в хромосоме, как описано для сайта attTn7 (Waddell C.S. and Craig N.L., Genes Dev. (1988), Feb, 2(2):137-49.); способами геномной интеграции послеIntegration of a gene of interest into the bacterial genome can be achieved by conventional means, for example, using linear cartridges that contain flanking sequences homologous to a specific site in the chromosome, as described for the attTn7 site (Waddell C.S. and Craig N.L., Genes Dev. (1988), Feb, 2(2):137-49.); methods of genomic integration after

- 36 044676 довательностей нуклеиновых кислот, в которых рекомбинация опосредуется функцией Red-рекомбиназы фага λ или функцией RecE/RecT-рекомбиназы профага Rac (Murphy, J. Bacteriol. (1998), 180(8):2063-7; Zhang et al., Nature Genetics (1998), 20:123-128; Muyrers et al., EMBO Rep. (2000), 1(3):239-243); способами, основанными на рекомбинации Red/ET (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005), 71(4):1829-35); или положительные клоны, т.е. клоны, которые несут экспрессионную кассету, могут быть отобраны, например, с помощью маркерного гена или потери или усиления функции гена.- 36 044676 sequences of nucleic acids in which recombination is mediated by the Red recombinase function of phage λ or the RecE/RecT recombinase function of prophage Rac (Murphy, J. Bacteriol. (1998), 180(8):2063-7; Zhang et al. , Nature Genetics (1998), 20:123-128; Muyrers et al., EMBO Rep. (2000), 1(3):239-243); in ways based on Red/ET recombination (Wenzel et al., Chem Biol. (2005), 12(3):349-56.; Vetcher et al., Appl Environ Microbiol. (2005), 71(4):1829 -35); or positive clones, i.e. clones that carry an expression cassette can be selected, for example, using a marker gene or a loss or gain of function gene.

В некоторых вариантах осуществления используются клетки-хозяева, которые уже содержат маркерный ген, интегрированный в их геном, например ген устойчивости к антибиотику или ген, кодирующий флуоресцентный белок, например GFP. В этом случае экспрессионный картридж, который не содержит селектируемого маркера, интегрируется в локус хромосомного маркерного гена, и положительные клоны отбираются по потере/исчезновению соответствующего фенотипа, например, они выбираются по чувствительности к антибиотикам или исчезновению флуоресценцию, которая может быть непосредственно визуализирована на культуральных чашках. Преимущество этих вариантов осуществления состоит в том, что маркер либо разрывается, либо полностью заменяется кассетой экспрессии, и, таким образом, функциональная маркерная последовательность отсутствует после интеграции и не требует удаления, если это нежелательно, как в случае генов устойчивости к антибиотику.In some embodiments, host cells are used that already contain a marker gene integrated into their genome, such as an antibiotic resistance gene or a gene encoding a fluorescent protein, such as GFP. In this case, an expression cartridge that does not contain the selectable marker is integrated into the chromosomal marker gene locus, and positive clones are selected for loss/disappearance of the corresponding phenotype, for example, they are selected for sensitivity to antibiotics or disappearance of fluorescence, which can be directly visualized on culture dishes . The advantage of these embodiments is that the marker is either disrupted or completely replaced by the expression cassette, and thus the functional marker sequence is not present after integration and does not require removal if this is not desired, as in the case of antibiotic resistance genes.

В альтернативном варианте, маркерный ген является частью экспрессионного картриджа. В случае когда маркер, используемый для селекции, является геном, обеспечивающим устойчивость к антибиотикам (например, канамицину или хлорамфениколу), положительные клоны отбираются по устойчивости к антибиотикам (т.е. по росту в присутствии соответствующего антибиотика). Маркерный ген (независимо от того, присутствует ли он в геноме клетки-хозяина или был введен посредством экспрессионного картриджа), может быть удален при интеграции кассеты.Alternatively, the marker gene is part of an expression cartridge. When the marker used for selection is a gene conferring resistance to antibiotics (eg kanamycin or chloramphenicol), positive clones are selected for antibiotic resistance (ie growth in the presence of the appropriate antibiotic). The marker gene (whether present in the host cell genome or introduced via an expression cartridge) can be removed upon integration of the cassette.

В некоторых вариантах осуществления экспрессирующая клетка может быть сконструирована так, чтобы она несла дефектный селектируемый маркерный ген, например ген устойчивости к антибиотику, такому как хлорамфеникол или канамицин, флуоресцентный маркер или ген, участвующий в метаболическом пути сахара или аминокислоты. В этом случае картридж с геном, представляющим интерес, несет недостающую часть маркерного гена, и путем интеграции маркерный ген восстанавливает свою функциональность. Например, картридж несет недостающую часть маркерного гена на одном из своих концов и интегрируется непосредственно рядом с дефектным маркерным геном, интегрированным в геном, так что слияние двух фрагментов делает маркерный ген полным и позволяет его функциональную экспрессию. В случае гена устойчивости к антибиотику, клетки, несущие экспрессионную кассету, устойчивы к определенному антибиотику, в случае флуоресцентного маркера клетки можно визуализировать по флуоресценции, а в случае гена метаболического пути клетки приобретают способность метаболизировать соответствующий компонент. Преимущество этого варианта осуществления заключается в том, что необходимо синтезировать только короткий участок маркерного гена картриджа, что позволяет использовать более короткие или меньшие по размеру картриджи для вставки по сравнению с предшествующим уровнем техники.In some embodiments, the expression cell can be engineered to carry a defective selectable marker gene, such as an antibiotic resistance gene such as chloramphenicol or kanamycin, a fluorescent marker, or a gene involved in a sugar or amino acid metabolic pathway. In this case, the cartridge containing the gene of interest carries the missing part of the marker gene, and through integration, the marker gene regains its functionality. For example, the cartridge carries the missing portion of a marker gene at one of its ends and is integrated immediately next to the defective marker gene integrated into the genome, such that the fusion of the two fragments makes the marker gene complete and allows its functional expression. In the case of an antibiotic resistance gene, cells carrying an expression cassette are resistant to a particular antibiotic, in the case of a fluorescent marker, the cells can be visualized by fluorescence, and in the case of a metabolic pathway gene, the cells acquire the ability to metabolize the corresponding component. The advantage of this embodiment is that only a short portion of the marker gene cartridge needs to be synthesized, allowing the use of shorter or smaller insert cartridges compared to the prior art.

В некоторых вариантах осуществления отбор положительных клонов (т.е. клонов, которые несут экспрессионную кассету) может быть осуществлен путем коррекции (т.е. комплементации) ауксотрофии клетки-хозяина. В таких вариантах осуществления используется клетка-хозяин, которая имеет мутацию, которая была выбрана для простого отбора положительных трансформированных колоний, например штамма, который имеет делецию или мутацию, делающую его неспособным синтезировать соединение, которое необходимо для его роста (такую мутацию называют ауксотрофным маркером). Например, бактериальный мутант, в котором инактивирован ген пути синтеза пролина, является ауксотрофом по пролину. Такой штамм не способен синтезировать пролин и поэтому может расти только в том случае, если пролин может быть извлечен из окружающей среды, в отличие от пролинового прототрофа, который может расти в отсутствие пролина.In some embodiments, selection of positive clones (ie, clones that carry an expression cassette) can be accomplished by correcting (ie, complementing) the auxotrophy of the host cell. In such embodiments, a host cell is used that has a mutation that has been selected for simple selection of positive transformed colonies, for example a strain that has a deletion or mutation that renders it unable to synthesize a compound that is required for its growth (such a mutation is called an auxotrophic marker) . For example, a bacterial mutant in which the proline synthesis pathway gene is inactivated is a proline auxotroph. Such a strain is unable to synthesize proline and can therefore only grow if proline can be extracted from the environment, unlike a proline prototroph which can grow in the absence of proline.

Можно использовать любую клетку-хозяина, имеющую ауксотрофный маркер. Предпочтительно использовать в качестве ауксотрофных маркеров мутации в генах, необходимые для синтеза аминокислот, например мутации в генах, относящихся к синтезу пролина, лейцина или треонина или ко-факторов, таких как тиамин. Согласно изобретению ауксотрофию клеток-хозяев корректируют путем интеграции в геном отсутствующего/дефектного гена в качестве компонента экспрессионного картриджа вместе с интеграцией представляющего интерес гена. Полученные таким образом прототрофные клетки можно легко отобрать, выращивая их на так называемой минимальной среде (прототрофный отбор), которая не содержит соединения, по которому исходная клетка-хозяин является ауксотрофной, что позволяет расти только положительным клонам.Any host cell having an auxotrophic marker can be used. It is preferable to use as auxotrophic markers mutations in genes necessary for the synthesis of amino acids, for example mutations in genes related to the synthesis of proline, leucine or threonine or co-factors such as thiamine. According to the invention, host cell auxotrophy is corrected by integrating the missing/defective gene into the genome as a component of an expression cartridge together with the integration of the gene of interest. The prototrophic cells thus obtained can be easily selected by growing them on so-called minimal medium (prototrophic selection), which does not contain the compound for which the original host cell is auxotrophic, allowing only positive clones to grow.

Прототрофный отбор не зависит от локуса интеграции. Локусом интеграции для прототрофного отбора может быть любой ген в геноме или в локусе, несущем ауксотрофный маркер. Особое преимущество прототрофного отбора заключается в том, что после успешной интеграции в геноме не остается ни маркера устойчивости к антибиотикам, ни какого-либо другого чужеродного для хозяина маркера. Следовательно, нет необходимости удалять указанные маркерные гены, что обеспечивает быструю и проPrototrophic selection does not depend on the locus of integration. The locus of integration for prototrophic selection can be any gene in the genome or at a locus that carries an auxotrophic marker. A particular advantage of prototrophic selection is that after successful integration, neither an antibiotic resistance marker nor any other marker foreign to the host remains in the genome. Therefore, there is no need to remove these marker genes, which provides quick and easy

- 37 044676 стую процедуру клонирования и селекции. Другое преимущество состоит в том, что восстановление функции гена полезно для клетки и обеспечивает более высокую стабильность системы.- 37 044676 simple procedure of cloning and selection. Another advantage is that restoring gene function is beneficial to the cell and provides greater system stability.

В альтернативном варианте маркерный ген, который вставляется в геном вместе с экспрессионным картриджем, может представлять собой метаболический ген, который допускает определенный режим отбора. Такой метаболический ген может позволить клетке расти на определенном (необычном) сахаре или других источниках углерода, и отбор положительных клонов может быть достигнут путем выращивания клеток на указанном сахаре в качестве единственного источника углерода.Alternatively, the marker gene that is inserted into the genome along with the expression cartridge may be a metabolic gene that is subject to a particular selection regime. Such a metabolic gene may allow a cell to grow on a specific (unusual) sugar or other carbon sources, and selection of positive clones can be achieved by growing cells on the specified sugar as the sole carbon source.

Как описано выше, во время длительного культивирования бактерий адаптивная эволюция может вызывать повышенную частоту мутаций в месте интеграции во время экспрессии хромосомно кодируемого рекомбинантного белка. Использование мутантного штамма с ауксотрофным нокаутом в сочетании с экспрессионным картриджем, дополняющим отсутствующую функцию мутантного штамма (тем самым генерируя штамм-прототроф из мутанта-ауксотрофа), имеет дополнительное преимущество в том, что восстановленный ген обеспечивает преимущества для клетки, благодаря которым клетка получает конкурентное преимущество, так что клетки, в которых произошла адаптивная эволюция, подавляются. Таким образом, обеспечивается способ отрицательного отбора для мутированных клонов.As described above, during long-term bacterial culture, adaptive evolution can cause an increased frequency of mutations at the integration site during expression of a chromosomally encoded recombinant protein. Using an auxotroph knockout mutant strain in combination with an expression cartridge that complements the missing function of the mutant strain (thereby generating a prototroph strain from an auxotroph mutant) has the added benefit that the restored gene provides benefits to the cell that give the cell a competitive advantage , so that cells in which adaptive evolution has occurred are suppressed. Thus, a method of negative selection for mutated clones is provided.

В некоторых вариантах осуществления (в случае когда представляющий интерес белок позволяет обнаружение на уровне одной клетки или одной колонии, например, с помощью анализа FACS или иммунологического анализа (ELISA)) маркерный ген не требуется, поскольку положительные клоны могут быть идентифицированы с помощью прямого обнаружения белка, представляющего интерес.In some embodiments (where the protein of interest allows detection at the single cell or single colony level, such as by FACS or immunoassay (ELISA)), a marker gene is not required because positive clones can be identified by direct detection of the protein , of interest.

Способы интеграции для получения экспрессирующей клетки-хозяина не ограничиваются интеграцией одного представляющего интерес гена в одном сайте в геноме; они обеспечивают возможность вариабельности как в отношении сайта интеграции, так и в отношении экспрессионных кассет. Например, может быть вставлено более одного представляющего интерес гена, т.е. две или несколько одинаковых или разных последовательностей под контролем идентичных или разных промоторов могут быть интегрированы в один или несколько разных локусов в геноме. Например, так можно экспрессировать два различных белка, которые образуют гетеродимерный комплекс. Гетеродимерные белки состоят из двух индивидуально экспрессированных белковых субъединиц. Одним примером такого белка является молекула антитела, например, тяжелая и легкая цепь моноклонального антитела или фрагмента антитела; другими примерами гетеродимерных белков являются CapZ, Ras, человеческая геликаза II и т.д. Эти две последовательности, кодирующие мономеры, могут присутствовать в одном экспрессионном картридже, который вставлен в один локус интеграции. В альтернативном варианте эти две последовательности также могут присутствовать в двух разных экспрессионных кассетах, которые вставляются независимо друг от друга в два разных локуса интеграции. В любом случае промоторы и режимы индукции могут быть одинаковыми или разными.Integration methods to obtain an expression host cell are not limited to the integration of a single gene of interest at a single site in the genome; they allow for variability in both the integration site and the expression cassettes. For example, more than one gene of interest may be inserted, i.e. two or more identical or different sequences under the control of identical or different promoters can be integrated into one or more different loci in the genome. For example, it is possible to express two different proteins that form a heterodimeric complex. Heterodimeric proteins consist of two individually expressed protein subunits. One example of such a protein is an antibody molecule, such as the heavy and light chain of a monoclonal antibody or antibody fragment; other examples of heterodimeric proteins are CapZ, Ras, human helicase II, etc. These two monomer coding sequences may be present in a single expression cartridge that is inserted into a single integration locus. Alternatively, the two sequences may also be present in two different expression cassettes that are inserted independently of each other at two different integration loci. In any case, the promoters and induction modes may be the same or different.

Хотя изобретение позволяет и может быть преимущественно использовано на практике для безплазмидного получения представляющих интерес биологических молекул, кодируемых геном конструкции по изобретению, оно не исключает того, что в системе экспрессии по изобретению содержится плазмида, которая несет подлежащие экспрессии последовательности, кроме гена, представляющего интерес, например, хелперные белки и/или рекомбинационные белки, описанные выше. Естественно, следует позаботиться о том, чтобы в таких вариантах осуществления преимущества изобретения не отменялись присутствием плазмиды, т.е. предпочтительно, чтобы такая плазмида присутствовала в низком числе копий и не оказывала метаболической нагрузки на клетку.Although the invention allows and can be advantageously used in practice for the plasmid-free production of biological molecules of interest encoded by a gene of a construct of the invention, it does not exclude that the expression system of the invention contains a plasmid that carries sequences to be expressed other than the gene of interest for example, helper proteins and/or recombination proteins described above. Naturally, care should be taken to ensure that in such embodiments the advantages of the invention are not impaired by the presence of the plasmid, i.e. Preferably, such a plasmid is present in low copy number and does not impose a metabolic burden on the cell.

Система экспрессии, используемая в способе по изобретению, может быть подобрана так, что она практически или полностью не содержит фаговых функций.The expression system used in the method according to the invention can be selected so that it contains virtually or completely no phage functions.

Суммируя вышеприведенные варианты осуществления, геномная экспрессия экспрессионных кассет по изобретению обеспечивает следующие основные преимущества:To summarize the above embodiments, the genomic expression of the expression cassettes of the invention provides the following major advantages:

В отношении процедуры конструирования экспрессионного хозяина, преимуществами являются (i) простой метод синтеза и амплификации линейного картриджа для вставки; (ii) высокая степень гибкости (т.е. без ограничений) по отношению к локусу интеграции; (iii) высокая степень гибкости в отношении селектируемого маркера и принципа селекции; (iv) возможность последующего удаления селектируемого маркера; (v) дискретное и определенное количество вставленных экспрессионных картриджей (обычно один или два).With regard to the expression host construction procedure, the advantages are (i) a simple method for synthesizing and amplifying a linear insert cartridge; (ii) a high degree of flexibility (i.e., without restrictions) with respect to the locus of integration; (iii) high degree of flexibility regarding the selectable marker and the selection principle; (iv) the possibility of subsequent removal of the selectable marker; (v) a discrete and defined number of expression cartridges inserted (usually one or two).

Интеграция одного или более рекомбинантных генов в геном приводит к дискретному и заранее определенному числу генов, представляющих интерес, на клетку. В варианте осуществления изобретения, в котором встраивается одна копия гена, это число обычно равно единице (за исключением случая, когда клетка содержит более одного генома, как это происходит временно во время деления клетки), по сравнению с экспрессией на основе плазмид, которая сопровождается увеличением числа копий до нескольких сотен. В системе экспрессии, используемой в способе по настоящему изобретению, за счет освобождения метаболизма хозяина от репликации плазмиды, увеличенная доля синтетического клеточного аппарата используется для продукции рекомбинантного белка. Поэтому может применяться элемент конструкции, позволяющий сильную экспрессию, например Pglp, например PglpF, PglpA, PglpD или PglpT, без побочных эффектов в отношении метаболизма хозяина за счет снижения содержания копийIntegration of one or more recombinant genes into the genome results in a discrete and predetermined number of genes of interest per cell. In the embodiment in which one copy of the gene is inserted, this number is typically one (unless the cell contains more than one genome, as occurs transiently during cell division), compared to plasmid-based expression, which is accompanied by an increase number of copies up to several hundred. In the expression system used in the method of the present invention, by freeing the host metabolism from plasmid replication, an increased proportion of the synthetic cellular machinery is used to produce the recombinant protein. Therefore, a design element can be used that allows strong expression of, for example, Pglp, such as PglpF, PglpA, PglpD or PglpT, without adverse effects on host metabolism by reducing copy content

- 38 044676 гена.- 38 044676 gene.

Как указано выше, системы экспрессии на основе плазмид имеют недостаток, заключающийся в том, что во время клеточного деления клетки могут терять плазмиду и, следовательно, представляющий интерес ген. Такая потеря плазмиды зависит от нескольких внешних факторов и повышается с увеличением количества клеточных делений (поколений). Это означает, что ферментация на основе плазмид ограничена числом поколений (в обычных ферментациях это число составляет приблизительно от 20 до 50). Напротив, основанная на геноме система экспрессии, используемая в способе по изобретению, обеспечивает стабильное, предварительно заданное содержание гена для практически бесконечного числа поколений и, таким образом, теоретически бесконечное время культивирования в контролируемых условиях (без недостатка появления клеток, которые не продуцируют представляющий интерес белок, и с единственным ограничением в виде потенциально встречающихся природных мутаций, поскольку они могут встречаться в любом гене).As stated above, plasmid-based expression systems have the disadvantage that during cell division, cells may lose the plasmid and therefore the gene of interest. This plasmid loss depends on several external factors and increases with the number of cell divisions (generations). This means that plasmid-based fermentations are limited in the number of generations (in conventional fermentations this number is approximately 20 to 50). In contrast, the genome-based expression system used in the method of the invention provides stable, predefined gene content for a virtually infinite number of generations and thus theoretically infinite culture time under controlled conditions (without the disadvantage of producing cells that do not produce the protein of interest , and with the only limitation of potentially occurring natural mutations, since they can occur in any gene).

В случае химически индуцируемых промоторов изобретение обеспечивает конкретное преимущество, заключающееся в том, что количество молекулы-индуктора при добавлении, например, в непрерывном режиме прямо пропорционально содержанию гена на клетку, либо постоянно в течение всего культивирования, либо изменяется в течение времени культивирования в заранее определенных значениях. Тем самым может быть достигнут контроль скорости рекомбинантной экспрессии, что представляет большой интерес для регулирования скорости экспрессии гена.In the case of chemically inducible promoters, the invention provides a particular advantage that the amount of inducer molecule when added, for example, in a continuous manner is directly proportional to the gene content per cell, either constant throughout the culture, or varies during the culture time in predetermined amounts. values. In this way, control of the rate of recombinant expression can be achieved, which is of great interest for regulating the rate of gene expression.

Поскольку основанная на геноме система экспрессии позволяет осуществлять точный контроль экспрессии белка, она особенно предпочтительно в сочетании с экспрессией, мишенью которой являются сигнальные пути, которая зависит от хорошо контролируемой экспрессии или полагается на нее.Because the genome-based expression system allows for precise control of protein expression, it is particularly advantageous in combination with signaling-targeted expression that depends on or relies on well-controlled expression.

Как описано выше, изобретение позволяет создавать упрощенные процессы, улучшать предсказуемость процесса и высокую воспроизводимость от ферментации до ферментации. Способ по изобретению, использующий описанную выше систему экспрессии, может быть осуществлен в периодическом процессе с подпиткой, или полунепрерывном или непрерывном режиме, благодаря чему преимущества системы экспрессии, кодируемой геномом, используются оптимальным образом. Нет ограничений в отношении параметров процесса, таких как скорость роста, температура и компоненты культуральной среды, за исключением случаев, определенных требованиями клетки-хозяина и определенных выбранным промотором.As described above, the invention allows for simplified processes, improved process predictability and high reproducibility from fermentation to fermentation. The method of the invention using the expression system described above can be carried out in a fed-batch process, or in a semi-continuous or continuous mode, whereby the advantages of the genome-encoded expression system are optimally utilized. There are no restrictions on process parameters such as growth rate, temperature and culture medium components, except as determined by the requirements of the host cell and determined by the selected promoter.

Другое преимущество относится к выбору молекулы-индуктора: большинство доступных систем для высокого уровня экспрессии рекомбинантных генов в Е.coli представляют собой промоторнооператорные системы на основе lac, индуцируемые IPTG. Система экспрессии, используемая в изобретении, позволяет культивирование в среде с ограниченным углеродом при непрерывной или импульсной подаче источника углерода, например лактозы, и обеспечивает жесткий контроль скорости экспрессии с широким спектром недорогих индукторов источников углерода, таких как глицерин, фукоза, лактоза, глюкоза.Another advantage relates to the choice of inducer molecule: most of the available systems for high-level recombinant gene expression in E. coli are lac-based promoter-operator systems inducible by IPTG. The expression system used in the invention allows cultivation in a carbon-limited environment with continuous or pulsed supply of a carbon source, such as lactose, and provides tight control of the expression rate with a wide range of inexpensive carbon source inducers such as glycerol, fucose, lactose, glucose.

Важно, что система экспрессии, используемая в изобретении, имеет преимущество, заключающееся в обеспечении высокого выхода рекомбинантно продуцируемых биологических молекул, как в отношении концентрации молекулы на объем культуральной среды (т.е. титра), так и в отношении содержания молекулы в полученной биомассе. Эта особенность делает систему экспрессии, используемую в изобретении, превосходной по сравнению с системами экспрессии предшествующего уровня техники.It is important that the expression system used in the invention has the advantage of providing a high yield of recombinantly produced biological molecules, both in terms of the concentration of the molecule per volume of culture medium (ie titer) and in terms of the content of the molecule in the resulting biomass. This feature makes the expression system used in the invention superior to prior art expression systems.

Кроме того, изобретение предлагает преимущество, заключающееся в том, что выбор клеткихозяина для экспрессии и/или оптимальной конструкции картриджа экспрессии может быть легко достигнут в предварительных скрининговых тестах. В качестве примера, в таких предварительных скринингах сконструирована серия картриджей с линейной экспрессией, которые варьируют по меньшей мере в отношении одного элемента, который влияет на свойства экспрессии представляющего интерес белка (уровень экспрессии или качественные характеристики, такие как биологическая активность), а именно, регуляторных элементов (например, промотора и/или сайта связывания полимеразы) и/или последовательности представляющего интерес гена (т.е. различные варианты использования кодонов), и/или направляющих последовательностях для рекомбинации, и/или любых других элементов в картридже, таких как секреторные лидеры. Варианты картриджа встраивают в геном предварительно выбранной клеткихозяина, и полученные варианты экспрессионных хозяев культивируют, включая индукцию экспрессии белка, в контролируемых условиях. Сравнивая экспрессию белка, выбирают вариант клетки-хозяина, показывающий наиболее благоприятные результаты с точки зрения процесса промышленного производства. В варианте этого предварительного подхода вместо определения оптимального экспрессионного картриджа, может быть идентифицирован оптимальный бактериальный штамм путем интеграции идентичных картриджей в панель различных клеток-хозяев. Поскольку у стратегии интеграции есть преимущество, заключающееся в том, что она позволяет интегрировать дискретное число копий гена (например, только одну) в геном, предварительный скрининг различных параметров может быть выполнен без вмешательства со стороны процесса репликации плазмиды или изменения числа копий плазмиды.In addition, the invention offers the advantage that the selection of the host cell for expression and/or the optimal design of the expression cartridge can be easily achieved in preliminary screening tests. As an example, in such preliminary screens, a series of linear expression cartridges are designed that vary with respect to at least one element that affects the expression properties of the protein of interest (expression level or quality characteristics such as biological activity), namely regulatory elements (e.g., promoter and/or polymerase binding site) and/or sequence of the gene of interest (i.e., various codon usages), and/or recombination guide sequences, and/or any other elements in the cartridge, such as secretory leaders. The cartridge variants are inserted into the genome of a preselected host cell, and the resulting variant expression hosts are cultured, including induction of protein expression, under controlled conditions. By comparing protein expression, the host cell variant that shows the most favorable results from the point of view of the industrial production process is selected. In a variation of this preliminary approach, instead of identifying the optimal expression cartridge, the optimal bacterial strain can be identified by integrating identical cartridges into a panel of different host cells. Since the integration strategy has the advantage of allowing a discrete number of gene copies (eg, just one) to be integrated into the genome, prescreening for various parameters can be performed without interference from the plasmid replication process or changes in the plasmid copy number.

Согласно изобретению термин культивировать (или культивирование, также называемое ферментация) относится к размножению бактериальных экспрессирующих клеток в контролируемом биоAccording to the invention, the term culture (or cultivation, also called fermentation) refers to the propagation of bacterial expressing cells in a controlled bio

- 39 044676 реакторе в соответствии со способами, известными в промышленности.- 39 044676 reactor in accordance with methods known in the industry.

Производство рекомбинантных белков обычно осуществляется путем выращивания в больших объемах. Термины производство и производственный масштаб в значении изобретения определяют ферментацию с минимальным объемом 5 л культуральной среды. Обычно процесс производственного масштаба определяется тем, что он способен обрабатывать большие объемы препарата, содержащего представляющий интерес рекомбинантный белок, и получать количества представляющего интерес белка, которые соответствуют, например, в случае терапевтического белка, требованиям к клиническим испытания, а также для предложения на рынке. В дополнение к большому объему, метод производственного масштаба, в отличие от простых лабораторных методов, таких как культивирование в колбах, характеризуется использованием технической системы биореактора (ферментера), который оснащен устройствами для перемешивания, аэрации, подачи питательных веществ, мониторинга и контроля параметров процесса (рН, температуры, напряжения растворенного кислорода, противодавления и т.д.). Поведение системы экспрессии в лабораторном методе не позволяет прогнозировать поведение этой системы в сложной среде биореактора.The production of recombinant proteins is usually done through large-scale cultivation. The terms production and production scale within the meaning of the invention define fermentation with a minimum volume of 5 l of culture medium. Generally, a production scale process is defined as being capable of processing large volumes of a drug containing the recombinant protein of interest and producing quantities of the protein of interest that meet, for example in the case of a therapeutic protein, clinical trial requirements as well as for marketing. In addition to its large volume, the production scale method, as opposed to simple laboratory methods such as flask culture, is characterized by the use of a technical bioreactor (fermenter) system, which is equipped with devices for mixing, aeration, nutrient supply, monitoring and control of process parameters ( pH, temperature, dissolved oxygen tension, back pressure, etc.). The behavior of an expression system in a laboratory method does not allow one to predict the behavior of this system in the complex environment of a bioreactor.

Системы экспрессии по настоящему изобретению могут преимущественно использоваться для производства рекомбинантных средств в промышленном масштабе (как в отношении объема, так и в отношении технической системы) в сочетании с режимом культивирования, который основан на подаче питательных веществ, в частности, в процессе с подпиткой или в непрерывном или полунепрерывном процессе.The expression systems of the present invention can advantageously be used for the production of recombinant agents on an industrial scale (both in terms of volume and technical system) in combination with a culture regime that is based on the supply of nutrients, in particular in a fed-batch process or in continuous or semi-continuous process.

В некоторых вариантах осуществления способ по изобретению представляет собой периодический процесс с подпиткой.In some embodiments, the method of the invention is a fed-batch process.

Принимая во внимание, что периодический процесс представляет собой режим культивирования, в котором все питательные вещества, необходимые для культивирования клеток, содержатся в исходной культуральной среде без дополнительной подачи дополнительных питательных веществ во время ферментации, в периодическом процессе с подпиткой, после периодической фазы наступает фаза подпитки, в которой одно или несколько питательных веществ поступают в культуру путем подпитки. Целью подпитки питательными веществами является увеличение количества биомассы (так называемый процесс культивирования клеток при высокой плотности или HCDC), чтобы также увеличить количество рекомбинантного белка. Хотя в большинстве процессов культивирования режим подпитки является критическим и важным, настоящее изобретение не ограничено в отношении определенного режима подпитки.Whereas the batch process is a culture mode in which all the nutrients required for cell culture are contained in the original culture medium without additional supply of additional nutrients during fermentation, in a fed-batch process, after the batch phase comes the fed-batch phase , in which one or more nutrients are supplied to the crop by feeding. The goal of nutrient feeding is to increase the amount of biomass (called a high-density cell culture or HCDC process) to also increase the amount of recombinant protein. Although the feeding schedule is critical and important in most cultivation processes, the present invention is not limited to a particular feeding schedule.

Подача питательных веществ (подпитка) может осуществляться в непрерывном или периодическом режиме в соответствии со способами, известными в данной области. Режим подпитки может быть задан заранее (т.е. подпитка осуществляется независимо от фактических параметров процесса), например, линейная постоянная подпитка, линейное увеличение подпитки, ступенчатое увеличение подпитки или следование математической функции при подпитке, например экспоненциальная подпитка.The supply of nutrients (feeding) can be carried out continuously or periodically in accordance with methods known in the art. The make-up mode can be preset (i.e. make-up is carried out independently of the actual process parameters), for example, linear constant make-up, linear increase in make-up, step increase in make-up, or following a mathematical function during make-up, for example exponential make-up.

В предпочтительном варианте осуществления способ по изобретению представляет собой процесс с подпиткой, в котором режим подпитки предварительно задан в соответствии с экспоненциальной функцией. При использовании режима экспоненциального питания удельная скорость роста μ клеточной популяции может быть предварительно задана на постоянном уровне и оптимизирована с учетом максимальной экспрессии рекомбинантного белка. Контроль скорости подпитки основан на желаемой удельной скорости роста μ. Когда используется определенная среда, как описано ниже, рост может быть точно предсказан и предварительно определен путем расчета аликвоты биомассы, которая должна быть образоваться на основе введенной единицы субстрата.In a preferred embodiment, the method of the invention is a fed-batch process in which the feeding regime is preset according to an exponential function. When using the exponential feeding regime, the specific growth rate μ of the cell population can be preset at a constant level and optimized taking into account maximum expression of the recombinant protein. Control of the recharge rate is based on the desired specific growth rate μ. When a specific medium is used, as described below, growth can be accurately predicted and predetermined by calculating the aliquot of biomass that should be produced based on the input unit of substrate.

В другом предпочтительном варианте осуществления режим экспоненциальной подачи может сопровождаться на конечных стадиях культивирования линейной постоянной подачей.In another preferred embodiment, the exponential feed mode can be accompanied at the final stages of cultivation by a linear constant feed.

В другом варианте осуществления процесса с подпиткой применяется линейная постоянная подача. Линейная постоянная подача характеризуется скоростью подпитки (объемом питательной среды в единицу времени), которая является постоянной (т.е. неизменной) на протяжении определенных фаз культивирования.Another embodiment of the fed-batch process uses a linear constant feed. Linear constant feeding is characterized by a feeding rate (volume of nutrient medium per unit time), which is constant (i.e., unchanged) during certain cultivation phases.

В другом варианте осуществления процесса с подпиткой применяется линейное увеличение подпитки. Линейное увеличение подпитки характеризуется скоростью подачи питательной среды, следующей линейной функции. Подпитка в соответствии с линейной возрастающей функцией характеризуется определенным увеличением скорости подпитки за определенный прирост времени.In another embodiment of the fed-batch process, a linear increase in feed is applied. A linear increase in feeding is characterized by the rate of supply of the nutrient medium, following a linear function. Replenishment in accordance with a linear increasing function is characterized by a certain increase in the recharge rate over a certain increase in time.

В другом варианте осуществления способа с подпиткой в соответствии с настоящим изобретением для управления подпиткой применяется алгоритм управления с обратной связью (в отличие от предварительно определенного режима подпитки). В процессе подпитки с обратной связью скорость подпитки зависит от фактического уровня определенного параметра культивирования. Параметры культивирования, подходящие для подпитки с обратной связью, представляют собой, например, биомассу (и полученные для нее химические или физические параметры), растворенный кислород, дыхательный коэффициент, рН или температуру. Другой пример режима питания с обратной связью основан на фактической концентрации глюкозы в биореакторе.In another embodiment of the fed-batch method of the present invention, a feedback control algorithm (as opposed to a predetermined feed mode) is used to control the feed. In the closed-loop feeding process, the feeding rate depends on the actual level of a certain cultivation parameter. Cultivation parameters suitable for closed-loop feeding are, for example, biomass (and the resulting chemical or physical parameters), dissolved oxygen, respiratory coefficient, pH or temperature. Another example of a closed-loop feeding regime is based on the actual glucose concentration in the bioreactor.

- 40 044676- 40 044676

В другом варианте осуществления бактериальные клетки, несущие экспрессионную кассету на основе генома согласно настоящему изобретению, культивируют в непрерывном режиме. Процесс непрерывной ферментации характеризуется определенной, постоянной и непрерывной скоростью подачи свежей культуральной среды в биореактор, в результате чего культуральная среда одновременно удаляется из биореактора с той же определенной, постоянной и непрерывной скоростью удаления. Поддерживая питательную среду, скорость подпитки и скорость удаления на одном и том же постоянном уровне, параметры и условия культивирования в биореакторе остаются постоянными (так называемое устойчивое состояние). Удельная скорость роста μ может быть задана заранее и является исключительно результатом скорости подачи и объема питательной среды в биореакторе. Поскольку клетки, имеющие одну или более экспрессионных кассет на основе генома, являются генетически очень стабильными (в отличие от структурно и сегрегационно нестабильных систем экспрессии на основе плазмид или систем экспрессии, в которых вставленная в геном кассета зависит от геномной амплификации), число поколений клеток (удвоений клеток) по изобретению теоретически не ограничено, а также, следовательно, время культивирования. Преимущество культивирования генетически стабильной системы экспрессии на основе генома в непрерывном режиме заключается в том, что можно получить более высокое общее количество рекомбинантного белка за период времени по сравнению с генетически нестабильными системами предшествующего уровня техники. Кроме того, из-за теоретически неограниченного времени выращивания, непрерывное культивирование клеток по изобретению может приводить к более высокому общему количеству белка за период времени, даже по сравнению с процессами культивирования с подпиткой. Неограничивающие рабочие примеры, приведенные ниже, показывают высокую стабильность и продуктивность экспрессирующей конструкции на основе генома.In another embodiment, bacterial cells harboring a genome-based expression cassette according to the present invention are cultured continuously. The continuous fermentation process is characterized by a specific, constant and continuous rate of supply of fresh culture medium into the bioreactor, resulting in the culture medium being simultaneously removed from the bioreactor at the same specific, constant and continuous removal rate. By maintaining the nutrient medium, feed rate, and removal rate at the same constant level, the parameters and culture conditions in the bioreactor remain constant (the so-called steady state). The specific growth rate μ can be preset and is solely a result of the feed rate and volume of growth medium in the bioreactor. Because cells having one or more genome-based expression cassettes are genetically very stable (in contrast to structurally and segregationally unstable plasmid-based expression systems or expression systems in which the cassette inserted into the genome depends on genomic amplification), the number of cell generations ( cell doublings) according to the invention is theoretically unlimited, and therefore the cultivation time. The advantage of culturing a genetically stable genome-based expression system in a continuous manner is that a higher total amount of recombinant protein can be obtained over a period of time compared to genetically unstable prior art systems. In addition, due to the theoretically unlimited culture time, continuous cell culture of the invention can result in a higher total amount of protein over a period of time, even compared to fed-batch culture processes. The non-limiting worked examples below demonstrate the high stability and productivity of the genome-based expression construct.

Другой предпочтительный вариант осуществления относится к полунепрерывному культивированию клеток. Полунепрерывный процесс культивирования в контексте изобретения представляет собой процесс, который на первом этапе используется как процесс с подпиткой (т.е. этап периодической ферментации с последующим этапом подпитки). После получения определенного объема или биомассы (т.е. обычно при получении верхнего предела объема ферментера) значительную часть клеточной среды, содержащей представляющий интерес рекомбинантный белок, удаляют из биореактора. Впоследствии подпитка возобновляется до тех пор, пока биомасса или объем культуральной среды снова не достигнут определенного значения. Этот способ (удаление культуральной среды и повторная наполнение при подпитке) может проводиться как минимум один раз и теоретически неопределенное время.Another preferred embodiment relates to semi-continuous cell culture. A semi-continuous cultivation process in the context of the invention is a process that is used in the first step as a fed-batch process (ie a batch fermentation step followed by a fed-batch step). Once a certain volume or biomass has been reached (ie, typically the upper limit of the fermenter volume), a significant portion of the cell medium containing the recombinant protein of interest is removed from the bioreactor. Subsequently, feeding is resumed until the biomass or volume of the culture medium again reaches a certain value. This method (removing the culture medium and refilling with recharge) can be carried out at least once and for a theoretically indefinite time.

Что касается типа культуральной среды, используемой в процессе ферментации, ограничений нет. Культуральная среда может быть полуопределенной, т.е. может содержать сложные компоненты среды (например, дрожжевой экстракт, соевый пептон, казаминовые кислоты и т.д.), или она может являться химически определенной без каких-либо комплексных соединений.There are no restrictions regarding the type of culture medium used in the fermentation process. The cultural environment can be semi-definite, i.e. may contain complex media components (eg, yeast extract, soy peptone, casamino acids, etc.), or it may be chemically defined without any complex compounds.

Предпочтительно используется определенная среда. Определенная среда (также называемая минимальной или синтетической средой) состоит исключительно из химически определенных веществ, т.е. источников углерода, таких как глюкоза или глицерин, солей, витаминов и, с учетом возможной ауксотрофии по штамму, специфических аминокислот или других веществ, такие как тиамин. Наиболее предпочтительно, чтобы в качестве источника углерода использовалась глюкоза. Обычно источником углерода в питательной среде служит ограничивающий рост компонент, который контролирует удельную скорость роста.A specific medium is preferably used. Defined media (also called minimal or synthetic media) consists solely of chemically defined substances, i.e. carbon sources such as glucose or glycerol, salts, vitamins and, taking into account possible auxotrophy by strain, specific amino acids or other substances such as thiamine. Most preferably, glucose is used as the carbon source. Typically, the carbon source in the growth medium is a growth-limiting component that controls the specific growth rate.

В способах по изобретению получают значительно более высокие выходы, потому что рост бактерий и высокая, но физиологически приемлемая скорость экспрессии рекомбинантных генов могут поддерживаться в течение всего производственного процесса.Significantly higher yields are obtained in the methods of the invention because bacterial growth and a high but physiologically acceptable rate of recombinant gene expression can be maintained throughout the entire production process.

Как описано выше, в наиболее предпочтительном варианте осуществления изобретения представляющий интерес белок находится под контролем индуцибельного или контролируемого промотора.As described above, in the most preferred embodiment of the invention, the protein of interest is under the control of an inducible or controllable promoter.

Нет ограничений в отношении способа, которым осуществляется индукция экспрессии белка. Например, индуктор может быть добавлен в виде единичного или многократного болюса или путем непрерывной подпитки, причем последняя также известна как подпитка индуктором (индукция). Нет никаких ограничений в отношении момента времени, в который происходит индукция. Индуктор может быть добавлен в начале культивирования или в точке начала непрерывной подпитки питательными веществами или после начала подпитки. Подпитка индуктором может быть достигнута либо с помощью индуктора, содержащегося в культуральной среде, либо путем отдельной подпитки.There are no restrictions on the manner in which protein expression is induced. For example, the inducer can be added as a single or multiple bolus or through continuous refill, the latter also known as inducer refill (induction). There are no restrictions regarding the point in time at which induction occurs. The inducer can be added at the beginning of cultivation or at the point at which continuous nutrient feeding begins or after feeding begins. Inducer feeding can be achieved either by using an inducer contained in the culture medium or by a separate feeding.

Преимущество подпитки индуктором состоит в том, что оно позволяет контролировать дозировку индуктора, т.е. позволяет поддерживать дозировку определенного или постоянного количества индуктора на постоянное число генов, представляющих интерес, в производственной системе. Например, подпитка индуктором позволяет дозировать индуктор, который пропорционален биомассе, что приводит к постоянному соотношению индуктора и биомассы. Единицами биомассы, на которых может основываться доза индуктора, могут быть, например, сухой вес клеток (CDW), вес влажных клеток (WCW), оптическая плотность, общее количество клеток (TCN; клетки на объем) или колониеобразующие единицы (КОЕ на объем), или онлайн контролируемые сигналы, которые пропорциональны биомассе (например, флуоресценция, мутность, диэлектрическая проницаемость и т.д.). По существу способ по изобретениюThe advantage of feeding with an inductor is that it allows you to control the dosage of the inductor, i.e. allows the dosage of a specific or constant amount of inducer to be maintained for a constant number of genes of interest in the production system. For example, inductor feeding allows the inducer to be dosed in a manner that is proportional to the biomass, resulting in a constant inductor to biomass ratio. Biomass units on which the inducer dose may be based may be, for example, cell dry weight (CDW), cell wet weight (WCW), optical density, total cell number (TCN; cells per volume), or colony forming units (CFU per volume) , or online controlled signals that are proportional to biomass (eg fluorescence, turbidity, dielectric constant, etc.). Essentially the method according to the invention

- 41 044676 позволяет точно дозировать индуктор по любому параметру или сигналу, который пропорционален биомассе, независимо от того, измеряется ли сигнал в автономном режиме или в режиме онлайн. Поскольку количество генов, представляющих интерес, определяется и является постоянным единицы для биомассы (один или несколько генов на клетку), следствием этого режима индукции является постоянная доза индуктора на представляющий интерес ген. В качестве дополнительного преимущества точную и оптимальную дозировку количества индуктора относительно количества биомассы можно определить и оптимизировать экспериментально.- 41 044676 allows precise dosing of the inductor according to any parameter or signal that is proportional to the biomass, regardless of whether the signal is measured offline or online. Since the number of genes of interest is determined and is a constant unit for biomass (one or more genes per cell), the consequence of this induction regime is a constant dose of inducer per gene of interest. As an additional advantage, the exact and optimal dosage of the amount of inducer relative to the amount of biomass can be determined and optimized experimentally.

Возможно, нет необходимости определять фактический уровень биомассы аналитическими методами. Например, может быть достаточно добавить индуктор в количестве, которое основано на предыдущих культивированиях (прошлые данные по биомассе). В другом варианте осуществления может быть предпочтительным добавить количество индуктора на одну единицу биомассы, как теоретически рассчитано или предсказано. Например, для культивирования на основе подпитки (например, периодической или непрерывной) хорошо известно, что одна единица ограничивающего рост компонента в питательной среде, обычно источника углерода, приведет к определенному количеству биомассы. Например, 1 г глюкозы в качестве субстрата, ограничивающего рост, приведет к приблизительно 0,33 г сухой массы клеток (также выраженной коэффициентом выхода субстрата Yx7s=0,33). Следовательно, определенная дозировка индуктора на представляющий интерес ген также может быть достигнута определенной дозировкой индуктора на единицу, ограничивающую рост компонента, поскольку определенная единица, ограничивающая рост, приводит к определенной единице биомассы, а определенная единица биомассы содержит определенное количество молекул представляющих интерес белков согласно способу по изобретению.It may not be necessary to determine the actual biomass level by analytical methods. For example, it may be sufficient to add an inducer in an amount that is based on previous cultivations (historical biomass data). In another embodiment, it may be preferable to add the amount of inducer per unit of biomass as theoretically calculated or predicted. For example, for fed-batch cultivation (eg, batch or continuous), it is well known that one unit of a growth-limiting component in the growth medium, typically a carbon source, will result in a certain amount of biomass. For example, 1 g of glucose as a growth-limiting substrate will result in approximately 0.33 g of cell dry mass (also expressed by substrate yield coefficient Yx7 s = 0.33). Therefore, a certain dosage of inducer per gene of interest can also be achieved by a certain dosage of inducer per unit of growth-limiting component, since a certain unit of growth-limiting component leads to a certain unit of biomass, and a certain unit of biomass contains a certain number of molecules of proteins of interest according to the method of invention.

Существенным преимуществом является то, что подпитка ограниченным количеством индуктора предотвращает метаболическую нагрузку и снижает стресс в пользу максимизации способности синтеза белка.A significant benefit is that feeding a limited amount of inducer prevents metabolic stress and reduces stress in favor of maximizing protein synthesis capacity.

Соотношение индуктора и биомассы (или гена, или субстрата, ограничивающего рост) не обязательно может быть постоянным. Это также может быть линейное увеличение, линейное уменьшение, увеличение или уменьшение в соответствии с экспоненциальными или другими математическими функциями и т.д. Существенным признаком согласно изобретению является то, что определяется значение дозы индуктора на представляющий интерес ген.The ratio of inducer to biomass (or gene or growth-limiting substrate) may not necessarily be constant. It can also be linear increase, linear decrease, increase or decrease according to exponential or other mathematical functions, etc. An essential feature of the invention is that the dose of the inducer per gene of interest is determined.

В некоторых вариантах осуществления способ по изобретению представляет собой периодический процесс с подпиткой, в котором индуктор присутствует в загруженной среде с начала культивирования.In some embodiments, the method of the invention is a fed-batch process in which the inducer is present in the loaded medium from the start of the culture.

Способ индукции экспрессии также может быть конститутивным, что означает, что индукция не запускается химически или другими стимулами, но является постоянной с начала культивирования. Конститутивная индукция является предпочтительным индукционным режимом для непрерывного культивирования, но также полезна для культивирования с подпиткой.The mode of induction of expression may also be constitutive, meaning that induction is not triggered by chemical or other stimuli, but is constant from the start of culture. Constitutive induction is the preferred induction mode for continuous culture, but is also useful for fed-batch culture.

Рекомбинантные бактерии и способы получения НМО хорошо известны (см., например, Priem В. et al. (2002), Glycobiology, 12(4):235-40; Drouillard S. et al. (2006), Angew. Chem. Int., ed., 45:1778 -1780; Fierfort N. & Samain E. (2008), J. Biotechnol., 134:261-265; Drouillard S. et al. (2010), Carbohydrate Research, 345, 1394-1399; Gebus С. et al. (2012), Carbohydrate Research, 363, 83-90).Recombinant bacteria and methods for producing HMO are well known (see, for example, Priem B. et al. (2002), Glycobiology, 12(4):235-40; Drouillard S. et al. (2006), Angew. Chem. Int ., ed., 45:1778 -1780; Fierfort N. & Samain E. (2008), J. Biotechnol., 134:261-265; Drouillard S. et al. (2010), Carbohydrate Research, 345, 1394- 1399; Gebus S. et al. (2012), Carbohydrate Research, 363, 83-90).

Следуя способам, описанным в данной области техники, и согласно изобретению бактериальный хозяин может использовать эндогенный или экзогенный путь синтеза гуанозиндифосфата (GDP-фукозы) для получения фукозилированных НМО. Под путем синтеза GDP-фукозы подразумевается последовательность реакций, обычно контролируемых и катализируемых ферментами, которая приводит к синтезу GDPфукозы. Примерный путь синтеза GDP-фукозы в Е.coli изложен ниже. В этом пути синтеза ферменты для синтеза GDP-фукозы включают в себя 1) manA=фосфоманнозоизомеразу (PMI); 2) manB=фосфоманномутазу (РММ); 3) manC=манноза-1-фосфат-гуанилитрансферазу (GMP); 4) gmd=GDR-манноза-4,6дегидратаза (GMD); 5) fcl=GDP-фукозосинтазу (GFS); и 6) ΔwcaJ=мутированная трансфераза UDP-глюкозылипидный-носитель.Following the methods described in the art, and according to the invention, the bacterial host can use the endogenous or exogenous guanosine diphosphate (GDP-fucose) synthesis pathway to produce fucosylated HMOs. The GDP-fucose synthesis pathway refers to the sequence of reactions, usually controlled and catalyzed by enzymes, that leads to the synthesis of GDP-fucose. An approximate route for the synthesis of GDP-fucose in E. coli is outlined below. In this synthesis pathway, enzymes for the synthesis of GDP-fucose include 1) manA=phosphomannose isomerase (PMI); 2) manB=phosphomannomutase (PMM); 3) manC=mannose-1-phosphate-guanylytransferase (GMP); 4) gmd=GDR-mannose-4,6 dehydratase (GMD); 5) fcl=GDP-fucose synthase (GFS); and 6) ΔwcaJ=mutated UDP-glucoselipid carrier transferase.

Глюкозα^Glc-6-P^Pru-6-P^lMαn-6-Р^2Mαn-1-P^3GDP-Mαn^4 5GDP-Fuc6 Колановая кислотаGlucoseα^Glc-6-P^Pru-6-P^ l Mαn-6-P^ 2 Mαn-1-P^3GDP-Mαn^4 5GDP-Fuc 6 Colanoic acid

Путь синтеза GDP-фукозы из фруктозо-8-фосфата, общего метаболического интермедиата у всех организмов, состоит из 5 ферментативных стадий: 1) PMI (фосфоманнозоизомераза); 2) РММ (фосфоманномутаза); 3) GMP (манноза-1-фосфат-гуанилитрансфераза); 4) GMD (GDP-манноза-4,6-дегидратаза); и 5) GFS (GDP-фукозосинтаза). В контексте настоящего изобретения ферменты пути синтеза GDP, которые способствуют увеличению внутриклеточного пула GDP-фукозы, включены в группу полезных белков, которые косвенно участвуют в синтезе НМО. Отдельные виды бактерий имеют различные генетические возможности синтеза GDP-фукозы. Например, E.coIi может синтезировать ферменты, которые способны выполнять все пять стадий, в то время как в Bacillus licheniformis отсутствуют ферменты, способные выполнять стадии 4 и 5 (т.е. GMD и GFS). Любые ферменты в пути синтеза GDP, которые в природе отсутствуют в каких-либо конкретных бактериальных видах, могут быть введены хозяину с помощью молекулярной инженерии с использованием рекомбинантных конструкций ДНК по изобретению. Гены, кодирующие отсутствующие ферменты, могут быть представлены либо в плазмидном экспрессионном векторе, либо в виде экзогенных генов, интегрированных в хромосому хозяина (ферменты пути синтезаThe pathway for the synthesis of GDP-fucose from fructose-8-phosphate, a common metabolic intermediate in all organisms, consists of 5 enzymatic steps: 1) PMI (phosphomannose isomerase); 2) PMM (phosphomannomutase); 3) GMP (mannose-1-phosphate-guanylytransferase); 4) GMD (GDP-mannose-4,6-dehydratase); and 5) GFS (GDP-fucose synthase). In the context of the present invention, enzymes of the GDP synthesis pathway, which contribute to increasing the intracellular pool of GDP-fucose, are included in the group of beneficial proteins that are indirectly involved in the synthesis of HMO. Individual bacterial species have different genetic capabilities for the synthesis of GDP-fucose. For example, E.coIi can synthesize enzymes that are capable of performing all five steps, while Bacillus licheniformis lacks enzymes that are capable of performing steps 4 and 5 (i.e., GMD and GFS). Any enzymes in the GDP synthesis pathway that are not naturally present in any particular bacterial species can be introduced into the host by molecular engineering using the recombinant DNA constructs of the invention. Genes encoding the missing enzymes can be presented either in a plasmid expression vector or as exogenous genes integrated into the host chromosome (enzymes of the synthesis pathway

- 42 044676- 42 044676

GDP в контексте изобретения представляют собой ферменты, которые косвенно участвуют в производстве НМО, т.е. являются ферментами, необходимыми для производства НМО).GDPs in the context of the invention are enzymes that are indirectly involved in the production of HMOs, i.e. are enzymes necessary for the production of HMO).

Бактерия, пригодная для продукции НМО, например, Е.coli, может содержать ген эндогенной β-галактозидазы или экзогенный ген β-галактозидазы, например, Е.coli содержит эндогенный ген lacZ (например, с номером доступа в базе GenBank - V00296 (GI: 41901)). Для целей изобретения HMO-продуцирующую бактериальную клетку генетически модифицируют либо для включения любого гена β-галактозидазы, либо для включения инактивированного гена. Ген может быть инактивирован путем полной или частичной делеции соответствующей нуклеотидной последовательности из бактериального генома, или последовательность гена мутируют так, чтобы она совсем не транскрибировалась, или при транскрипции не транслировалась, или при трансляции в белок (т.е. β-галактозидазу), белок не обладал бы соответствующей ферментативной активностью. Таким образом, бактерия, продуцирующая НМО, накапливает увеличенный внутриклеточный пул лактозы, что полезно для производства НМО.A bacterium suitable for HMO production, for example E. coli, may contain an endogenous β-galactosidase gene or an exogenous β-galactosidase gene, for example E. coli contains an endogenous lacZ gene (for example, with GenBank accession number V00296 (GI: 41901)). For purposes of the invention, an HMO-producing bacterial cell is genetically modified to either include any β-galactosidase gene or to include an inactivated gene. A gene can be inactivated by completely or partially deleting the corresponding nucleotide sequence from the bacterial genome, or the gene sequence is mutated so that it is not transcribed at all, or is not translated when transcribed, or is translated into a protein (i.e., β-galactosidase), a protein would not have the corresponding enzymatic activity. Thus, the HMO-producing bacterium accumulates an increased intracellular pool of lactose, which is beneficial for HMO production.

Функциональный ген лактозопермеазы предпочтительно присутствует в НМО-продуцирующей бактерии по изобретению. Ген лактозопермеазы представляет собой эндогенный ген лактозопермеазы или экзогенный ген лактозопермеазы. Например, ген лактозопермеазы содержит ген lacY из Е.coli (например, номер доступа в GenBank - V00295 (GI:41897)). Многие бактерии обладают генетической способностью транспортировать лактозу из питательной среды в клетку, используя транспортный белок, который является либо гомологом лактозопермеазы Е.coli (например, обнаруженный в Bacillus licheniformis), или транспортер, который является представителем распространенного PTS-семейства переносчиков сахара (например, обнаруженный в Lactobacillus casei и Lactobacillus rhamnosus). Для бактерий, не обладающих генетической способностью транспортировать внеклеточную лактозу в цитоплазму клетки, эта способность обеспечивается экзогенным геном переносчика лактозы (например, lacY E.coli), предоставленным на рекомбинантных конструкциях ДНК и доставляемым или в плазмидном экспрессионном векторе, или в виде экзогенных генов, интегрированных в хромосому хозяина.A functional lactose permease gene is preferably present in the HMO-producing bacterium of the invention. The lactose permease gene is an endogenous lactose permease gene or an exogenous lactose permease gene. For example, the lactose permease gene contains the lacY gene from E. coli (eg, GenBank accession number V00295 (GI:41897)). Many bacteria have the genetic ability to transport lactose from the culture medium into the cell, using a transport protein that is either a homolog of E. coli lactose permease (for example, found in Bacillus licheniformis) or a transporter that is a member of the common PTS family of sugar transporters (for example, found in in Lactobacillus casei and Lactobacillus rhamnosus). For bacteria that do not have the genetic ability to transport extracellular lactose into the cell cytoplasm, this ability is provided by an exogenous lactose transporter gene (e.g., E. coli lacY) provided on recombinant DNA constructs and delivered either in a plasmid expression vector or as exogenous genes integrated into the host chromosome.

Для получения фукозилированного олигосахарида путем биосинтеза бактерия предпочтительно содержит мутацию в гене синтеза эндогенной колановой кислоты (фукозосодержащего экзополисахарида). Под геном синтеза колановой кислоты подразумевается ген, участвующий в последовательности реакций, обычно контролируемых и катализируемых ферментами, которые приводят к синтезу колановой кислоты. Типичные гены синтеза колановой кислоты включают ген rcsA (например, номер доступа в GenBank - М58003 (GI:1103316)), ген rcsB, (например, номер доступа в GenBank - Е04821 (GI:2173017)), ген wcaJ, (например, номер доступа в GenBank - (аминокислотная последовательность) ВАА15900 (GI:1736749), ген wzxC, (например, номер доступа в GenBank - (аминокислотная последовательность) ВАА15899 (GI:1736748)), ген wcaD, (например, номер доступа в GenBank - (аминокислотная последовательность) ВАЕ76573 (GI:85675202)), ген wza, (например, номер доступа в GenBank - (аминокислотная последовательность) ВАЕ76576 (GI:85675205)), ген wzb (например, номер доступа в GenBank - (аминокислотная последовательность) ВАЕ76575 (GI:85675204)), и ген wzc (например, номер доступа в GenBank - (аминокислотная последовательность) ВАА15913 (GI:1736763)).To produce fucosylated oligosaccharide by biosynthesis, the bacterium preferably contains a mutation in the gene for the synthesis of endogenous colanic acid (a fucose-containing exopolysaccharide). By colanic acid synthesis gene is meant a gene involved in the sequence of reactions, typically controlled and catalyzed by enzymes, that lead to the synthesis of colanic acid. Typical colanic acid synthesis genes include the rcsA gene (e.g. GenBank accession no. M58003 (GI:1103316)), the rcsB gene (e.g. GenBank accession no. E04821 (GI:2173017)), the wcaJ gene (e.g. GenBank accession - (amino acid sequence) BAA15900 (GI:1736749), wzxC gene, (e.g. GenBank accession number - (amino acid sequence) BAA15899 (GI:1736748)), wcaD gene, (e.g. GenBank accession number - ( amino acid sequence) BAE76573 (GI:85675202)), wza gene, (e.g. GenBank accession number - (amino acid sequence) BAE76576 (GI:85675205)), wzb gene (e.g. GenBank accession number - (amino acid sequence) BAE76575 ( GI:85675204)), and the wzc gene (eg, GenBank accession number - (amino acid sequence) BAA15913 (GI:1736763)).

Это достигается с помощью ряда генетических модификаций эндогенных генов Е.coli, участвующих либо непосредственно в биосинтезе предшественника колановой кислоты, либо в общем контроле синтетического регулона колановой кислоты. В частности, способность штамма-хозяина Е.coli синтезировать внеклеточный капсульный полисахарид, колановую кислоту, устраняется удалением гена wcaJ, кодирующего трансферазу UDP-глюкозы на липидный носитель. На фоне полного отсуствия wcaJ GDP-фукоза накапливается в цитоплазме Е.coli. Сверхэкспрессия положительного регуляторного белка, RcsA, в пути синтеза колановой кислоты приводит к увеличению внутриклеточного уровня GDP-фукозы. Сверхэкспрессия дополнительного положительного регулятора биосинтеза колановой кислоты, а именно RcsB, также используется вместо или в дополнение к сверхэкспрессии RcsA, чтобы повысить внутриклеточный уровень GDP-фукозы. В альтернативном варианте, биосинтез колановой кислоты увеличивается после введения нулевой мутации в ген lon из Е.coli (например, номер доступа в GenBank - L20572 (GI:304907), включенный в настоящий документ в качестве ссылки). Lon представляет собой аденозин5'-трифосфат(АТФ)-зависимую внутриклеточную протеазу, которая ответственна за деградацию RcsA, который был упомянут выше в качестве положительного транскрипционного регулятора биосинтеза колановой кислоты в Е.coli. На фоне нулевой экспрессии lon-протеазы RcsA стабилизируется, уровень RcsA повышается, повышается экспрессия генов, отвечающих за синтез GDP-фукозы в Е.coli (т.е. они сверхэкспрессируются), и увеличивается внутриклеточная концентрация GDP-фукозы. Белки RcsA и RcsB рассматриваются как полезные для целей изобретения, и в некоторых вариантах их уровни в клетках-хозяевах повышаются с использованием конструкций по изобретению, где соответствующие гены функционально связаны с промотором glp, предпочтительно PglpF.This is achieved through a series of genetic modifications of endogenous E. coli genes involved either directly in the biosynthesis of the colanic acid precursor or in the overall control of the synthetic colanic acid regulon. In particular, the ability of the E. coli host strain to synthesize the extracellular capsular polysaccharide, colanic acid, is eliminated by deletion of the wcaJ gene encoding the UDP-glucose transferase to a lipid carrier. In the absence of wcaJ, GDP-fucose accumulates in the cytoplasm of E. coli. Overexpression of the positive regulatory protein, RcsA, in the colanic acid synthesis pathway results in increased intracellular levels of GDP-fucose. Overexpression of an additional positive regulator of colanic acid biosynthesis, namely RcsB, is also used instead of or in addition to overexpression of RcsA to increase intracellular levels of GDP-fucose. Alternatively, colanic acid biosynthesis is increased following the introduction of a null mutation in the lon gene from E. coli (eg, GenBank accession number L20572 (GI:304907), incorporated herein by reference). Lon is an adenosine 5'-triphosphate (ATP)-dependent intracellular protease that is responsible for the degradation of RcsA, which was mentioned above as a positive transcriptional regulator of colanic acid biosynthesis in E. coli. Against the background of zero expression of lon protease, RcsA stabilizes, the level of RcsA increases, the expression of genes responsible for the synthesis of GDP-fucose in E. coli increases (i.e., they are overexpressed), and the intracellular concentration of GDP-fucose increases. The RcsA and RcsB proteins are considered useful for the purposes of the invention, and in some embodiments, their levels in host cells are increased using constructs of the invention wherein the corresponding genes are operably linked to a glp promoter, preferably PglpF.

Предпочтительно, чтобы бактерия, продуцирующая фукозилированный HMG, содержала ген экзогенной фукозилтрансферазы. Например, экзогенный ген фукозилтрансферазы кодирует а(1,2)-фукозилтрансферазу и/или а(1,3)-фукозилтрансферазу. Примером гена а(1,2)-фукозилтрансферазы является ген wcfW из Bacteroides fragilis NCTC 9343. Примером гена а(1,3)-фукозилтрансферазы является ген futAPreferably, the bacterium producing fucosylated HMG contains an exogenous fucosyltransferase gene. For example, the exogenous fucosyltransferase gene encodes α(1,2)-fucosyltransferase and/or α(1,3)-fucosyltransferase. An example of an a(1,2)-fucosyltransferase gene is the wcfW gene from Bacteroides fragilis NCTC 9343. An example of an a(1,3)-fucosyltransferase gene is the futA gene

- 43 044676 из Helicobacter pylori 26695. Один пример гена futA из Helicobacter pylori представлен в GenBank под регистрационным номером HV532291 (GI:365791177). В контексте изобретения ферменты с фукозилтрасферазной активностью (такие как, например, фукозилтрансферазы, кодируемые указанными выше генами) упоминаются в данном документе как белки, которые важны для получения фукозилированных НМО и непосредственно участвуют в продукции одного или более фукозилированных НМО.- 43 044676 from Helicobacter pylori 26695. One example of the futA gene from Helicobacter pylori is submitted to GenBank under accession number HV532291 (GI:365791177). In the context of the invention, enzymes with fucosyltransferase activity (such as, for example, fucosyltransferases encoded by the above genes) are referred to herein as proteins that are important for the production of fucosylated HMOs and are directly involved in the production of one or more fucosylated HMOs.

Способ получения фукозилированных НМО путем биосинтеза в соответствии с изобретением может включать следующие стадии: предоставление бактерии, которая содержит ген дисфункциональной β-галактозидазы, ген экзогенной фукозилтрансферазы, где ген экзогенной фукозилтрансферазы является частью экспрессионной кассеты, где ген функционально связан с промотором glp, например PglpF, мутацию в кластере генов колановой кислоты и функциональный ген лактозопермеазы; культивирование бактерии в присутствии источника углерода, например глицерина, глюкозы, сахарозы, лактозы и т.д.; и выделение фукозилированных НМО из бактерии или из культурального супернатанта бактерии. Используемые в настоящем документе бактерии-продуценты НМО генетически модифицированы для увеличения внутриклеточного пула лактозы (по сравнению с диким типом), для увеличения уровня активности фукозилтрансферазы и, необязательно, для увеличения пула внутриклеточного гуанозиндифосфат(GDP)фукозы. Согласно изобретению указанные бактерии содержат по меньшей мере одну нуклеотидную конструкцию, которая содержит нуклеотидную последовательность, кодирующую фермент, который прямо или косвенно участвует в продукции НМО, и промотор glp по изобретению, предпочтительно PglpF, который функционально связан с этой нуклеотидной последовательностью. Бактерия также может содержать мутацию в гене пути синтеза колановой кислоты (фукозосодержащего экзополисахарида), такого как ген wcaJ, что приводит к увеличению внутриклеточного пула GDP-фукозы. Эндогенный ген lacZ E.coli предпочтительно удален или функционально инактивирован, но таким образом, что экспрессия расположенного за ним гена лактозопермеазы (lacY) остается неизменной. Организм, модифицированный, как описано выше, сохраняет способность переносить лактозу из питательной среды и создает внутриклеточный пул лактозы для использования в качестве акцепторного сахара в синтезе олигосахаридов. Бактерия может дополнительно содержать экзогенный ген rcsA и/или rcsB (например, в эктопической нуклеотидной конструкции, такой как плазмида), и бактерия необязательно дополнительно содержит мутацию в гене 1асАThe method for producing fucosylated HMOs by biosynthesis in accordance with the invention may include the following steps: providing a bacterium that contains a dysfunctional β-galactosidase gene, an exogenous fucosyltransferase gene, where the exogenous fucosyltransferase gene is part of an expression cassette, where the gene is operably linked to a glp promoter, for example PglpF, a mutation in the colanic acid gene cluster and a functional lactose permease gene; cultivating the bacterium in the presence of a carbon source, such as glycerol, glucose, sucrose, lactose, etc.; and isolating fucosylated HMOs from the bacterium or from a culture supernatant of the bacterium. The HMO-producing bacteria used herein are genetically modified to increase the intracellular pool of lactose (relative to wild type), to increase the level of fucosyltransferase activity and, optionally, to increase the pool of intracellular guanosine diphosphate (GDP)fucose. According to the invention, said bacteria contain at least one nucleotide construct, which contains a nucleotide sequence encoding an enzyme that is directly or indirectly involved in the production of HMO, and a glp promoter according to the invention, preferably PglpF, which is operably linked to this nucleotide sequence. The bacterium may also contain a mutation in a colanic acid (fucose-containing exopolysaccharide) pathway gene, such as the wcaJ gene, resulting in an increased intracellular pool of GDP-fucose. The endogenous E. coli lacZ gene is preferably deleted or functionally inactivated, but in such a way that the expression of the downstream lactose permease gene (lacY) remains unchanged. An organism modified as described above retains the ability to tolerate lactose from the culture medium and creates an intracellular pool of lactose for use as a sink sugar in oligosaccharide synthesis. The bacterium may further contain an exogenous rcsA and/or rcsB gene (for example, in an ectopic nucleotide construct such as a plasmid), and the bacterium optionally further contains a mutation in the 1acA gene

Бактерии, обладающие фукозилтрансферазной активностью, могут включать один или оба из экзогенного гена фукозилтрансферазы, кодирующего а(1,2)-фукозилтрансферазу, и экзогенного гена фукозилтрансферазы, кодирующего а(1,3)-фукозилтрансферазу. Примером гена а(1,2)-фукозилтрансферазы является ген wcfW из Bacteroides fragilis NCTC 9343. Другие гены а(1,2)-фукозилтрансферазы, которые используют лактозу в качестве акцепторного сахара (например, ген futC из Helicobacter pylori 26695 или ген wbsJ из Е.coli 0128: В12), могут быть легко заменены на ген wcfW из Bacteroides fragilis. Один пример гена futC из Helicobacter pylori представлен под номером доступа в GenBank - EF452503 (GI:134142866). Примером гена а(1,3)-фукозилтрансферазы является ген futA из Helicobacter pylori 26695, хотя другие гены а(1,3)-фукозилтрансферазы, известные в данной области, могут быть замещены (например, гены а(1,3)-фукозилтрансферазы из Helicobacter hepaticus Hh0072, Helicobacter bills, Campylobacter jejuni или из видов Bacteroides). Некоторые примеры а(1,3)-фукозилтрансфераз и других ферментов, которые участвуют в продукции различных фукозилированных НМО, показаны в табл. 4 ниже.Bacteria having fucosyltransferase activity may include one or both of an exogenous fucosyltransferase gene encoding a(1,2)-fucosyltransferase and an exogenous fucosyltransferase gene encoding a(1,3)-fucosyltransferase. An example of an α(1,2)-fucosyltransferase gene is the wcfW gene from Bacteroides fragilis NCTC 9343. Other α(1,2)-fucosyltransferase genes that use lactose as an acceptor sugar (for example, the futC gene from Helicobacter pylori 26695 or the wbsJ gene from E. coli 0128: B12) can be easily replaced by the wcfW gene from Bacteroides fragilis. One example of the futC gene from Helicobacter pylori is provided under GenBank accession number EF452503 (GI:134142866). An example of an α(1,3)-fucosyltransferase gene is the futA gene from Helicobacter pylori 26695, although other α(1,3)-fucosyltransferase genes known in the art may be substituted (e.g., α(1,3)-fucosyltransferase genes from Helicobacter hepaticus Hh0072, Helicobacter bills, Campylobacter jejuni or from Bacteroides species). Some examples of a(1,3)-fucosyltransferases and other enzymes that are involved in the production of various fucosylated HMOs are shown in Table. 4 below.

- 44 044676- 44 044676

Таблица 4Table 4

Ген Gene Исходный биологический вид Original species Номер доступа Access number Фермент Enzyme Пример НМО Example of CME MAMA_R764 MAMA_R764 Мимивирус Acanthamoeba polyphaga Mimivirus Acanthamoeba polyphaga AGC02224.1 AGC02224.1 α—1,3- фукозилтрансфераза α—1,3- fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI Mg791 Mg791 Megavirus chiliensis Megavirus chiliensis AEQ33441.1 AEQ33441.1 α—1,3- фукозилтрансфераза α—1,3- fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI Moumou_00703 Moumou_00703 Мимивирус Acanthamoeba polyphaga M10A Mimivirus Acanthamoeba polyphaga M10A AGC02224.1 AGC02224.1 α—1,3- фукозилтрансфераза α—1,3- fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI futA futA Helicobacter pylori ATCC 26695 Helicobacter pylori ATCC 26695 NP_207177.1 NP_207177.1 α—1,3- фукозилтрансфераза α—1,3- fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, FpLNHI fucT fucT Helicobacter pylori NCTC 11639 (укороченный) Helicobacter pylori NCTC 11639 (short) AAB81031.1 AAB81031.1 α—1,3- фукозилтрансфераза α—1,3- fucosyltransferase 2’FL, 3’FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F- pLNHI 2'FL, 3'FL, DFL, LNFP-I, LNFP-III, LNFP-V, LNFP-VI, LNDFH-II, F- pLNHI йсТШ ysTSh Helicobacter pylori ATCC 43504 Helicobacter pylori ATCC 43504 AY450598.1 AY450598.1 α—1,4- фукозилтрансфераза α—1,4- fucosyltransferase LNDFH-I, LNDFH-II LNDFH-I, LNDFH-II fucTa fucTa Helicobacter pylori UA948 Helicobacter pylori UA948 AF194963.2 AF194963.2 α—1,3/4- фукозилтрансфераза α—1.3/4- fucosyltransferase LNFP-II, LNDFH-I, LNDFH-II LNFP-II LNDFH-I LNDFH-II

Бактерия может содержать экспрессионную кассету по настоящему изобретению, обеспечивающую экспрессию или сверхэкспрессию одной или более из указанных выше фукозилтрансфераз и, соответственно, более высокую продукцию одного или более фукозилированных HMG, например 2'-FL, 3FL, DFL,The bacterium may contain an expression cassette of the present invention providing expression or overexpression of one or more of the above fucosyltransferases and, accordingly, higher production of one or more fucosylated HMGs, for example 2'-FL, 3FL, DFL,

- 45 044676- 45 044676

LNFP-I, -II, -III, -V, VI, LNDFH-I, -II или -Ш.LNFP-I, -II, -III, -V, VI, LNDFH-I, -II or -Ш.

Изобретение в дополнительных вариантах осуществления относится к НМО-продуцирующим клеткам-хозяевам, которые содержат одну или более нуклеотидных конструкций, включающих один, два, три или большее число любого из генов, описанных в настоящем документе (т.е. генов, кодирующих важные или полезные белки для продукции НМО), где предпочтительно по меньшей мере одна из конструкций содержит промотор Pglp, функционально связанный с по меньшей мере одним из генов, где по меньшей мере одна из конструкций интегрирована в геном, где предпочтительно по меньшей мере одна из конструкций, интегрированных в геном, содержит промотор Pglp, функционально связанный по меньшей мере с одним из генов, кодирующих белок, который необходим для синтеза НМО, и указанная конструкция присутствует в геноме в низкой копийности. В некоторых вариантах осуществления клетки-хозяева по настоящему изобретению могут продуцировать фукозилированные НМО, в других вариантах осуществления клетки могут продуцировать сталированные НМО, в других вариантах осуществления клетки могут продуцировать нефукозилированные нейтральные НМО.The invention, in additional embodiments, relates to HMO-producing host cells that contain one or more nucleotide constructs comprising one, two, three, or more of any of the genes described herein (i.e., genes encoding important or beneficial proteins for HMO production), where preferably at least one of the constructs contains a Pglp promoter operably linked to at least one of the genes, where at least one of the constructs is integrated into the genome, where preferably at least one of the constructs is integrated into genome, contains a Pglp promoter operably linked to at least one of the genes encoding a protein that is necessary for the synthesis of HMO, and this construct is present in the genome in low copy number. In some embodiments, the host cells of the present invention may produce fucosylated HMOs, in other embodiments, the cells may produce stalled HMOs, and in other embodiments, the cells may produce non-fucosylated neutral HMOs.

Для получения описанных в настоящем документе сиалилированных НМО могут быть использованы общие принципы и способы, ранее описанные в данной области техники (см., например, Drouillard S. et al. (2010), Carbohydrate Research, 345:1394-1399; или Fierfort N. & Samain E. (2008), J. Biotechnol., 134:261-265).To prepare the sialylated HMOs described herein, general principles and methods previously described in the art can be used (see, for example, Drouillard S. et al. (2010), Carbohydrate Research, 345:1394-1399; or Fierfort N . & Samain E. (2008), J. Biotechnol., 134:261-265).

В общем сконструированная бактериальная клетка, которая способна продуцировать сталированный олигосахарид человеческого молока, например 6'-SL (6'-сиалиллактозу), содержит экзогенный ген сиалилтрансферазы, кодирующий а(2,6)-сталилтрансферазу. Бактериальная клетка может быть Е.coli. Экзогенный ген сиалилтрансферазы, используемый для получения 6'-SL, может быть получен из любых доступных источников, например источников, описанных для ряда организмов рода Photobacterium. Еще одна сиалированная НМО, например 3'-SL (3'-сиалиллактоза), может быть получена с помощью сконструированных бактерий, содержащих экзогенную молекулу нуклеиновой кислоты, кодирующую α(2,3)сиалилтрансферазу. Ген экзогенной сиалилтрансферазы, используемый для получения 3'-SL, может быть получен из любого доступного источника, например, из Neisseria meningitidis и Neisseria gonorrhoeae. Некоторые примеры подходящих сиалилтрансфераз перечислены в табл. 5 ниже.In general, an engineered bacterial cell that is capable of producing a stylated human milk oligosaccharide, such as 6'-SL (6'-sialyllactose), contains an exogenous sialyltransferase gene encoding a(2,6)-stalyltransferase. The bacterial cell may be E. coli. The exogenous sialyltransferase gene used to produce the 6'-SL can be obtained from any available sources, for example those described for a number of organisms of the genus Photobacterium. Another sialylated HMO, such as 3'-SL (3'-sialyllactose), can be produced by engineered bacteria containing an exogenous nucleic acid molecule encoding an α(2,3)sialyltransferase. The exogenous sialyltransferase gene used to produce the 3'-SL can be obtained from any available source, for example, from Neisseria meningitidis and Neisseria gonorrhoeae. Some examples of suitable sialyltransferases are listed in Table. 5 below.

Таблица 5Table 5

Ген Gene Исходный биологический вид Original species Номер доступа Access number Фермент Enzyme Пример НМО Example of CME Pd2,6ST Pd2.6ST Photobacterium damselae JT0160 Photobacterium damselae JT0160 BAA25316.1 BAA25316.1 α—2,6сиалилтрансфераза α-2,6 sialyltransferase 6’SL 6'SL PspST6 PspST6 Photobacterium sp. JT-ISH-224 Photobacterium sp. JT-ISH-224 BAF92026.1 BAF92026.1 α—2,6- сиалилтрансфераза α—2,6- sialyltransferase 6’SL 6'SL PiST6_145 PiST6_145 Photobacterium leiognathi JT-SHIZ145 Photobacterium leiognathi JT-SHIZ145 BAF91416.1 BAF91416.1 α—2,6- сиалилтрансфераза α—2,6- sialyltransferase 6’SL 6'SL PiST6_119 PiST6_119 Photobacterium leiognathi JT-SHIZ119 Photobacterium leiognathi JT-SHIZ119 BAI49484.1 BAI49484.1 α—2,6- сиалилтрансфераза α—2,6- sialyltransferase 6’SL 6'SL NST NST Neisseria meningitidis MC58 Neisseria Neisseria meningitidis MC58 Neisseria AAC44541.1 AAC44541.1 α—2,3- сиалилтрансфераза α—2,3- sialyltransferase 3’SL 3'SL NGO_1081 NGO_1081 gonorrhoeae (штамм АТСС 700825/FA1090) gonorrhoeae (strain ATCC 700825/FA1090) YP_208160.1 YP_208160.1 α—2,3- сиалилтрансфераза α—2,3- sialyltransferase 3’SL 3'SL

Предпочтительно, чтобы созданная бактерия содержала дефицитный (нарушенный) катаболический путь сиаловой кислоты. Катаболический путь сиаловой кислоты означает последовательность реакций, обычно контролируемых и катализируемых ферментами, которые приводят к деградации сиаловой кислоты. Типичным катаболическим путем сиаловой кислоты, описанным в настоящем документе, является путь Е.coli. В этом пути сиаловая кислота (Neu5Ac; N-ацетилнейраминовая кислота) разлагается ферментами NanA (лиаза N-ацетилнейраминовой кислоты) и NanK (N-ацетилманнозаминакиназа) и NanE (N-ацетилманнозамин-6-фосфат-эпимераза), все они кодируются опероном nanATEK-yhcH и подавляются NanR (http://ecocyc.org/ECOLI). Дефицит катаболического пути сиаловой кислоты достигается в хозяине Е.coli путем введения мутации в эндогенную nanA (N-ацетилнейраминат лиазу) (например, номер доступа в GenBank - D00067.1(GL216588)) и/или nanK (N-ацетилманнозаминакиназу) (например, номер доступа в GenBank (аминокислотная последовательность) ВАЕ77265.1 (GL85676015)) и/или папЕPreferably, the engineered bacterium contains a deficient (impaired) sialic acid catabolic pathway. The sialic acid catabolic pathway refers to the sequence of reactions, usually controlled and catalyzed by enzymes, that lead to the degradation of sialic acid. A typical sialic acid catabolic pathway described herein is the E. coli pathway. In this pathway, sialic acid (Neu5Ac; N-acetylneuraminic acid) is degraded by the enzymes NanA (N-acetylneuraminic acid lyase) and NanK (N-acetylmannosamine kinase) and NanE (N-acetylmannosamine 6-phosphate epimerase), all encoded by the nanATEK- operon. yhcH and are suppressed by NanR (http://ecocyc.org/ECOLI). Sialic acid catabolic pathway deficiency is achieved in the E. coli host by introducing mutations in endogenous nanA (N-acetylneuraminate lyase) (e.g., GenBank accession number D00067.1(GL216588)) and/or nanK (N-acetylmannosamine kinase) (e.g. GenBank accession number (amino acid sequence) BAE77265.1 (GL85676015)) and/or paPE

- 46 044676 (N-ацетилманнозамин-б-фосфат-эпимеразу, GI:947745, включенную в настоящий документ посредством ссылки). Необязательно, чтобы ген nanT (N-ацетилнейраминатного транспортера) также был инактивирован или мутирован. Другие промежуточные продукты метаболизма сиаловой кислоты включают: (ManNAc-6-Р) N-ацетилманнозамин-6-фосфат; (GIcNAc-6-P) N-ацетилглюкозамин-6-фосфат; (GIcN-6-Р) Гикозамин-6-фосфат и (Fruc-6-P) фруктоза-6-фосфат. В некоторых предпочтительных вариантах осуществления nanA мутирован. В других предпочтительных вариантах осуществления nanA и nanK являются мутированными, тогда как nanE остается функциональным. В другом предпочтительном варианте осуществления nanA и nanE мутированы, тогда как nanK не был мутирован, инактивирован или удален. Мутация представляет собой одно или несколько изменений в последовательности нуклеиновой кислоты, кодирующей продукт гена nanA, nanK, nanE и/или nanT. Например, мутация может представлять собой 1, 2, до 5, до 10, до 25, до 50 или до 100 изменений в последовательности нуклеиновой кислоты. Например, гены nanA, nanK, nanE и/или nanT мутированы нулевой мутацией. Нулевые мутации, как описано в настоящем документе, охватывают аминокислотные замены, добавления, делеции или вставки, которые либо вызывают потерю функции фермента (т.е. снижение активности или ее отсутствие), либо потерю фермента (т.е. отсутствие продукта гена). Под делецией подразумевается, что кодирующая область удаляется полностью или частично таким образом, что (функциональный) продукт гена не образуется. Под инактивацией подразумевается, что кодирующая последовательность была изменена таким образом, что полученный продукт гена является функционально неактивным, или кодируемый продукт гена имеет менее 100%, например 90, 80, 70, 60, 50, 40, 30 или 20%, активности от нативного эндогенного продукта гена природного происхождения. Немутированный ген или белок не отличаются от нативной, встречающейся в природе или эндогенной кодирующей последовательности на 1, 2, до 5, до 10, до 20, до 50, до 100, до 200 или до 500 или более кодонов или до длины соответствующей закодированной аминокислотной последовательности.- 46 044676 (N-acetylmannosamine b-phosphate epimerase, GI:947745, incorporated herein by reference). It is not necessary that the nanT (N-acetylneuraminate transporter) gene is also inactivated or mutated. Other intermediates of sialic acid metabolism include: (ManNAc-6-P) N-acetylmannosamine-6-phosphate; (GIcNAc-6-P) N-acetylglucosamine-6-phosphate; (GIcN-6-P) Hycosamine 6-phosphate and (Fruc-6-P) fructose 6-phosphate. In some preferred embodiments, nanA is mutated. In other preferred embodiments, nanA and nanK are mutated while nanE remains functional. In another preferred embodiment, nanA and nanE are mutated, while nanK has not been mutated, inactivated or deleted. A mutation is one or more changes in the nucleic acid sequence encoding the gene product nanA, nanK, nanE and/or nanT. For example, a mutation may represent 1, 2, up to 5, up to 10, up to 25, up to 50, or up to 100 changes in the nucleic acid sequence. For example, the nanA, nanK, nanE and/or nanT genes are mutated by a null mutation. Null mutations, as described herein, cover amino acid substitutions, additions, deletions or insertions that either cause loss of enzyme function (ie, reduced or absent activity) or loss of enzyme (ie, absence of gene product). By deletion it is meant that the coding region is removed in whole or in part so that no (functional) gene product is formed. By inactivation it is meant that the coding sequence has been altered such that the resulting gene product is functionally inactive, or the encoded gene product has less than 100%, for example 90, 80, 70, 60, 50, 40, 30 or 20%, of the activity of the native endogenous gene product of natural origin. An unmutated gene or protein does not differ from the native, naturally occurring, or endogenous coding sequence by 1, 2, up to 5, up to 10, up to 20, up to 50, up to 100, up to 200, or up to 500 or more codons or up to the length of the corresponding encoded amino acid sequences.

Кроме того, бактерия (например, Е.coli) также обладает способностью к синтезу сиаловой кислоты. Например, бактерия обладает способностью к синтезу сиаловой кислоты за счет наличия экзогенной UDP-GlcNAc 2-эпимеразы (например, neuC из Campylobacter jejuni (GenBank AAK91727.1; GL15193223) или эквивалента (например, neuC из Е.coli S88 (GenBank YP_002392936.1; GI: 218560023), Neu5Ассинтазы (например, neuB из С. jejuni (GenBank AAK91726.1; GI: 15193222) или эквивалента (например, синтаза сиаловой кислоты из Flavobacterium limnosediminis, GenBank GL559220424) и/или СМР-Neu5Ассинтетаза (например, neuA из С. jejuni (GenBank ААК91728.1; GI: 15193224) или эквивалента (например, синтаза СМР-сиаловой кислоты из Vibrio brasiliensis, GenBank GI: 493937153).In addition, the bacterium (eg E. coli) also has the ability to synthesize sialic acid. For example, a bacterium has the ability to synthesize sialic acid due to the presence of exogenous UDP-GlcNAc 2-epimerase (for example, neuC from Campylobacter jejuni (GenBank AAK91727.1; GL15193223) or equivalent (for example, neuC from E. coli S88 (GenBank YP_002392936.1 ; GI: 218560023), Neu5Asynthase (e.g., neuB from C. jejuni (GenBank AAK91726.1; GI: 15193222) or equivalent (e.g., sialic acid synthase from Flavobacterium limnosediminis, GenBank GL559220424) and/or CMP-Neu5Asynthetase (e.g. neuA from C. jejuni (GenBank AAK91728.1; GI: 15193224) or equivalent (e.g., CMP-sialic acid synthase from Vibrio brasiliensis, GenBank GI: 493937153).

Бактерии, продуцирующие сиалилированные HMO, содержат одну или более экзогенных сиалилтрансфераз, которые кодируются кодирующей ДНК экспрессионной кассеты по изобретению, которая присутствует в клетках-хозяевах либо в виде плазмиды, либо интегрирована в геном. Предпочтительно, чтобы по меньшей мере одна из одной или более последовательностей ДНК, кодирующих сиалилтрансферазу, была функционально связана с промотором glp, описанным в настоящем документе, предпочтительно PglpF. Неограниченные примеры подходящих сиалилтранфераз приведены в табл. 5.Bacteria that produce sialylated HMOs contain one or more exogenous sialyltransferases that are encoded by the DNA-encoding expression cassette of the invention, which is present in host cells either as a plasmid or integrated into the genome. Preferably, at least one of the one or more DNA sequences encoding the sialyltransferase is operably linked to the glp promoter described herein, preferably PglpF. Non-limiting examples of suitable sialyltransferases are given in table. 5.

Бактерия, обладающая способностью к синтезу сиаловой кислоты, может быть предпочтительно сконструирована так, чтобы иметь повышенную продукцию UDP-GlcNAc. Типичным способом достижения этого является избыточная экспрессия положительного эндогенного регулятора синтеза UDPGlcNAc, например одновременная сверхэкспрессия генов nagC и glmS E.coli. Эта сверхэкспрессия nagC и glmS предпочтительно достигается путем функционального связывания генов с промотором glp по изобретению и экспрессии кассеты в виде интегрированной в геном, или, в альтернативном варианте, это может быть достигнуто путем предоставления дополнительных копий генов nagC и glmS, связанных с glp или другим промотором в плазмидном векторе.A bacterium capable of synthesizing sialic acid may preferably be engineered to have increased production of UDP-GlcNAc. A typical way to achieve this is to overexpress the positive endogenous regulator of UDPGlcNAc synthesis, such as simultaneous overexpression of the E. coli nagC and glmS genes. This overexpression of nagC and glmS is preferably achieved by operably linking the genes to the glp promoter of the invention and expressing the cassette as integrated into the genome, or alternatively it can be achieved by providing additional copies of the nagC and glmS genes linked to glp or another promoter in a plasmid vector.

Продукция нейтральных N-ацетилглюкозаминсодержащих НМО в сконструированных бактериях также известна в данной области (см., например, Gebus С. et al. (2012), Carbohydrate Research, 363, 83-90).The production of neutral N-acetylglucosamine-containing HMOs in engineered bacteria is also known in the art (see, for example, Gebus C. et al. (2012), Carbohydrate Research, 363, 83-90).

Для получения N-ацетилглюкозаминсодержащих НМО, таких как лакто-N-триоза 2 (LNT2), лактоN-тетраоза (LNT), лакто-N-неотетраоза (LNnT), лакто-N-фукопентаза I (LNFP-) I), лакто-N-фукопентаза II (LNFP-II), лакто-М-фукопентаза III (LNFP-III), лакто-М-фукопентаза V (LNFP-V), лакто-М-дифукогексаза I (LDFH-I), лакто-N-дифукогексаоза II (LDFH-II) и лакто-Н-неодифукогексаоза II (LNDFH-111), бактерия содержит функциональный lacY и дисфункциональный ген lacZ, как описано выше, и она сконструирована таким образом, чтобы содержать экзогенный ген UDP-GlcNAc:Galα/β-Rβ3-N-ацетилглюкозаминилтрансферазы или его функциональный вариант или фрагмент. Этот экзогенный ген UDP-GlcNAc:Gala/e-Re3N-ацетилглюкозаминилтрансферазы может быть получен из любого из ряда источников, например, из генов lgtA, описанных для N. meningitides (Genbank, номер доступа белка AAF42258. 1) или N. gonorrhoeae (Genbank, номер доступа белка ACF31229.1). Необязательно дополнительный ген экзогенной гликозилтрансферазы может быть коэкспрессирован в бактерии, содержащей экзогенную UDP-GlcNAc: Gala/βRβ3-N-ацетилглюкозаминилтрансферазу. Например, ген в-1,4-галактозилтрансферазы коэкспрессируется с геном UDP-GlcNAc:Galα/β-Rp3-N-ацетилглюкозаминилтрансферазы. Этот экзогенный ген β-1,4галактозилтрансферазы может быть получен из любого из ряда источников, например, из описанного дляFor the production of N-acetylglucosamine-containing HMOs, such as lacto-N-triose 2 (LNT2), lacto-N-tetraose (LNT), lacto-N-neotetraose (LNnT), lacto-N-fucopentase I (LNFP-)I), lacto- N-fucopentase II (LNFP-II), lacto-M-fucopentase III (LNFP-III), lacto-M-fucopentase V (LNFP-V), lacto-M-difucohexase I (LDFH-I), lacto-N- difucohexaose II (LDFH-II) and lacto-N-neodifucohexaose II (LNDFH-111), the bacterium contains a functional lacY and a dysfunctional lacZ gene as described above, and it is engineered to contain an exogenous UDP-GlcNAc:Galα/β gene -Rβ3-N-acetylglucosaminyltransferase or a functional variant or fragment thereof. This exogenous UDP-GlcNAc:Gala/e-Re3N-acetylglucosaminyltransferase gene can be obtained from any of a number of sources, for example from the lgtA genes described for N. meningitides (Genbank, protein accession number AAF42258.1) or N. gonorrhoeae (Genbank , protein accession number ACF31229.1). Optionally, an additional exogenous glycosyltransferase gene can be coexpressed in a bacterium containing an exogenous UDP-GlcNAc:Gala/βRβ3-N-acetylglucosaminyltransferase. For example, the β-1,4-galactosyltransferase gene is coexpressed with the UDP-GlcNAc:Galα/β-Rp3-N-acetylglucosaminyltransferase gene. This exogenous β-1,4 galactosyltransferase gene can be obtained from any of a number of sources, such as those described for

- 47 044676- 47 044676

N. meningitidis гена IgtB (Genbank, номер доступа белка AAF42257.1) или описанного для Н. pylori гена HP0826/galT (Genbank, номер доступа белка NP 207619.1). Необязательно дополнительный ген экзогенной гликозилтрансферазы, коэкспрессируемый в бактериях, содержащих экзогенный ген UDP-GlcNAc:Gala/eRp3-N-ацетилглюкозаминилтрансферазы, представляет собой ген в-1,3-галактозилтрансферазы, например, описанный для Е.coli 055:Н7, ген wbgO (Genbank, номер доступа белка YP003500090.1), или для Н. pylori ген jhp0563 (Genbank, номер доступа белка AEZ55696.1), или для Streptococcus agalactiae тип Ib OI2 ген cpslBJ (Genbank, номер доступа белка АВ050723). Функциональные варианты и фрагменты любого из ферментов, описанных выше, также охвачены настоящим изобретением.N. meningitidis gene IgtB (Genbank, protein accession number AAF42257.1) or the gene described for H. pylori HP0826/galT (Genbank, protein accession number NP 207619.1). Optionally, the additional exogenous glycosyltransferase gene coexpressed in bacteria containing the exogenous UDP-GlcNAc:Gala/eRp3-N-acetylglucosaminyltransferase gene is a β-1,3-galactosyltransferase gene, such as that described for E. coli 055:H7, the wbgO gene ( Genbank, protein accession number YP003500090.1), or for H. pylori gene jhp0563 (Genbank, protein accession number AEZ55696.1), or for Streptococcus agalactiae type Ib OI2 gene cpslBJ (Genbank, protein accession number AB050723). Functional variants and fragments of any of the enzymes described above are also covered by the present invention.

Предпочтительно, чтобы по меньшей мере один ген, кодирующий фермент, как любой из вышеперечисленных, т.е. оба/любой ген N-ацетилглюкозаминилтрансферазы и/или ген галактозилтрансферазы, был функционально связан с Pglp по изобретению и экспрессировался с соответствующей интегрированной в геном кассеты. В одном варианте осуществления ген, который интегрирован в геном, представляет собой ген, кодирующий галактозилтрансферазу, например ген НР0826, кодирующий фермент GalT из Н. pylori (Genbank, номер доступа белка NP 207619.1); в другом варианте осуществления ген, который интегрирован в геном, представляет собой ген, кодирующий β-1,3-N-ацетилглюкозаминилтрансферазу, например ген lgtA из N. meningitides (Genbank, номер доступа белка AAF42258.1). В этих вариантах осуществления второй ген, т.е. ген β-1,3-N-ацетилглюкозаминилтрансферазы или галактозилтрансферазы, соответственно, может быть экспрессирован либо с интегрированной в геном, либо с плазмидной кассеты. Второй ген может быть необязательно экспрессирован либо под контролем промотора glp, либо под контролем любого другого промотора, подходящего для системы экспрессии, например, Plac.Preferably, at least one gene encoding an enzyme as any of the above, i.e. both/any N-acetylglucosaminyltransferase gene and/or galactosyltransferase gene were operably linked to the Pglp of the invention and expressed from the corresponding genomically integrated cassette. In one embodiment, the gene that is integrated into the genome is a gene encoding a galactosyltransferase, for example the HP0826 gene encoding the GalT enzyme from H. pylori (Genbank, protein accession number NP 207619.1); in another embodiment, the gene that is integrated into the genome is a gene encoding a β-1,3-N-acetylglucosaminyltransferase, for example the lgtA gene from N. meningitides (Genbank, protein accession number AAF42258.1). In these embodiments, the second gene, i.e. the β-1,3-N-acetylglucosaminyltransferase or galactosyltransferase gene, respectively, can be expressed from either a genome-integrated or plasmid cassette. The second gene may optionally be expressed either under the control of a glp promoter or under the control of any other promoter suitable for the expression system, for example Plac.

Преимущественно, бактерии, продуцирующие N-ацетилглюкозаминсодержащие НМО, могут быть сконструированы таким образом, чтобы иметь увеличенный внутриклеточный пул UDP-GlcNAc. Типичным средством достижения этого признака является избыточная экспрессия положительного эндогенного регулятора синтеза UDP-GlcNAc, например одновременная сверхэкспрессия генов nagC и glmS E.coli. Эта сверхэкспрессия nagC и glmS предпочтительно достигается путем оперативного связывания генов с промотором glp по изобретению и интеграции кассеты в геном хозяина, или, в альтернативном варианте, это может быть достигнуто путем предоставления дополнительных копий генов nagC и glmS, связанных с glp или другим промотором в плазмидном векторе.Advantageously, bacteria producing N-acetylglucosamine-containing HMOs can be engineered to have an increased intracellular pool of UDP-GlcNAc. A typical means of achieving this trait is overexpression of the positive endogenous regulator of UDP-GlcNAc synthesis, such as simultaneous overexpression of the E. coli nagC and glmS genes. This overexpression of nagC and glmS is preferably achieved by operatively linking the genes to the glp promoter of the invention and integrating the cassette into the host genome, or alternatively this can be achieved by providing additional copies of the nagC and glmS genes linked to glp or another promoter in the plasmid vector.

Для продукции НМО, продуцирующие НМО бактерии, описанные в настоящем документе, культивируют в соответствии с процедурами, известными в данной области техники, в присутствии подходящего источника углерода, например глюкозы, глицерина, лактозы и т.д., и полученные НМО собирают из культуральной среды и микробной биомассы, образовавшихся в процессе культивирования. После этого НМО очищают в соответствии с процедурами, известными в данной области, например, такими, как описанные в WO 2015188834, WO 2017182965 или WO 2017152918, и очищенные НМО используют в качестве нутрицевтиков, фармацевтических препаратов или для любых других целей, например, для исследований.For HMO production, HMO-producing bacteria described herein are cultured according to procedures known in the art in the presence of a suitable carbon source, such as glucose, glycerol, lactose, etc., and the resulting HMO is collected from the culture medium. and microbial biomass formed during the cultivation process. The HMOs are then purified according to procedures known in the art, such as those described in WO 2015188834, WO 2017182965 or WO 2017152918, and the purified HMOs are used as nutraceuticals, pharmaceuticals or for any other purpose, such as research .

Другие признаки и преимущества изобретения будут очевидны из приведенного ниже описания рабочих примеров и из формулы изобретения. Если не указано иное, то все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно понимают специалисты в области техники, к которой относится это изобретение. Хотя способы и материалы, подобные или эквивалентные тем, которые описаны в настоящем документе, могут использоваться при практическом применении или испытании настоящего изобретения, подходящие способы и материалы описаны ниже. Кроме того, материалы, способы и примеры являются только иллюстративными и поэтому не ограничивают объем изобретения.Other features and advantages of the invention will be apparent from the following description of working examples and from the claims. Unless otherwise specified, all technical and scientific terms used herein have the same meaning as commonly understood by those skilled in the art to which this invention relates. Although methods and materials similar or equivalent to those described herein may be used in the practice or testing of the present invention, suitable methods and materials are described below. In addition, the materials, methods and examples are illustrative only and therefore do not limit the scope of the invention.

ПримерыExamples

Материалы и способы.Materials and methods.

Если не указано иное, то для манипуляций с нуклеиновыми кислотами, их трансформации и экспрессии используются стандартные методы, векторы, элементы контрольной последовательности и другие элементы экспрессионных систем, известные в области молекулярной биологии. Такие стандартные методы, векторы и элементы можно найти, например, в Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology, 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H., Experiments in molecular genetics (1972) (Cold spring Harbor Laboratory Press, NY).Unless otherwise noted, standard techniques, vectors, control sequence elements, and other expression system elements known in the art of molecular biology are used to manipulate, transform, and express nucleic acids. Such standard methods, vectors and elements can be found, for example, in Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology, 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.), DNA Insertion Elements, Plasmids and Episomes (1977) (Cold Spring Harbor Laboratory Press, NY); Miller, J.H., Experiments in molecular genetics (1972) (Cold spring Harbor Laboratory Press, NY).

Штаммы и плазмиды.Strains and plasmids.

Используемый бактериальный штамм MDO был сконструирован из Escherichia coli K12 DHL Генотип Е.coli K12 DH1: F-, λ-, gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. В дополнение к E.coli K12 DH1 генотип MDO имеет следующие модификации: lacZ: делеция 1,5 т.п.н., 1асА делеция 0,5 т.п.н., nanKETA делеция 3,3 т mdoH mc/oH: делеция 0,5 т.п.н., и вставка промотора Plac перед геном gmd.The bacterial strain used, MDO, was constructed from Escherichia coli K12 DHL E. coli K12 DH1 genotype: F - , λ - , gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44. In addition to E. coli K12 DH1, the MDO genotype has the following modifications: lacZ: 1.5 kb deletion, 1acA 0.5 kb deletion, nanKETA 3.3 k deletion mdoH mc/oH: deletion of 0.5 kb, and insertion of the Plac promoter upstream of the gmd gene.

Штаммы, используемые в настоящих примерах, описаны в табл. 6. Донорские и вспомогательныеThe strains used in the present examples are described in table. 6. Donor and auxiliary

- 48 044676 плазмиды, использованные для конструирования этих штаммов, включены в табл. 7 вместе с высококопийными плазмидами, введенными в некоторые из сконструированных штаммов.- 48 044676 plasmids used to construct these strains are included in table. 7 along with high copy number plasmids introduced into some of the constructed strains.

Таблица 6Table 6

Исходные штаммы Source strains Идентификатор штамма, ID Strain identifier, ID Описание генома Genome description Описание плазмиды Description of the plasmid DH1 DH1 F“ 2' endAl recAl relAl gyrA96 thi1 glnV44 hsdR17(rK Шк)F“ 2' endAl recAl relAl gyrA96 thi1 glnV44 hsdR17(r K Шк) MDO MDO E coli DH1 JlacZ, JlacA JnanKETA zimelA dwcaJ, JmdoH E coli DH1 JlacZ, JlacA JnanKETA zimelA dwcaJ, JmdoH Штаммы, экспрессирующие репортерные гены Strains expressing reporter genes Идентификатор штамма, ID Strain identifier, ID Описание генома Genome Description Описание плазмиды Description of the plasmid МАР8О8 MAR8O8 MDO galK::PglpF-lacZ-Tl MDO galK::PglpF-lacZ-Tl - - МАР1010-9 MAR1010-9 MDO galK::PglpF400-9-lacZ-Tl MDO galK::PglpF400-9-lacZ-Tl - - МАР1010-11 MAR1010-11 MDO galK::PglpF400-ll-lacZ-Tl MDO galK::PglpF400-ll-lacZ-Tl - - МАР1010-13 MAR1010-13 MDO galK::PglpF400-13-lacZ-Tl MDO galK::PglpF400-13-lacZ-Tl - - МАР1010-17 MAR1010-17 MDO galK::PglpF400-17-lacZ-Tl MDO galK::PglpF400-17-lacZ-Tl - - МАР1010-19 MAR1010-19 MDO galK::PglpF400-19-lacZ-Tl MDO galK::PglpF400-19-lacZ-Tl - - МАР1010-20 MAR1010-20 MDO galK::PglpF400-20-lacZ-Tl MDO galK::PglpF400-20-lacZ-Tl - - МАР1025 MAR1025 MDO galK::PglpA-lacZ-Tl MDO galK::PglpA-lacZ-Tl - - МАР1026 MAR1026 MDO galK::PglpD4acZ-Tl MDO galK::PglpD4acZ-Tl - - МАР1027 MAR1027 MDO galK::PglpT-lacZ-Tl MDO galK::PglpT-lacZ-Tl - - МАР1086 MAP1086 MDO galK::Δ 175PglpF-lacZ-Tl MDO galK::Δ 175PglpF-lacZ-Tl - - MAPI 176 MAPI 176 MDO galK::PglpF_SDl-lacZ-Tl MDO galK::PglpF_SDl-lacZ-Tl - - MAPI 178 MAPI 178 MDO galK::PglpF_SD3-lacZ-Tl MDO galK::PglpF_SD3-lacZ-Tl - - MAPI 179 MAPI 179 MDO galK::PglpF_SD4-lacZ-Tl MDO galK::PglpF_SD4-lacZ-Tl - - MAP 1180 MAP 1180 MDO galK::PglpF_SD5-lacZ-Tl MDO galK::PglpF_SD5-lacZ-Tl - - MAP1181 MAP1181 MDO galK::PglpF_SD6-lacZ-Tl MDO galK::PglpF_SD6-lacZ-Tl - - MAP 1182 MAP 1182 MDO galK::PglpF_SD7-lacZ-Tl MDO galK::PglpF_SD7-lacZ-Tl - - MAPI 183 MAPI 183 MDO galK::PglpF_SD8-lacZ-Tl MDO galK::PglpF_SD8-lacZ-Tl - - MAP 1184 MAP 1184 MDO galK::PglpF_SD9-lacZ-Tl MDO galK::PglpF_SD9-lacZ-Tl - - MAPI 185 MAPI 185 MDO galK::PglpF_SD10-lacZ-Tl MDO galK::PglpF_SD10-lacZ-Tl - - MAP1206 MAP1206 MDO galK::PglpF_SD2-lacZ-Tl MDO galK::PglpF_SD2-lacZ-Tl - - MAP1209 MAP1209 MDO galKMOPglpFAacZ-Tt MDO galKMOPglpFAacZ-Tt - - MAP1210 MAP1210 MDO galK:A25PglpF-lacZ-Tl MDO galK:A25PglpF-lacZ-Tl - - MAP1211 MAP1211 MDO galK:A150PglpF-\acZD/\ MDO galK:A150PglpF-\acZD/\ - - MAP1356 MAP1356 MDO galK::PglpF-lacZ-Tl-galK glpR::kanR MDO galK::PglpF-lacZ-Tl-galK glpR::kanR MAP 13 65 MAP 13 65 MDO galK::PglpA_org-lacZ-TlgalK MDO galK::PglpA_org-lacZ-TlgalK MAP 13 66 MAP 13 66 MDO galK::PglpD_org-lacZ-TlgalK MDO galK::PglpD_org-lacZ-TlgalK MAP 13 67 MAP 13 67 MDO galK::PglpT_org-lacZ-TlgalK MDO galK::PglpT_org-lacZ-TlgalK

- 49 044676- 49 044676

MAP 13 68 MAP 13 68 MDO galK::PglpF_org-lacZ-TlgalK MDO galK::PglpF_org-lacZ-TlgalK MAP 1370 MAP 1370 MDO galK::Plac_org-lacZ-Tl-galK MDO galK::Plac_org-lacZ-Tl-galK Штаммы, экспрессирующие репортерные гены Strains expressing reporter genes Идентификатор штамма, ID Strain identifier, ID Описание генома Genome description Описание плазмиды Description plasmids МАР219 MAP219 MDO Plac-Pd2 MDO Plac-Pd2 - - МАР700 MAP700 MDO Plac-nst MDO Plac-nst - - МАР710 MAP710 MDO PglpF-nst MDO PglpF-nst - - МАР986 MAR986 MDO PglpF-Pd2 MDO PglpF-Pd2 - - MDO1 MDO1 MDO MDO pBBR3-Plac-lgtA-tet, pBS-Plac-galT-amp pBBR3-Plac-lgtA-tet, pBS-Plac-galT-amp MDO15 MDO15 MDO MDO pBBR3-Plac-lgtA-tet, pBS-Plac-galTK-amp pBBR3-Plac-lgtA-tet, pBS-Plac-galTK-amp МР166 MP166 MDO 3xPlac-lgtA3xPlac-galT lad::CP6-galK MDO 3xPlac-lgtA3xPlac-galT lad::CP6-galK - - МР245 MP245 MDO 3xPlac-lgtA2xPlac-gaZ7X Alaci MDO 3xPlac-lgtA2xPlac-gaZ7X Alaci - - МР1497 MP1497 MDO PglpF-lgtA MDO PglpF-lgtA pBS-Plac-galT-amp pBS-Plac-galT-amp МР1498 MP1498 MDO PglpF-lgtA MDO PglpF-lgtA pBS-Plac-galTK-amp pBS-Plac-galTK-amp МР1499 MP1499 MDO PglpF-galT MDO PglpF-galT pBBR3-Plac-lgtA-tet pBBR3-Plac-lgtA-tet МР1655 MP1655 MDO 2xPglpF-galTK MDO 2xPglpF-galTK pBBR3-Plac-lgtA-tet pBBR3-Plac-lgtA-tet МР1825 MP1825 MDO PglpF-galT PglpF-lgtA lad: :CP6-galK MDO PglpF-galT PglpF-lgtA lad: :CP6-galK - - МР1920 MP1920 MDO PglpF-galTK PglpF-IgtA lad:: CP6-galK MDO PglpF-galTK PglpF-IgtA lad::CP6-galK - - МР2239 MP2239 MDO PglpF-galTK PglpF-lgtA PglpF-futC Alaci MDO PglpF-galTK PglpF-lgtA PglpF-futC Alaci - - МР2374 MP2374 MDO PglpF-galTK PglpF-lgtA PglpF-futC PglpF-СЛ Alaci MDO PglpF-galTK PglpF-lgtA PglpF-futC PglpF-SL Alaci - - МР2622 MP2622 MDO Plac-lgtAPlac-galT MDO Plac-lgtAPlac-galT - - МАР265 MAP265 MDO Plac-Pd2 nadC: :galK MDO Plac-Pd2 nadC: :galK pBS-Plac- neuBCAnadC pBS-Plac-neuBCAnadC МАР425 MAP425 MDO 2xPlac-nst Plac-neuBCA A50lacI MDO 2xPlac-nst Plac-neuBCA A50lacI pBS-Plac- neuBCAnadC pBS-Plac-neuBCAnadC МАР1200 MAR1200 MDO PglpF-neuA PglpF-neuB PglpF-neuC PglpF-Pd2 MDO PglpF-neuA PglpF-neuB PglpF-neuC PglpF-Pd2 - - МАР1214 MAR1214 MDO PglpF-neuA PglpF-neuB PglpF-neuC MDO PglpF-neuA PglpF-neuB PglpF-neuC - - PglpF-nst PglpF-nst FT18 FT18 MDO MDO pBP-Plac-futC-kan pBBR3-Plac-gmd-fdcpsB-cpsG pBP-Plac-futC-kan pBBR3-Plac-gmd-fdcpsB-cpsG МАР965 MAR965 MDO PglpF-gmd-fd-grnm-wcal-cpsB-cpsG PglpF-futC_op MDO PglpF-gmd-fd-grnm-wcal-cpsB-cpsG PglpF-futC_op - -

-50044676-50044676

Таблица 7Table 7

Идентификатор плазмиды, ID Plasmid identifier, ID Описание Description pACBSR pACBSR Para-LSceI-2 Red, pl5A ori, cam* Para-LSceI-2 Red, pl5A ori, cam* pUC57 pUC57 pMBl, bla pMBl, bla pUC57::gal pUC57::gal pUC57::galTK ’ / Tl-galKM’ pUC57::galTK' / Tl-galKM' pMAP99 pMAP99 pVC57-galTK ’-Plac-Pd2_op-Tl -galKM’ pVC57-galTK '-Plac-Pd2_op-Tl -galKM' pMAP205 pMAP205 p UC5 7: : galTK ’-PglpF -lacZ-Tl -galKM’ p UC5 7: : galTK ’-PglpF -lacZ-Tl -galKM’ pMAP216 pMAP216 pUC57-galTK ’-P1 ac-J29nst_op-T 1 -galKM’ pUC57-galTK '-P1 ac-J29nst_op-T 1 -galKM' pMAP228 pMAP228 pUC57-ga/TK ’-PglpF-J29nst_op-Tl -galKM’ pUC57-ga/TK '-PglpF-J29nst_op-Tl -galKM' pMAP391 pMAP391 pUC57-ga/TX’-PglpF-Pd2-Tl-ga/XM’ pUC57-ga/TX’-PglpF-Pd2-Tl-ga/XM’ pMAP431 pMAP431 pVC57-galTK ’-PglpA-lacZ-Tl -galKM’ pVC57-galTK '-PglpA-lacZ-Tl -galKM' pMAP432 pMAP432 pVC57-galTK ’-PglpD-lacZ-Tl -galKM’ pVC57-galTK '-PglpD-lacZ-Tl -galKM' pMAP433 pMAP433 pUC57 -galTK ’-PglpT-lacZ-Tl -galKM’ pUC57 -galTK '-PglpT-lacZ-Tl -galKM' pMAP457 pMAP457 pUC57-ga/TX’-D25PglpF-lacZ-Tl-ga/^ pUC57-ga/TX’-D25PglpF-lacZ-Tl-ga/^ pMAP462 pMAP462 pVC57-galTK ’-D150PglpF-lacZ-Tl -galKM’ pVC57-galTK '-D150PglpF-lacZ-Tl -galKM' pMAP463 pMAP463 pUC57 -galTK ’-D 175PglpF-lacZ-Tl-ga/XM’ pUC57 -galTK '-D 175PglpF-lacZ-Tl-ga/XM' pMAP486 pMAP486 pUC57-ga/7X ’-PglpF_SD 1 -lacZ-Tl -galKM’ pUC57-ga/7X '-PglpF_SD 1 -lacZ-Tl -galKM' pMAP487 pMAP487 pUC57-galTK ’-PglpF_SD2-lacZ-Tl -galKM’ pUC57-galTK '-PglpF_SD2-lacZ-Tl -galKM' pMAP488 pMAP488 pUC57-ga/TX’-PglpF_SD3-lacZ-Tl-ga/XM’ pUC57-ga/TX’-PglpF_SD3-lacZ-Tl-ga/XM’ pMAP489 pMAP489 pVCM-galTK ’-PglpF_SD4-lacZ-Tl -galKM’ pVCM-galTK '-PglpF_SD4-lacZ-Tl -galKM' pMAP490 pMAP490 pVC57-galTK ’-PglpF_SD5-lacZ-Tl -galKM’ pVC57-galTK '-PglpF_SD5-lacZ-Tl -galKM' pMAP491 pMAP491 pUC57-ga/TK ’-PglpF_SD6-lacZ-Tl -galKM’ pUC57-ga/TK '-PglpF_SD6-lacZ-Tl -galKM' pMAP492 pMAP492 pVC57-galTK ’-PglpF_SD7-lacZ-Tl -galKM’ pVC57-galTK '-PglpF_SD7-lacZ-Tl -galKM' pMAP493 pMAP493 pUC57-ga/TK ’-PglpF_SD8-lacZ-Tl -galKM’ pUC57-ga/TK '-PglpF_SD8-lacZ-Tl -galKM' pMAP494 pMAP494 pUC57-ga/7X’-PglpF_SD9-lacZ-Tl -galKM’ pUC57-ga/7X’-PglpF_SD9-lacZ-Tl -galKM’ pMAP495 pMAP495 pUC57 -galTK ’-PglpF_SD 10-lacZ-Tl-ga/XM’ pUC57 -galTK '-PglpF_SD 10-lacZ-Tl-ga/XM' pMAP537 pMAP537 p\JC57-galTK ’-D190PglpF-lacZ-Tl -galKM’ p\JC57-galTK '-D190PglpF-lacZ-Tl -galKM' pMAP689 pMAP689 pVC57-galTK ’-PglpA_org-lacZ-Tl -galKM’ pVC57-galTK '-PglpA_org-lacZ-Tl -galKM' pMAP690 pMAP690 pVC57-galTK ’-PglpD_org-lacZ-Tl -galKM’ pVC57-galTK '-PglpD_org-lacZ-Tl -galKM' pMAP691 pMAP691 pUC57-galTK ’-PglpT_org-lacZ-Tl -galKM’ pUC57-galTK '-PglpT_org-lacZ-Tl -galKM' pMAP693 pMAP693 pVC57-galTK ’-PglpF_org-lacZ-Tl -galKM’ pVC57-galTK '-PglpF_org-lacZ-Tl -galKM' pMAP695 pMAP695 pVC57-galTK ’-Plac_org-lacZ-Tl -galKM’ pVC57-galTK '-Plac_org-lacZ-Tl -galKM' MP55 MP55 pBBR3-Plac-lgtA-tet pBBR3-Plac-lgtA-tet MP46 MP46 pBS-Plac-galT-amp pBS-Plac-galT-amp MP139 MP139 pBS-Plac-galTK-amp pBS-Plac-galTK-amp pMAPlOl pMAPlOl pBS-Plac- neuBCA-nadC pBS-Plac-neuBCA-nadC MP415 MP415 pBP-Plac-futC-kan pBP-Plac-futC-kan MP416 MP416 pBBR3-Plac-gmd-fd-cpsB-cpsG pBBR3-Plac-gmd-fd-cpsB-cpsG

Среды.Wednesdays.

Среду Luria Broth (LB) готовили с использованием LB Broth Powder, Millers (Fisher Scientific), и чашки с LB-агаром приготавливали с использованием LB Agar Powder, Millers (Fisher Scientific). Скрининг штаммов на чашках LB, содержащих 5-бром-4-хлор-3-индолил-pD-галактопиранозид (X-gal), проводили с использованием концентрации X-gal 40 мкг/мл. При добавлении подходящего антибиотика, ампициллина (100 мкг/мл) и/или хлорамфеникола (20 мкг/мл).Luria Broth (LB) medium was prepared using LB Broth Powder, Millers (Fisher Scientific), and LB agar plates were prepared using LB Agar Powder, Millers (Fisher Scientific). Screening of strains on LB plates containing 5-bromo-4-chloro-3-indolyl-pD-galactopyranoside (X-gal) was performed using an X-gal concentration of 40 μg/ml. With the addition of a suitable antibiotic, ampicillin (100 µg/ml) and/or chloramphenicol (20 µg/ml).

Базальная минимальная среда имела следующий состав: NaOH (1 г/л), KOH (2,5 г/л), KH2PO4 (7 г/л), NH4H2PO4 (7 г/л), лимонная кислота (0,5 г/л), микроэлементный раствор (5 мл/л). Концентрированный раствор микроэлементов содержал: ZnSO4-7H2O 0,82 г/л, лимонную кислоту 20 г/л, MnSO4-H2O 0,98 г/л, FeSO4-7H2O 3,925 г/л, CuSO4-5H2O 0,2 г/л. рН базальной минимальной среды доводили до 7,0 с помощьюThe basal minimal medium had the following composition: NaOH (1 g/l), KOH (2.5 g/l), KH2PO4 (7 g/l), NH4H2PO4 (7 g/l), citric acid (0.5 g/l ), microelement solution (5 ml/l). The concentrated solution of trace elements contained: ZnSO 4 -7H 2 O 0.82 g/l, citric acid 20 g/l, MnSO 4 -H 2 O 0.98 g/l, FeSO 4 -7H 2 O 3.925 g/l, CuSO 4 -5H 2 O 0.2 g/l. The pH of the basal minimal medium was adjusted to 7.0 using

- 51 044676- 51 044676

N NaOH и автоклавировали. Перед инокуляцией в базовую минимальную среду вводили 1 мМ MgSO4, 4 мкг/мл тиамина, 0,5% заданного источника углерода (глюкоза, глицерин, сорбит, ксилоза, лактоза, мальтоза (MgSO4)) и при необходимости добавляли изопропил-β-D-тиогалактозид (IPTG) (0,2 мМ), ампициллин (100 мкг/мл) и/или хлорамфеникол (20 мкг/мл). Тиамин, антибиотики и IPTG стерилизовали фильтрацией. Все процентные концентрации для глицерина представлены как объем/объем, а для глюкозы, сорбита, ксилозы, лактозы и мальтозы - как масса/объем.N NaOH and autoclaved. Before inoculation, the basic minimal medium was supplemented with 1 mM MgSO 4 , 4 μg/ml thiamine, 0.5% of a given carbon source (glucose, glycerol, sorbitol, xylose, lactose, maltose (MgSO 4 )) and, if necessary, added isopropyl-β- D-thiogalactoside (IPTG) (0.2 mM), ampicillin (100 μg/ml) and/or chloramphenicol (20 μg/ml). Thiamine, antibiotics and IPTG were sterilized by filtration. All percentage concentrations for glycerol are presented as v/v and for glucose, sorbitol, xylose, lactose and maltose as w/v.

Чашки М9, содержащие 2-дезоксигалактозу, имели следующий состав: агар 15 г/л (Fisher Scientific), 2,26 г/л 5х минимальной соли М9 (Sigma-Aldrich), 2 мМ MgSO4, 4 мкг/мл тиамина, 0,2% глицерина и 0,2% 2-дезокси-D-галαктозы (Carbosynth).M9 plates containing 2-deoxygalactose had the following composition: 15 g/L agar (Fisher Scientific), 2.26 g/L 5x M9 minimal salt (Sigma-Aldrich), 2 mM MgSO 4 , 4 μg/mL thiamine, 0 .2% glycerol and 0.2% 2-deoxy-D-galαctose (Carbosynth).

Индикаторные планшеты MacConkey, содержащие галактозу, имели следующий состав: 40 г/л агаризованной основы MacConkey (BD Difco™). После автоклавирования и охлаждения до 50°С добавляли D-галактозу (Carbosynth) до конечной концентрации 1%.MacConkey indicator plates containing galactose had the following composition: 40 g/L MacConkey agar base (BD Difco™). After autoclaving and cooling to 50°C, D-galactose (Carbosynth) was added to a final concentration of 1%.

Кулътивирование.Cultivation.

Если не указано иное, штаммы Е.coli культивировали в среде Luria-Bertani (LB), содержащей 0,2% глюкозы, при 37°С при перемешивании.Unless otherwise stated, E. coli strains were cultured in Luria-Bertani (LB) medium containing 0.2% glucose at 37°C with agitation.

Культуры, собираемые для анализа на β-галактозидазу, готовили следующим образом: одну колонию из планшета с LB предварительно культивировали в 1 мл минимальной базальной среды, содержащей глюкозу (0,5%), в 10 мл в 24-луночном планшете с глубокими лунками (Deep well plate, Axygen). Планшет герметизировали перед культивированием с помощью Hydrophobic Gas Permeable Adhesive Seal (Axygen) и инкубировали в течение 24 ч при 34°С со встряхиванием при 700 об/мин в орбитальном шейкере (Edmund Biihler GmbH). Плотность клеток культуры контролировали при 600 нм с использованием спектрофотометра S-20 (Воесо, Германия). 20 мкл ночной культуры использовали для инокуляции в 2 мл среды LB или базальной минимальной среды, содержащей глюкозу или другой источник углерода (0,5%) в 24-луночном планшете с глубокими лунками. Антибиотики и/или IPTG добавляли при необходимости. Глубоколуночные планшеты покрывали герметизирующей фольгой и инкубировали в течение 24 ч при 28°С на орбитальном шейкере при 700 об/мин. После инкубации измеряли OD600 и собирали 0,5 мл клеточной культуры центрифугированием для предварительного анализа на β-галактозидазу.Cultures collected for β-galactosidase assays were prepared as follows: one colony per LB plate was precultured in 1 ml of minimal basal medium containing glucose (0.5%) in 10 ml of a 24-well deep-well plate ( Deep well plate, Axygen). The plate was sealed before culture with Hydrophobic Gas Permeable Adhesive Seal (Axygen) and incubated for 24 h at 34°C with shaking at 700 rpm in an orbital shaker (Edmund Biihler GmbH). The cell density of the culture was monitored at 600 nm using an S-20 spectrophotometer (Boeso, Germany). 20 μl of the overnight culture was used to inoculate 2 ml of LB medium or basal minimal medium containing glucose or other carbon source (0.5%) in a 24-well deep well plate. Antibiotics and/or IPTG were added as needed. Deep well plates were covered with sealing foil and incubated for 24 hours at 28°C on an orbital shaker at 700 rpm. After incubation, OD 600 was measured and 0.5 ml of cell culture was collected by centrifugation for preliminary β-galactosidase assay.

Химические компетентные клетки и трансформации.Chemical competent cells and transformations.

Е.coli инокулировали из LB-планшетов в 5 мл LB, содержащей 0,2% глюкозы, и культивировали при 37°С и встряхивании до OD600 приблизительно 0,4. 2 мл культуры собирали центрифугированием в течение 25 с при 13000 g. Супернатант удаляли, и клеточный осадок ресуспендировали в 600 мкл холодного раствора ТВ (10 мМ PIPES, 15 мМ CaCl2, 250 мМ KCl). Клетки инкубировали на льду в течение 20 мин с последующим осаждением в течение 15 с при 13000 g. Супернатант удаляли, и осадок клеток ресуспендировали в 100 мкл холодного раствора ТВ. Трансформацию плазмид осуществляли с использованием 100 мкл компетентных клеток и 1-10 нг плазмидной ДНК. Клетки и ДНК инкубировали на льду в течение 20 мин, а затем подвергали тепловому шоку при 42°С в течение 45 с. После 2-минутной инкубации на льду добавляли 400 мл среды SOC (20 г/л триптона, 5 г/л дрожжевого экстракта, 0,5 г/л NaCl, 0,186 г/л KCl, 10 мМ MgCl2, 10 мМ MgSO4 и 20 мМ глюкозы), и клеточную культуру инкубировали при 37°С со встряхиванием в течение 1 часа перед посевом на селективные чашки.E. coli was inoculated from LB plates into 5 ml LB containing 0.2% glucose and cultured at 37°C with shaking to an OD 600 of approximately 0.4. 2 ml of culture were collected by centrifugation for 25 s at 13000 g. The supernatant was removed and the cell pellet was resuspended in 600 μl of cold TB solution (10 mM PIPES, 15 mM CaCl 2 , 250 mM KCl). Cells were incubated on ice for 20 min followed by sedimentation for 15 s at 13,000 g. The supernatant was removed, and the cell pellet was resuspended in 100 μl of cold TB solution. Plasmid transformation was carried out using 100 μl of competent cells and 1-10 ng of plasmid DNA. Cells and DNA were incubated on ice for 20 min and then heat shocked at 42°C for 45 s. After a 2-minute incubation on ice, 400 ml of SOC medium (20 g/L tryptone, 5 g/L yeast extract, 0.5 g/L NaCl, 0.186 g/L KCl, 10 mM MgCl 2 , 10 mM MgSO 4 and 20 mM glucose), and the cell culture was incubated at 37°C with shaking for 1 hour before plating on selective plates.

Лигирования плазмид трансформировали в химически компетентные клетки TOP10 при условиях, рекомендованных поставщиком (ThermoFisher Scientific).Plasmid ligations were transformed into chemically competent TOP10 cells under conditions recommended by the supplier (ThermoFisher Scientific).

Методы работы с ДНК.Methods of working with DNA.

Плазмидную ДНК из E.coli выделяли с использованием набора QIAprep Spin Miniprep (Qiagen). Хромосомную ДНК из E.coli выделяли с использованием набора QIAmp DNA Mini Kit (Qiagen). Продукты ПНР очищали с использованием набора для очистки ПНР QIAquick (Qiagen). DreamTaq PCR Master Mix (Thermofisher), Phusion U hot start PCR master mix (Thermofisher), USER Enzym (New England Biolab) были использованы в соответствии с рекомендациями поставщика. Праймеры были предоставлены Eurofins Genomics, Германия. Фрагменты ПЦР и плазмиды были секвенированы в Eurofins Genomics.Plasmid DNA from E. coli was isolated using the QIAprep Spin Miniprep kit (Qiagen). Chromosomal DNA from E. coli was isolated using the QIAmp DNA Mini Kit (Qiagen). PNR products were purified using the QIAquick PNR purification kit (Qiagen). DreamTaq PCR Master Mix (Thermofisher), Phusion U hot start PCR master mix (Thermofisher), USER Enzym (New England Biolab) were used according to the supplier's recommendations. Primers were provided by Eurofins Genomics, Germany. PCR fragments and plasmids were sequenced at Eurofins Genomics.

ПЦР на колониях проводили с использованием DreamTaq PCR Master Mix в условиях, рекомендованных поставщиком (Thermofisher) в термоциклере Т100™ (Bio-Rad). Например, во время конструирования штаммов, экспрессирующих репортерный или рекомбинантный ген из локуса galK, в реакции ПЦР на колониях были использованы праймеры 048 (5’-CCCAGCGAGACCTGACCGCAGAAC-3’) (SEQ ID NO: 58) и 049 β-CCCCAGTCCATCAGCGTGACTACC-3’) (SEQ ID NO: 59) для подтверждения правильности предполагаемой модификации.Colony PCR was performed using DreamTaq PCR Master Mix under conditions recommended by the supplier (Thermofisher) in a T100™ Thermal Cycler (Bio-Rad). For example, during the construction of strains expressing a reporter or recombinant gene from the galK locus, primers 048 (5'-CCCAGCGAGACCTGACCGCAGAAC-3') (SEQ ID NO: 58) and 049 β-CCCCAGTCCATCAGCGTGACTACC-3') were used in the colony PCR reaction. (SEQ ID NO: 59) to confirm the correctness of the proposed modification.

- 52 044676- 52 044676

Таблица 8Table 8

Праймеры, использованные для конструирования каркаса, используемого для получения донорских плазмидPrimers used to construct the scaffold used to generate donor plasmids

Названи е Name Последовательность олигонуклеотида, 5’-3’ Oligonucleotide sequence, 5'-3' Описание Description SE Q ID NO S.E. QID NO 040 040 ATTAACCCUCCAGGCATCAAATAAAACGAAAGGC ATTAACCCUCCAGGCATCAAATAAAACGAAAGGC В ackbone.for At ackbone.for 100 100 079 079 ATTTGCGCAUCACCAATCAAATTCACGCGGCC ATTTGCGCAUCACCAATCAAATTCACCGGGCC Backbone.re ν Backbone.re ν 101 101 0261 0261 ATGCGCAAAUGCGGCACGCCTTGCAGATTACG ATGCGCAAAUGCGGCACGCCTTGCAGATTACG PglpF.for PglpF.for 102 102 0262 0262 AGCTGTTUCCTCCTTGGTTAATGTTTGTTGTATGC G AGCTGTTUCCTCCTTGGTTAATGTTTGTTGTATGC G PglpF.rev PglpF.rev 103 103 068 068 ATGCGCAAAUTGTGAGTTAGCTCACTCATTAG ATGCGCAAAUTGTGAGTTAGCTCACTCATTAG Plac.for Plac.for 84 84 0113 0113 AGCTGTTUCCTCCTTAGGTACCCAGCTTTTGTTCC С AGCTGTTUCCTCCTTAGGTACCCAGCTTTTGTTCC C Plac.rev Plac.rev 117 117

Таблица 9Table 9

Г етерологичные гены, включенные в экспрессионные кассеты, содержащие последовательность промотора и последовательность искусственной ДНК (i) (SEQ ID NO: 70), чтобы обеспечить микробную продукцию НМОHeterologous genes included in expression cassettes containing a promoter sequence and an artificial DNA sequence (i) (SEQ ID NO: 70) to enable microbial HMO production

Ген Gene Источник генов Source of genes Номер доступа Access number Функция Function futC futC Helicobacter pylori 26695 Helicobacter pylori 26695 EF452503 EF452503 α-1,2- фукозилтрансфераза α-1,2-fucosyltransferase IgtA IgtA Neisseria meningitidis 053442 Neisseria meningitidis 053442 CP000381 CP000381 ΑΕ3-Ν- ацетилглюкозаминилтрансфераза ΑΕ3-Ν- acetylglucosaminyltransferase galT galT Helicobacter pylori 26695 Helicobacter pylori 26695 AE000511 AE000511 β-1 Д-галактозилтрансфераза β-1 D-galactosyltransferase galT galT Helicobacter pylori Helicobacter pylori Г омологичный Homologous β-1,3 -галактозилтрансфераза β-1,3-galactosyltransferase К TO 43504 43504 BD182026 BD182026 neuA neuA Campylobacter jejuni ATCC43438 Campylobacter jejuni ATCC43438 AF400048 AF400048 CMPСинтетаза CMP Synthetase neuB neuB Campylobacter jejuni ATCC43438 Campylobacter jejuni ATCC43438 AF400048 AF400048 Синтетаза сиаловой кислоты Sialic acid synthetase neuC neuC Campylobacter jejuni ATCC43438 Campylobacter jejuni ATCC43438 AF400048 AF400048 С\сЫКс-6-фосфат-2-эпимераза C\cNx-6-phosphate-2-epimerase nst nst Neisseria meningitides L3 MC58 Neisseria meningitides L3 MC58 U60660 U60660 а-2,3-сиалилтрансфераза a-2,3-sialyltransferase Pd2 Pd2 Photobacterim damsela JT0160 Photobacterim damsela JT0160 ВАА25316.1 VAA25316.1 а-2,6-сиалилтрансфераза a-2,6-sialyltransferase

- 53 044676- 53 044676

Таблица 10Table 10

Праймеры, которые были использованы для амплификации представляющих интерес гетерологичных генов и обеспечения совместимости полученных продуктов ПЦР с плазмидными каркасами, чтобы обеспечить конструирование донораPrimers that were used to amplify heterologous genes of interest and ensure compatibility of the resulting PCR products with plasmid scaffolds to enable donor construction

Идентифик атор олигнуклео тидаID Olignucleotide identifierID Последовательность олигонуклеотида Oligonucleotide sequence Описание Description SEQ ID NO SEQ ID NO МР452 MP452 AAACAGCUATGATCTCTGTCTACATCATC AGTCTG AAACAGCUATGATCTCTGTCTACATCATC AGTCTG galTK_opt for galTK_opt for 105 105 МР453 MP453 AGGGTTAAUTGCGCGTTAGACTTCTTTCG GGGTTTTCA AGGGTTAAUTGCGCGTTAGACTTCTTTCG GGGTTTTCA galTK_opt rev galTK_opt rev 106 106 0123 0123 AAACAGCUATGGCGTTCAAAGTGGTCCAA АТС AAACAGCUATGGCGTTCAAAGTGGTCCAA ATS futC_opt for futC_opt for 107 107 0124 0124 AGGGTTAAUTGCGCGTTAGCCCAGCGCGT TATATTTCTG AGGGTTAAUTGCGCGTTAGCCCAGCGCGT TATATTTCTG futC_opt rev futC_opt rev 108 108 0142 0142 AAACAGCUATGCAACCGCTGGTCTCCGTG С AAACAGCUATGCAACCGCTGGTCTCCGTG C lgtA_opt for lgtA_opt for 109 109 0143 0143 AGGGTTAAUTGCGCGTTAACGGTTTTTCA GCAGGCGG AGGGTTAAUTGCGCGTTAACGGTTTTTCA GCAGGCGG lgtA_opt rev lgtA_opt rev 110 110 0342 0342 AAACAGCUATGTCAAAAGTCGCTCTCATC ACCGG AAACAGCUATGTCAAAAGTCGCTCTCATC ACCGG CA for CA for 111 111 0126 0126 AGGGTTAAUTGCGCGTTACTCGTTCAGCA AGGGTTAAUTGCGCGTTACTCGTTCAGCA CA rev CA rev 112 112 ACGTCAGC ACGTCAGC 0144 0144 AAACAGCUATGCGTGTCTTCGCCATTTCT С AAACAGCUATGCGTGTCTTCGCCATTTCT WITH galT_opt for galT_opt for 113 113 0145 0145 AGGGTTAAUTGCGCGTTAGACGAATTGCC AGTATTTCAGG AGGGTTAAUTGCGCGTTAGACGAATTGCC AGTATTTCAGG galT_opt rev galT_opt rev 114 114 095 095 AAACAGCUATGGAACGTAACGCCGTGAG CCTGC AAACAGCUATGGAACGTAACGCCGTGAG CCTGC nst_opt for nst_opt for 115 115 093 093 AGGGTTAAUTGCGGCTTAGTTTTTATCGTC AAAGGTCAG AGGGTTAAUTGCGGCTTAGTTTTTATCGTC AAAGGTCAG nst_opt rev nst_opt rev 116 116 026 026 AAACAGCUATGTGCAATAGCGATAACACC AAACAGCUATGTGCAATAGCGATAACACC Pd2_opt for Pd2_opt for 98 98 027 027 AGGGTTAAUTGCGCGTTAGGCCCAGAACA GAACATC AGGGTTAAUTGCGCGTTAGGCCCAGAACA GAACATC Pd2_opt rev Pd2_opt rev 99 99

Конструирование плазмид.Construction of plasmids.

Была создана плазмида, содержащая два сайта эндонуклеазы I-Scel, разделенных двумя фрагментами ДНК оперона gal (необходим для гомологичной рекомбинации в galK), и последовательность терминатора транскрипции T1 (pUC57::gal) (GeneScript). Последовательности ДНК, используемые для гомологичной рекомбинации в гал опероне, покрывали пары оснований 3.628.621-3.628.720 и 3.627.572-3.627.671 в последовательности Escherichia coli K12 MG155 полного генома GenBank: ID: СР014225.1. Вставка с помощью гомологичной рекомбинации приведет к удалению 949 пар оснований galK и фенотипа galK.A plasmid was constructed containing two I-Scel endonuclease sites separated by two DNA fragments of the gal operon (required for homologous recombination in galK) and a T1 transcription terminator sequence (pUC57::gal) (GeneScript). The DNA sequences used for homologous recombination in the gal operon covered base pairs 3,628,621-3,628,720 and 3,627,572-3,627,671 in the Escherichia coli K12 MG155 sequence of the complete GenBank genome: ID: CP014225.1. Insertion by homologous recombination will remove 949 bp of galK and the galK phenotype.

Стандартные методики, хорошо известные в области молекулярной биологии, были использованы для конструирования праймеров и амплификации специфических последовательностей ДНК хромосомной ДНК Escherichia coli K-12 DHL Такие стандартные методы, векторы и элементы можно найти, например, в: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley & Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.)Standard techniques well known in the field of molecular biology were used to design primers and amplify specific DNA sequences of Escherichia coli K-12 DHL chromosomal DNA. Such standard techniques, vectors and elements can be found, for example, in: Ausubel et al. (eds.), Current Protocols in Molecular Biology (1995) (John Wiley &Sons); Sambrook, Fritsch, & Maniatis (eds.), Molecular Cloning (1989) (Cold Spring Harbor Laboratory Press, NY); Berger & Kimmel, Methods in Enzymology 152: Guide to Molecular Cloning Techniques (1987) (Academic Press); Bukhari et al. (eds.)

Плазмидный каркас 3,5 т.п.н., содержащий pUC57-sceI-galTK-T1-galKM-sceI, амплифицировали с использованием праймеров 040 (SEQ ID: 7) и O79 (SEQ ID: 8) (табл. 8) и фрагмент ДНК размеромA 3.5 kb plasmid backbone containing pUC57-sceI-galTK-T1-galKM-sceI was amplified using primers 040 (SEQ ID: 7) and O79 (SEQ ID: 8) (Table 8) and DNA fragment size

- 54 044676- 54 044676

3,3 т.п.н., содержащий lacZ, амплифицировали с хромосомной ДНК, выделенной из E.coli K-12 DHL3.3 kb containing lacZ was amplified from chromosomal DNA isolated from E. coli K-12 DHL

Хромосомную ДНК, полученную из Е.coli DH1, использовали для амплификации фрагмента ДНК размером 300 п.н., содержащего промотор PglpF (SEQ ID NO: 57), с использованием олигонуклеотидов 0261 (SEQ ID NO: 102) и 0262 (SEQ ID NO: 103), или промотор Plac (SEQ ID NO: SEQ ID NO: 11) - с использованием олигонуклеотидов 068 и 0113 (SEQ ID NO: 84 и 117) (табл. 8). Аналогично фрагменту ДНК размером 107 п.н., содержащему промотор Plac, Plac_org, фрагмент ДНК размером 182 п.н., содержащий промотор PglpA, PglpA_org, фрагмент ДНК длиной 190 п.н., содержащий промотор PglpD, PglpD_org, фрагмент ДНК размером 245 п.н., содержащий промотор PglpT, PglpT_org, фрагмент ДНК размером 300 п.н., содержащий промотор PglpF, PglpF_org, амплифицировали из генома Е.coli DH1.Chromosomal DNA obtained from E. coli DH1 was used to amplify a 300 bp DNA fragment containing the PglpF promoter (SEQ ID NO: 57) using oligonucleotides 0261 (SEQ ID NO: 102) and 0262 (SEQ ID NO : 103), or the Plac promoter (SEQ ID NO: SEQ ID NO: 11) - using oligonucleotides 068 and 0113 (SEQ ID NO: 84 and 117) (Table 8). Similar to a 107 bp DNA fragment containing the Plac promoter, Plac_org, a 182 bp DNA fragment containing the PglpA promoter, PglpA_org, a 190 bp DNA fragment containing the PglpD promoter, PglpD_org, a 245 DNA fragment bp containing the PglpT promoter, PglpT_org, a 300 bp DNA fragment containing the PglpF promoter, PglpF_org, was amplified from the E. coli DH1 genome.

Шестнадцатинуклеотидная последовательность, расположенная перед сайтом начала трансляции glp-промоторов (SEQ ID NO: 5-8 - glpF, A, D и Т соответственно) (включающая сайт связывания рибосомы), была изменена с помощью ПНР в исходных (org) промоторных фрагментах. Аналогичным образом последовательность Шайна-Дальгарно в экспрессирующем элементе PglpF была модифицирована с использованием праймеров путем введения специфических модификаций в олигонуклеотиды, используемые для амплификации фрагментов ДНК, в результате чего образуются промоторные экспрессионные элементы PglpF_SDl, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9 и PglpF_SD10 (SEQ ID NO: 13-22 соответственно).The sixteen nucleotide sequence located upstream of the translation start site of the glp promoters (SEQ ID NO: 5-8 - glpF, A, D and T, respectively) (including the ribosome binding site) was modified by PNR in the original (org) promoter fragments. Similarly, the Shine-Dalgarno sequence in the PglpF expression element was modified using primers by introducing specific modifications into the oligonucleotides used to amplify DNA fragments, resulting in the promoter expression elements PglpF_SDl, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, P glpF_SD7, PglpF_SD8 , PglpF_SD9 and PglpF_SD10 (SEQ ID NO: 13-22, respectively).

Укорачивание 5'-конца экспрессирующего элемента PglpF проводили с использованием специфических праймеров, дающих промоторные экспрессионные элементы A15PglpF, A140PglpF, A165PglpF и A198PglpF (SEQ ID NOs:29-32).Shortening of the 5' end of the PglpF expression element was performed using specific primers yielding the promoter expression elements A15PglpF, A140PglpF, A165PglpF and A198PglpF (SEQ ID NOs: 29-32).

Все ПЦР-фрагменты были очищены, и плазмидный каркас, промоторный элемент (Plac_org, Plac, PglpF_org, PglpF, PglpT_org, PglpT, PglpA_org, PglpA, PglpD_org, PglpD, PglpF_SDl, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9, PglpF_SD10, A15PglpF, A140PglpF, A165PglpF или A180PglpF) и lacZ были клонированы, трансформированы в клетки TOP10 и отобраны на планшетах с LB, содержащей 100 мг/мл ампициллина и 0,2% глюкозы. Сконструированные плазмиды (см. табл. 10) были очищены. Последовательность промотора и 5'-конец гена lacZ подтверждали секвенированием ДНК (MWG Eurofins Genomics).All PCR fragments were purified, and the plasmid framework, promoter element (Plac_org, Plac, PglpF_org, PglpF, PglpT_org, PglpT, PglpA_org, PglpA, PglpD_org, PglpD, PglpF_SDl, PglpF_SD2, PglpF_SD3, PglpF_SD 4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9, PglpF_SD10, A15PglpF, A140PglpF, A165PglpF or A180PglpF) and lacZ were cloned, transformed into TOP10 cells and selected on LB plates containing 100 mg/ml ampicillin and 0.2% glucose. The constructed plasmids (see Table 10) were purified. The promoter sequence and 5′ end of the lacZ gene were confirmed by DNA sequencing (MWG Eurofins Genomics).

Плазмидные каркасы на основе рТОРО (ThermoFisher Scientific) или любой другой плазмиды могут быть получены аналогично тому, как описано выше. Все сконструированные плазмидные каркасы содержали два специфических фрагмента ДНК, гомологичных Escherichia coli K-12 DH1, используемых для гомологичной рекомбинации. Таким образом, генетическая кассета, содержащая промотор PglpF или Plac, любой представляющий интерес ген и терминатор транскрипции Т1, была вставлена специфично в геном Escherichia coli. Конструирование плазмид, используемых для рекомбинации, было выполнено с использованием стандартных методов клонирования.Plasmid scaffolds based on pTOPO (ThermoFisher Scientific) or any other plasmid can be prepared in the same manner as described above. All constructed plasmid scaffolds contained two specific DNA fragments homologous to Escherichia coli K-12 DH1, used for homologous recombination. Thus, a genetic cassette containing the PglpF or Plac promoter, any gene of interest, and the T1 transcription terminator was inserted specifically into the Escherichia coli genome. Construction of the plasmids used for recombination was performed using standard cloning methods.

Последовательности ДНК гетерологичных генов, кодирующих гликозилтрансферазы или другие представляющие интерес ферменты, были оптимизированы по кодонам и синтезированы с помощью Genescript. Любой представляющий интерес ген, например, гены хозяина или гетерологичные гены, lgtA, galT, galTK, futC, neuA, neuB, neuB, nst или Pd2 (табл. 9), могут быть амплифицированы с помощью ПЦР с использованием соответствующих праймеров, охватывающих стартовый кодон, ATG, и стоп-кодон, ТАА, гена (табл. 10). Например, ген Pd2 был амплифицирован с использованием праймеров 026 (SEQ ID NO: 98) и 027 (SEQ ID NO: 99), тогда как ген nst был амплифицирован с использованием праймеров 095 и 093 (SEQ ID NO: 115 и 116) (табл. 9). Для конструирования донорских плазмид с этими генами использовали следующую процедуру: плазмидный каркас 3,5 т.п.н., содержащий PglpF (SEQ ID NO: 12), амплифицировали с использованием рМАР205 в качестве матрицы. Кодирующие последовательности гена Pd2 из Photobacterium damselae (JT0160) (см. Drouillart et al., 2010, Carbohydrate Research., 345:1394-1399. Efficient synthesis of 6'-sialyllactose, 6,6'-disiallyllactose, and 6'-KDO-lactose by metabolically engeineered E.coli expressing a multifunctional sialyltransferase from the Photobacterium sp. JT-ISH-224) и гена nst из Neisseria meningitides (MC58) (см. Fierfort and Samian, 2008, J. Biotech., 134:261-265, Genetic engineering of Escherichia coli for the economical production of sialylated oligosaccharides) были оптимизированы по кодонам для экспрессии в Е.coli и синтезированы с помощью Genescript. Гены Pd2 и nst, были клонированы в плазмидные каркасы, как описано выше, что позволило получить плазмиды рМАР216, рМАР228, рМАР99, рМАР391 (табл. 3). Плазмиды очищали, трансформировали в клетки TOP10 и отбирали на чашках с LB, содержащих 100 мкг/мл ампициллина и 0,2% глюкозы. Последовательность промотора и 5'-конец генов Pd2 nst были подтверждены секвенированием ДНК (MWG Eurofins Genomics).DNA sequences of heterologous genes encoding glycosyltransferases or other enzymes of interest were codon optimized and synthesized using Genescript. Any gene of interest, such as host or heterologous genes, lgtA, galT, galTK, futC, neuA, neuB, neuB, nst or Pd2 (Table 9), can be amplified by PCR using appropriate primers spanning the start codon , ATG, and stop codon, TAA, of the gene (Table 10). For example, the Pd2 gene was amplified using primers 026 (SEQ ID NO: 98) and 027 (SEQ ID NO: 99), while the nst gene was amplified using primers 095 and 093 (SEQ ID NO: 115 and 116) (Table . 9). To construct donor plasmids with these genes, the following procedure was used: a 3.5 kb plasmid backbone containing PglpF (SEQ ID NO: 12) was amplified using pMAP205 as a template. Coding sequences of the Pd2 gene from Photobacterium damselae (JT0160) (see Drouillart et al., 2010, Carbohydrate Research., 345:1394-1399. Efficient synthesis of 6'-sialyllactose, 6,6'-disiallyllactose, and 6'-KDO -lactose by metabolically engeineered E. coli expressing a multifunctional sialyltransferase from the Photobacterium sp. JT-ISH-224) and the nst gene from Neisseria meningitides (MC58) (see Fierfort and Samian, 2008, J. Biotech., 134:261- 265, Genetic engineering of Escherichia coli for the economical production of sialylated oligosaccharides) were codon optimized for expression in E. coli and synthesized using Genescript. The Pd2 and nst genes were cloned into plasmid scaffolds as described above, which made it possible to obtain plasmids pMAP216, pMAP228, pMAP99, pMAP391 (Table 3). Plasmids were purified, transformed into TOP10 cells, and selected on LB plates containing 100 μg/ml ampicillin and 0.2% glucose. The promoter sequence and 5′ end of the Pd2 nst genes were confirmed by DNA sequencing (MWG Eurofins Genomics).

В целом и для любого представляющего интерес гетерологичного гена все фрагменты ПНР очищали, а плазмидный каркас, промоторный элемент glpF (SEQ ID NO: 54), синтетическую ДНК-последовательность (i) (70UTR/SEQ ID NO: 37/synDNA (i); см. табл. 1) и представляющий интерес ген клонировали стандартным клонированием USER. Клонирование в соответствующую плазмиду может быть выполнено с использованием любой стандартной методики клонирования ДНК. После клонирования ДНК трансформировали в клетки TOP10 и отбирали на чашках с LB, содержащих 100 мкг/мл ампициллина (или 50 мг/мл канамицина в случае конструкций на основе рТОРО) и 0,2% глюкозы. Сконструированные плазIn general, and for any heterologous gene of interest, all PNR fragments were purified, and the plasmid backbone, glpF promoter element (SEQ ID NO: 54), synthetic DNA sequence (i) (70UTR/SEQ ID NO: 37/synDNA (i); see Table 1) and the gene of interest was cloned using standard USER cloning. Cloning into the appropriate plasmid can be accomplished using any standard DNA cloning technique. After cloning, DNA was transformed into TOP10 cells and selected on LB plates containing 100 μg/ml ampicillin (or 50 mg/ml kanamycin in the case of pTOPO-based constructs) and 0.2% glucose. Constructed plazas

- 55 044676 миды были очищены, и последовательность промотора и 5'-конец представляющего интерес гена были проверены секвенированием ДНК (MWG Eurofins Genomics).- 55 044676 mids were purified and the promoter sequence and 5' end of the gene of interest were verified by DNA sequencing (MWG Eurofins Genomics).

Конструирование штаммов.Strain construction.

Вставка промоторных экспрессионных элементов, слитых с репортерным геном или рекомбинантным геном, была выполнена методом наполнения генов (Gene Gorging) по существу, как описано в Herring et al. (Herring, CD., Glasner, J.D., Blattner, F.R. (2003), Gene (311), 153-163). Коротко, донорскую плазмиду и вспомогательную плазмиду совместно трансформировали в MD0 и отбирали на планшетах с LB, содержащих 0,2% глюкозы, ампициллина (100 мкг/мл) или канамицина (50 мг/мл) и хлорамфеникола (20 мкг/мл). Отдельную колонию инокулировали в 1 мл LB, содержащей хлорамфеникол (20 мкг/мл) и 10 мкл 20% L-арабинозы, и инкубировали при 37°С при встряхивании в течение 7-8 ч. Затем клетки высевали на чашки с M9-DOG и инкубировали при 37°С в течение 48 ч. Одиночные колонии, образовавшиеся на MM-DOG расштриховывали на планшетах с LB, содержащих 0,2% глюкозы, и инкубировали в течение 24 ч при 37°С.Insertion of promoter expression elements fused to a reporter gene or a recombinant gene was performed by Gene Gorging essentially as described in Herring et al. (Herring, C. D., Glasner, J. D., Blattner, F. R. (2003), Gene (311), 153-163). Briefly, donor plasmid and helper plasmid were co-transformed into MD0 and selected on LB plates containing 0.2% glucose, ampicillin (100 μg/ml) or kanamycin (50 mg/ml) and chloramphenicol (20 μg/ml). A single colony was inoculated in 1 ml of LB containing chloramphenicol (20 μg/ml) and 10 μl of 20% L-arabinose and incubated at 37°C with shaking for 7-8 hours. Cells were then plated on plates containing M9-DOG and incubated at 37°C for 48 hours. Single colonies formed on MM-DOG were streaked on LB plates containing 0.2% glucose and incubated for 24 hours at 37°C.

Ожидалось, что для вставок в локусе galK колонии, которые казались белыми на чашках с агаром MacConkey-галактоза и чувствительными к ампициллину и хлорамфениколу, потеряют донорскую и вспомогательную плазмиду и содержат вставку в локусы galK. Вставки в galK-сайтах идентифицировали с помощью ПЦР на колониях с использованием праймеров 048 и 049, расположенных вне локусов galK. Хромосомную ДНК очищали, локус galK амплифицировали, используя праймеры 048 и 049, и вставленную ДНК проверяли секвенированием (Eurofins Genomics, Германия). Штаммы МАР1365, МАР1366, МАР1367, МАР1368 и МАР1370 были сконструированы с использованием донорских плазмид рМАР689, рМАР690, рМАР691, рМАР693 и рМАР695, в результате чего были вставлены pglpABC, pglpD, pglpTQ or pglpFKX или plac, слитые с lacZ, соответственно, в локус galK в E.coli MDO.For insertions at the galK locus, colonies that appeared white on MacConkey-galactose agar plates and were sensitive to ampicillin and chloramphenicol were expected to lose the donor and helper plasmid and contain the insertion at the galK loci. Insertions at galK sites were identified by colony PCR using primers 048 and 049 located outside the galK loci. Chromosomal DNA was purified, the galK locus was amplified using primers 048 and 049, and the inserted DNA was verified by sequencing (Eurofins Genomics, Germany). Strains MAP1365, MAP1366, MAP1367, MAP1368 and MAP1370 were constructed using the donor plasmids pMAP689, pMAP690, pMAP691, pMAP693 and pMAP695, resulting in the insertion of pglpABC, pglpD, pglpTQ or pglpFKX or plac fused with lacZ, respectively, into the galK locus in E. coli MDO.

Штаммы МАР1025, МАР1026, МАР1027 и МАР808 были сконструированы с использованием донорских плазмид рМАР431, рМАР432, рМАР433 и рМАР205, соответственно, что дало вставки PglpA, PglpD, PglpT и PglpF, где 16 пар оснований выше сайта начала трансляции были изменены на 5'-CAAGGAGGAAACAGCT-3' (SEQ ID NO: 10), слитые с lacZ и вставленные в локус galK E.coli MDO.Strains MAP1025, MAP1026, MAP1027, and MAP808 were constructed using the donor plasmids pMAP431, pMAP432, pMAP433, and pMAP205, respectively, resulting in the insertions PglpA, PglpD, PglpT, and PglpF, where the 16 bp upstream of the translation start site was changed to 5'-CAAGGA GGAAACAGCT -3' (SEQ ID NO: 10) fused to lacZ and inserted into the galK locus of E. coli MDO.

Штаммы MAPI176 к MAPI185 были сконструированы с использованием донорских плазмид рМАР486-рМАР495, соответственно, в результате получая вставки PglpF_SDl, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, PglpF_SD9 and PglpF_SD10, слитые с lacZ и вставленные в локусы galK E.coli MDO. Модификации, внесенные в последовательность ШайнаДальгарно экспрессионного элемента PglpF, показаны на фиг. 6А и перечислены в табл. 1.Strains MAPI176 to MAPI185 were constructed using donor plasmids pMAP486-pMAP495, respectively, resulting in inserts PglpF_SDl, PglpF_SD2, PglpF_SD3, PglpF_SD4, PglpF_SD5, PglpF_SD6, PglpF_SD7, PglpF_SD8, P glpF_SD9 and PglpF_SD10 fused to lacZ and inserted into the galK E loci. coli MDO. Modifications made to the ShineDalgarno sequence of the PglpF expression element are shown in FIG. 6A and are listed in table. 1.

Штаммы МАР1010-9, МАР1010-11, МАР1010-13, МАР1010-17, МАР1010-19 и MAP1010-20 были сконструированы с использованием плазмидного препарата, созданного с использованием вырожденного праймера. Модифицированный экспрессирующий элемент PglpF, слитый с lacZ, идентифицировали секвенированием и слитые промотор-lacZ вставляли в локус galK E.coli MDO. Модификации, внесенные в область -10 экспрессионного элемента PglpF, показаны на фиг. 7А и перечислены в табл. 1.Strains MAP1010-9, MAP1010-11, MAP1010-13, MAP1010-17, MAP1010-19, and MAP1010-20 were constructed using a plasmid preparation created using a degenerate primer. A modified PglpF expression element fused to lacZ was identified by sequencing and the promoter-lacZ fusion was inserted into the galK locus of E. coli MDO. Modifications made to the -10 region of the PglpF expression element are shown in FIG. 7A and are listed in table. 1.

Штаммы МАР1210, МАР1211, МАР1086 и МАР1209 были сконструированы с использованием донорских плазмид рМАР457, рМАР462, рМАР463 и рМАР537, что давало вставку экспрессирующего элемента PglpF с удаленными 25, 150, 175 или 190 парами оснований на 5'-конце. Укороченные версии экспрессирующих элементов PglpF были слиты с lacZ и вставлены в локусы galK E.coli MDO. Модификации экспрессионных элементов PglpF перечислены в табл. 1.Strains MAP1210, MAP1211, MAP1086, and MAP1209 were constructed using donor plasmids pMAP457, pMAP462, pMAP463, and pMAP537, which resulted in the insertion of a PglpF expression element with 25, 150, 175, or 190 bp removed from the 5′ end. Truncated versions of PglpF expression elements were fused to lacZ and inserted into the galK loci of E. coli MDO. Modifications of PglpF expression elements are listed in Table. 1.

Штамм MAP1356 был сконструирован путем двойной рекомбинации, как описано Sharan et al. (2009), Nat. Protoc., 4 (29:206-223). Ген glpR в МАР808 был заменен геном, устойчивым к канамицину, что давало MAP1356.Strain MAP1356 was constructed by double recombination as described by Sharan et al. (2009), Nat. Protoc., 4 (29:206-223). The glpR gene in MAP808 was replaced by a kanamycin resistance gene, resulting in MAP1356.

МАР700 и МАР710: штаммы были сконструированы с использованием хелперной плазмиды и донорской плазмиды, содержащей кассеты nst (на основе PglpF- или Plac-), что давало штаммы E.coli MDO, экспрессирующие N st-гликозилтрансферазу.MAP700 and MAP710: strains were constructed using a helper plasmid and a donor plasmid containing nst cassettes (based on PglpF- or Plac-), resulting in E. coli MDO strains expressing N st -glycosyltransferase.

МАР219 и МАР986: штаммы были сконструированы с использованием хелперной плазмиды и донорской плазмиды, содержащей кассеты Pd2 (на основе PglpF- или Plac-), что давало штаммы E.coli MDO, экспрессирующие фермент Pd2.MAP219 and MAP986: strains were constructed using a helper plasmid and a donor plasmid containing Pd2 cassettes (based on PglpF- or Plac-), resulting in E. coli MDO strains expressing the Pd2 enzyme.

MDO1 и MDO15: химически компетентные Escherichia coli K-12 (DH1) MDO трансформировали 2 плазмидами (табл. 10) для получения LNnT и LNT соответственно. МР1497 - МР1499: Escherichia coli K-12 (DH1) MDO трансформировали хелперной плазмидой pACBSR и донорскими плазмидами, содержащими представляющие интерес генные кассеты (PglpF-lgtA or PglpF-galT), чтобы интегрировать данную гликозилтрансферазу в геном. Полученные в результате хозяева были впоследствии трансформированы соответствующей плазмидой, несущей маркер антибиотика (табл. 10).MDO1 and MDO15: Chemically competent Escherichia coli K-12 (DH1) MDO was transformed with 2 plasmids (Table 10) to produce LNnT and LNT, respectively. MP1497 - MP1499: Escherichia coli K-12 (DH1) MDO was transformed with the helper plasmid pACBSR and donor plasmids containing gene cassettes of interest (PglpF-lgtA or PglpF-galT) to integrate this glycosyltransferase into the genome. The resulting hosts were subsequently transformed with the appropriate plasmid carrying the antibiotic marker (Table 10).

МР166, МР245, МР1825, МР1920, МР2239, МР2374, МР2525: Escherichia coli K-12 (DH1) MDO последовательно трансформировали хелперной плазмидой pACBSR и донорскими плазмидами, содержащими представляющие интерес генные кассеты, чтобы обеспечить интеграцию соответствующих модификаций в его геном в экспериментах с использованием метода наполнения генов (табл. 10).MP166, MP245, MP1825, MP1920, MP2239, MP2374, MP2525: Escherichia coli K-12 (DH1) MDO was sequentially transformed with the helper plasmid pACBSR and donor plasmids containing gene cassettes of interest to ensure integration of the corresponding modifications into its genome in experiments using gene filling method (Table 10).

МАР265 и МАР425: Escherichia coli K-12 (DH1) MDO трансформировали хелперной плазмидой pACBSR и донорскими плазмидами, содержащими представляющие интерес генные кассеты, чтобыMAP265 and MAP425: Escherichia coli K-12 (DH1) MDO was transformed with the helper plasmid pACBSR and donor plasmids containing gene cassettes of interest to

- 56 044676 обеспечить возможность введения желаемых вставок в геноме хозяина методом наполнения генов. Ген nadC был удален путем встраивания galK в локусы nadC, а также методом наполнения генов. Наконец, штаммы трансформировали плазмидой pMAP101 для создания штаммов МАР265 и МАР425.- 56 044676 provide the possibility of introducing the desired inserts into the host genome by gene filling. The nadC gene was deleted by inserting galK into the nadC loci and by gene filling. Finally, the strains were transformed with plasmid pMAP101 to create strains MAP265 and MAP425.

MAP1200 и MAP1214: Escherichia coli K-12 (DH1) MDO трансформировали хелперной плазмидой pACBSR и донорскими плазмидами, содержащими представляющие интерес генные кассеты, чтобы обеспечить возможность введения желаемых вставок в геном хозяина методом наполнения генов (Herring, CD., Glasner, J.D., Blattner, F.R. (2003), Gene (311), 153-163) (табл. 10). Все вставки были проверены секвенированием (Eurofins Genomics, Германия).MAP1200 and MAP1214: Escherichia coli K-12 (DH1) MDO was transformed with the helper plasmid pACBSR and donor plasmids containing gene cassettes of interest to allow the desired insertions to be introduced into the host genome by gene filling (Herring, CD., Glasner, J.D., Blattner , F.R. (2003), Gene (311), 153-163) (Table 10). All inserts were verified by sequencing (Eurofins Genomics, Germany).

Ферментативный анализ: lacZ.Enzymatic assay: lacZ.

Активность β-галактозидазы оценивали, как описано ранее (см., например, Miller J.H. Experiments in molecular genetics, Cold spring Harbor Laboratory Press, NY, 1972). Кратко клетки разводили в Z-буфере и пермеабилизировали додецилсульфатом натрия (0,1%) и хлороформом. Анализы проводили при 30°С. Образцы предварительно нагревали, анализ инициировали добавлением 200 мкл орто-нитрофенил-βгалактозидазы (4 мг/мл) и останавливали добавлением 500 мкл 1 М Na2CO3, когда образец становился слегка желтым. Выход орто-нитрофенола впоследствии определяли как изменение оптической плотности при 420 нм. Удельная активность указана в единицах Миллера [А420/(мин-мл-А600)]. Активности, перечисленные в табл. 7, представляют собой средние значения по меньшей мере из двух независимых экспериментов.β-Galactosidase activity was assessed as described previously (see, for example, Miller JH Experiments in molecular genetics, Cold spring Harbor Laboratory Press, NY, 1972). Briefly, cells were diluted in Z-buffer and permeabilized with sodium dodecyl sulfate (0.1%) and chloroform. Analyzes were performed at 30°C. Samples were prewarmed, the assay was initiated by adding 200 μl of ortho-nitrophenyl-β-galactosidase (4 mg/ml) and stopped by adding 500 μl of 1 M Na 2 CO 3 when the sample became slightly yellow. The ortho-nitrophenol yield was subsequently determined as the change in absorbance at 420 nm. Specific activity is indicated in Miller units [A420/(min-ml-A600)]. Activities listed in table. 7 are averages from at least two independent experiments.

Ферментативный анализ: экспрессия гетерологичных генов Pd2 и Δ29nst.Enzymatic analysis: expression of heterologous genes Pd2 and Δ29nst.

Штаммы МАР219, МАР986, МАР700 и МАР710 предварительно культивировали в 1 мл базальной среды (см. выше) с добавлением MgSOzj, тиамина и глюкозы, при 34°С в течение 24 ч. 0,5 мл предварительной культуры инокулировали в 50 мл минимальной базальной среды с добавлением MgSO4, тиамина и 0,5% глицерина, и инкубировали при встряхивании при 28°С в течение 24 ч. 10 мл клеточных культур собирали в 50 мл центрифужные пробирки при 8000xg, при -10°С в течение 15 мин. Супернатант удаляли, а осадок клеток хранили при -80°С до использования.Strains MAP219, MAP986, MAP700 and MAP710 were pre-cultured in 1 ml of basal medium (see above) supplemented with MgSOzj, thiamine and glucose at 34°C for 24 hours. 0.5 ml of the pre-culture was inoculated into 50 ml of minimal basal medium with the addition of MgSO 4 , thiamine and 0.5% glycerol, and incubated with shaking at 28°C for 24 hours. 10 ml of cell cultures were collected in 50 ml centrifuge tubes at 8000xg, at -10°C for 15 minutes. The supernatant was removed and the cell pellet was stored at -80°C until use.

Клеточные осадки ресуспендировали в 1 мл физиологически подобной среде 1-Х (125 мМ KCl, 25 мМ K3PO4, 10 мМ глутамата натрия, 0,001 мМ CaCl2, 5 мМ MgSO4, pH 7,5), содержащий 1х BugBuster (Merk Milipore). Образцы клеток лизировали ультразвуком 4 раза по 20 с при амплитуде 30%. Нерастворимый клеточный дебрис удаляли центрифугированием при 10000xg в течение 10 мин при -10°С. В анализе in vitro 5 мМ CMP-SA использовали в качестве донора, а 10 мМ лактозу использовали в качестве акцептора. Донор, акцептор и лизат смешивали, а образцы отбирали по истечении 0, 5, 10, 20 и 30 мин реакции. Образцы кипятили в течение 10 мин и супернатант анализировали на 3'SL и 6'SL. Активность ферментов измеряли в мМ продукции 6'SL или 3'SL в час и корректировали на OD клеток, и вставка генетических кассет была сделана с помощью наполнения геннов, как описано ниже, но могла быть осуществлена любым другим методом с использованием гомологичной рекомбинации ДНК.Cell pellets were resuspended in 1 ml physiologically similar 1-X medium (125 mM KCl, 25 mM K3PO4 , 10 mM MSG, 0.001 mM CaCl2 , 5 mM MgSO4 , pH 7.5) containing 1x BugBuster (Merk Milipore). Cell samples were lysed by ultrasound 4 times for 20 s at an amplitude of 30%. Insoluble cell debris was removed by centrifugation at 10,000xg for 10 min at -10°C. In the in vitro assay, 5 mM CMP-SA was used as the donor and 10 mM lactose was used as the acceptor. The donor, acceptor, and lysate were mixed, and samples were taken after 0, 5, 10, 20, and 30 min of reaction. Samples were boiled for 10 min and the supernatant was analyzed for 3′SL and 6′SL. Enzyme activity was measured in mM 6'SL or 3'SL production per hour and corrected for cell OD, and insertion of genetic cassettes was done by gene filling as described below, but could be done by any other method using homologous DNA recombination.

Анализ в планшетах с глубокими лунками.Analysis in deep well plates.

Одну колонию из планшета с LB предварительно культивировали в 1 мл минимальной базальной среды, содержащей глюкозу (0,5%), в 10 мл в 24-луночном планшете с глубокими лунками (Deep well plate, Axygen). Планшет герметизировали перед культивированием с помощью Hydrophobic Gas Permeable Adhesive Seal (Axygen) и инкубировали в течение 24 ч при 34°С со встряхиванием при 700 об/мин в орбитальном шейкере (Edmund Biihler GmbH). Плотность клеток культуры контролировали при 600 нм с использованием спектрофотометра S-20 (Воесо, Германия). 40 мкл ночной культуры использовали для инокуляции в 2 мл минимальной базальной среды, содержащей 0,01% глюкозы, 0,5% лактозы и 200 мкг SUH (Sigma). IPTG добавляли при необходимоасти. Глубоколуночные планшеты покрывали герметизирующей фольгой и инкубировали в течение 48 или 72 ч при 28°С в орбитальном шейкере при 700 об/мин. После инкубации измеряли OD600 и планшет покрывали герметизирующей лентой для нагревания (Saveen Werner) и инкубировали в термомиксере в течение 1 часа при 100°С со встряхиванием при 400 об/мин. Клеточный лизат осаждали центрифугированием в течение 10 мин при 4000 об/мин. Концентрацию НМО в супернатанте определяли методами HPLC или HPAC.One colony from an LB plate was precultured in 1 ml of minimal basal medium containing glucose (0.5%) in 10 ml of a 24-well deep well plate (Deep well plate, Axygen). The plate was sealed before culture with Hydrophobic Gas Permeable Adhesive Seal (Axygen) and incubated for 24 h at 34°C with shaking at 700 rpm in an orbital shaker (Edmund Biihler GmbH). The cell density of the culture was monitored at 600 nm using an S-20 spectrophotometer (Boeso, Germany). 40 μl of the overnight culture was used for inoculation into 2 ml of minimal basal medium containing 0.01% glucose, 0.5% lactose, and 200 μg SUH (Sigma). IPTG was added as needed. Deep well plates were covered with sealing foil and incubated for 48 or 72 hours at 28°C in an orbital shaker at 700 rpm. After incubation, OD600 was measured and the plate was covered with heat sealing tape (Saveen Werner) and incubated in a thermomixer for 1 hour at 100°C with shaking at 400 rpm. The cell lysate was pelleted by centrifugation for 10 min at 4000 rpm. The concentration of HMO in the supernatant was determined by HPLC or HPAC methods.

Пример 1. Клонирование 17 случайно выбранных регуляторных элементов, выделенных из Е.coli.Example 1: Cloning of 17 randomly selected regulatory elements isolated from E. coli.

Для идентификации однокопийных экспрессионных кассет, эффективных для экспрессии в штамме-хозяине Е.coli с хромосомной ДНК Е.coli K-12 DH1, амплифицировали семнадцать фрагментов ДНК, содержащих промоторные элементы. Все промоторные элементы содержали сайты связывания регуляторов транскрипции, а также сайт связывания РНК-полимеразы (области -35, -10), сайты инициации транскрипции и 5'-концевую нетранслируемую последовательность, расположенную в 16 парах оснований выше кодона инициации трансляции. 16-нуклеотидную ДНК-последовательность (5 - CAAGGAGGAAACAGCT-3 ) (SEQ id NO: 10), охватывающую сайт связывания рибосомы (включая сайт Шайна-Дальгарно), была введена на 3'-конце во все фрагменты ДНК с использованием специфичных для последовательности олигонуклеотидов. Названия промоторов, длины фрагментов промоторов и олигонуклеотиды, использованные для амплификации и введения SEQ ID NO: 10, перечислены в табл. 11 ниже.To identify single-copy expression cassettes effective for expression in an E. coli host strain with E. coli K-12 DH1 chromosomal DNA, seventeen DNA fragments containing promoter elements were amplified. All promoter elements contained binding sites for transcription regulators, as well as an RNA polymerase binding site (regions -35, -10), transcription initiation sites, and a 5'-terminal untranslated sequence located 16 base pairs upstream of the translation initiation codon. A 16-nucleotide DNA sequence (5 - CAAGGAGGAAACAGCT-3) (SEQ id NO: 10) spanning the ribosome binding site (including the Shine-Dalgarno site) was introduced at the 3' end of all DNA fragments using sequence-specific oligonucleotides . The promoter names, promoter fragment lengths, and oligonucleotides used for amplification and insertion of SEQ ID NO: 10 are listed in Table. 11 below.

- 57 044676- 57 044676

Таблица 11Table 11

Промото рный элемент Promoter element Длина фрагмен та (п.о.), амплиф ицируе мото с DH1 Fragment length (bp), amplified moto s DH1 Название олигонукл еотида Name oligonucleotide eotide Последовательность олигонуклеотида Oligonucleotide sequence SEQ ID NO SEQ ID NO 0350 0350 ATGCGCAAAUCGGATCTCAAGGAA ATCGCAATGG ATGCGCAAAUCGGATCTCAAGGAA ATCGCAATGG SEQ NO:60 SEQ NO:60 ID ID РаспВ RaspV 334 334 0351 0351 AGCTGTTUCCTCCTTGCTCATTGTC ATAGTGCGGCAGG AGCTGTTUCCTCCTTGCTCATTGTC ATAGTGCGGGCAGG SEQ N0:61 SEQ N0:61 ID ID 0354 0354 ATGCGCAAAUGCTGAATCCGAACA CCAGCGTC ATGCGCAAAUGCTGAATCCGAACA CCAGCGTC SEQ NO:62 SEQ NO:62 ID ID Pactp Pactp 134 134 0355 0355 AGCTGTTUCCTCCTTGGCAGGACTT CATTATTAAGACGG AGCTGTTUCCTCCTTGGCAGGACTT CATTATTAAGACGG SEQ NO:63 SEQ NO:63 ID ID 0358 0358 ATGCGCAAAUTACTCACTACTGAA ACAATATTGCC ATGCGCAAAUTACTCACTACTGAA ACAATATTGCC SEQ NO:64 SEQ NO:64 ID ID PdcuB PdcuB 584 584 0359 0359 AGCTGTTUCCTCCTTGTAATCCTAT TTAAATTTTTGCTGAATAG AGCTGTTUCCTCCTTGTAATCCTAT TTAAATTTTTGCTGAATAG SEQ NO:65 SEQ NO:65 ID ID Pdps Pdps 182 182 0274 0274 ATGCGCAAAUCCGAAAATTCCTGG CGAGCAG ATGCGCAAAUCCGAAAATTCCTGG CGAGCAG SEQ NO:66 SEQ NO:66 ID ID 0275 0275 AGCTGTTUCCTCCTTGGATGTTATG TCCCAGTAATTAAC AGCTGTTUCCTCCTTGGATGTTATG TCCCAGTAATTAAC SEQ NO:67 SEQ NO:67 ID ID 0360 0360 ATGCGCAAAUGAAGTAATCTTTCT TCACCTGCGTTC ATGCGCAAAUGAAGTAATCTTTCT TCACCTGCGTTC SEQ NO:68 SEQ NO:68 ID ID PgalP PgalP 414 414 0361 0361 AGCTGTTUCCTCCTTGGTTATTTTT TATTGTGAATTAAGATAGG AGCTGTTUCCTCCTTGGTTATTTTT TATTGTGAATTAAGATAGG SEQ NO:69 SEQ NO:69 ID ID 0265 0265 ATGCGCAAAUCAGTTCTTCTGCCG AAGGTT ATGCGCAAAUCAGTTCTTCTGCCG AAGGTT SEQ NO:70 SEQ NO:70 ID ID PgapA PgapA 355 355 0266 0266 AGCTGTTUCCTCCTTGTTGTTAGTG AATAAAAGGTTGCC AGCTGTTUCCTCCTTGTTGTTAGTG AATAAAAGGTTGCC SEQ N0:71 SEQ N0:71 ID ID 0378 0378 ATGCGCAAAUGAAAACATTCATAA ATTAAATGTG ATGCGCAAAUGAAAACATTCATAA ATTAAATGTG SEQ NO:72 SEQ NO:72 ID ID PglpA PglpA 166 166 0379 0379 AGCTGTTUCCTCCTTGTTCGTTTTTT ACCATTTAGCCATAG AGCTGTTUCCTCCTTGTTCGTTTTTT ACCATTTAGCCATAG SEQ NO:73 SEQ NO:73 ID ID 0376 0376 ATGCGCAAAUGCGTCTCTCTTTCTT ТАСАААС ATGCGCAAAUGCGTCTCTCTTTCTT TASAAAAS SEQ NO:74 SEQ NO:74 ID ID PglpD PglpD 173 173 0377 0377 AGCTGTTUCCTCCTTGTTCGTTAAA GCTCATAAATGTTCG AGCTGTTUCCTCCTTTGTTCGTTAAA GCTCATAAATGTTCG SEQ NO:75 SEQ NO:75 ID ID 0261 0261 ATGCGCAAAUGCGGCACGCCTTGC AGATTACG ATGCGCAAAUGCGGCACGCCTTGC AGATTACG SEQ NO:76 SEQ NO:76 ID ID PglpF PglpF 284 284 0262 0262 AGCTGTTUCCTCCTTGGTTAATGTT TGTTGTATGCG AGCTGTTUCCTCCTTGGTTAATGTT TGTTGTATGCG SEQ NO:77 SEQ NO:77 ID ID

- 58 044676- 58 044676

PglpT PglpT 229 229 0380 0380 ATGCGCAAAUCCATTTAGCCATAG TAAAAACATG ATGCGCAAAUCCATTTAGCCATAG TAAAACATG SEQ NO:78 SEQ NO:78 ID ID 0381 0381 AGCTGTTUCCTCCTTGCCGTGGTCT TATTTATGATTAAC AGCTGTTUCCTCCTTGCCGTGGTCT TATTTATTGATTAAC SEQ NO:79 SEQ NO:79 ID ID ATGCGCAAAUGCGCGGGTTCCGTG ATGCGCAAAUGCGCGGGGTTCCGTG SEQ SEQ ID ID 0270 0270 CGTGGG CGTGGG NO:80 NO:80 AGCTGTTUCCTCCTTGATTTATTAC AGCTGTTUCCTCCTTGATTTATTAC SEQ SEQ ID ID PkatE PkatE 254 254 0271 0271 TGAAAGGGCCGC TGAAAGGGGCCGC NO:81 NO:81 ATGCGCAAAUGTGATCACAAATTT ATGCGCAAAUGTGATCAAAATTT SEQ SEQ ID ID 0272 0272 TAAACAG TAAACAG NO:82 NO:82 AGCTGTTUCCTCCTTGACAGTGTTA AGCTGTTUCCTCCTTGACAGTGTTA SEQ SEQ ID ID PkatG PkatG 254 254 0273 0273 CCGTTACGATAC CCGTTACGATAC NO:83 NO:83 ATGCGCAAAUTGTGAGTTAGCTCA ATGCGCAAAUTGTGAGTTAGCTCA SEQ SEQ ID ID 068 068 CTCATTAG CTCATTAG NO:84 NO:84 AGCTGTTUCCTCCTTGAAATTGTTA AGCTGTTUCCTCCTTGAAATTGTTA SEQ SEQ ID ID Plac Plac 91 91 0268 0268 TCCGCTCACAA TCCGCTCACAA NO:85 NO:85 ATGCGCAAAUGAATGCTCTCAGGT ATGCGCAAAUGAATGCCTCAGGT SEQ SEQ ID ID 0257 0257 GAGGG GAGGG NO:86 NO:86 AGCTGTTUCCTCCTTGTTTCGCGCT AGCTGTTUCCTCCTTGTTTCGCGCT SEQ SEQ ID ID Pmlc Pmlc 134 134 0258 0258 CCGAAATAATC CCGAAATAATC NO:87 NO:87 ATGCGCAAAUCCGAAATCGCTGAA ATGCGCAAAUCCGAAATCGCTGAA SEQ SEQ ID ID 0366 0366 GGTTACGTAC GGTTACGTAC NO:88 NO:88 AGCTGTTUCCTCCTTGAATGTGATA AGCTGTTUCCTCCTTGAATGTGATA SEQ SEQ ID ID PpoxB PpoxB 184 184 0367 0367 ACGGTAACAAGTTTAG ACGGTAACAAGTTTAG NO:89 NO:89 ATGCGCAAAUGGCTGTGTTGAAAG ATGCGCAAAUGGCTGTGTTGAAAG SEQ SEQ ID ID 0255 0255 GTGTTG GTGTTG NO:90 NO:90 AGCTGTTUCCTCCTTGAGTATGGGT AGCTGTTUCCTCCTTGAGTATGGGT SEQ SEQ ID ID PptsG pptsG 384 384 0256 0256 GCTTTTTTTACG GCTTTTTTTACG NO:91 NO:91 ATGCGCAAAUGAATTGCAACAGTA ATGCGCAAAUGAATTGCAACAGTA SEQ SEQ ID ID 0259 0259 ATGCCAG ATGCCAG NO:92 NO:92 AGCTGTTUCCTCCTTGATAGGTTTA AGCTGTTUCCTCCTTGATAGGTTTA SEQ SEQ ID ID PptsH PptsH 382 382 0260 0260 GTGTTGTGGAAC GTGTTGTGGAAC NO:93 NO:93

Из клонированных семнадцати фрагментов ДНК (17-промоторов), все они были идентичны на 3'конце (SEQ ID NO: 10), все были слиты с лишенным промотора геном lacZ, связанным с последовательностью терминатора транскрипции, Т1. Единственная копия экспрессионной кассеты PromoterSEQ ID NO:10-lacZ-T1, была интегрирована в хромосомную ДНК. Активность экспрессии гена lacZ, введенного в единственном экземпляре, измеряли как активность β-галактозидазы. Активность lacпромотора измеряли в присутствии IPTG. Результаты экспрессии репортерного гена из конструкций показаны на фиг. 1А. Примечательно, что не все протестированные промоторы продемонстрировали увеличение активности после замены нативного 16-нуклеотидного фрагмента выше кодона инициации трансляции, содержащего сайт связывания рибосомы (RBS) для SEQ ID NO: 10. Замечательная активность наблюдалась для промотора glpF, активность для промоторов glpA и D была также значительной, но активность большинства протестированных промоторов либо не изменялась вообще, либо не увеличивалась в значительной степени (что можно было ожидать в соответствии с Meynial-Salles I. et al. (2005), Appl. Eviron. Mcrobiol., 71:2140-2144; и WO 03/08960). Ha фиг. 1B представлены данные об экспрессии репортерного гена из конструкций, включающих три репрезентативных промотора из фиг. 1А (PglpF, PglpA и PglpT) и любую нативную 16-нуклеотидную последовательность, полученную из 5'UTR ДНК выше соответствующего гена (т.е. glpF, glpA и glpT), или SEQ ID NO: 10.Of the seventeen DNA fragments cloned (17 promoters), all identical at the 3' end (SEQ ID NO: 10), all were fused to the promoterless lacZ gene linked to a transcription terminator sequence, T1. A single copy of the PromoterSEQ ID NO:10-lacZ-T1 expression cassette was integrated into chromosomal DNA. The expression activity of the lacZ gene introduced in a single copy was measured as β-galactosidase activity. lac promoter activity was measured in the presence of IPTG. The results of reporter gene expression from the constructs are shown in FIG. 1A. Notably, not all promoters tested showed an increase in activity upon replacement of the native 16 nucleotide fragment upstream of the translation initiation codon containing the ribosome binding site (RBS) for SEQ ID NO: 10. Remarkable activity was observed for the glpF promoter, activity for the glpA and D promoters was also significant, but the activity of most promoters tested either did not change at all or did not increase significantly (as would be expected according to Meynial-Salles I. et al. (2005), Appl. Eviron. Mcrobiol., 71:2140- 2144; and WO 03/08960). FIG. 1B shows reporter gene expression data from constructs comprising three representative promoters from FIG. 1A (PglpF, PglpA and PglpT) and any native 16 nucleotide sequence derived from the 5'UTR of DNA upstream of the corresponding gene (i.e. glpF, glpA and glpT), or SEQ ID NO: 10.

На фиг. 2 показано сравнение уровней экспрессии репортерного гена с промоторной последовательности, выделенной из оперонов glp: glpFKX, glpABC, glpTQ и glpD. Все промоторы негативно регулируются репрессором GlpR. Все клонированные фрагменты ДНК содержали сайты связывания ДНК дляIn fig. Figure 2 shows a comparison of reporter gene expression levels with promoter sequences isolated from the glp operons: glpFKX, glpABC, glpTQ and glpD. All promoters are negatively regulated by the GlpR repressor. All cloned DNA fragments contained DNA binding sites for

- 59 044676 cAMP-CRP плюс ряд сайтов связывания других регуляторных элементов, таких как один или несколько сайтов связывания репрессора GlpR. Схематический вид клонированных промоторных элементов показан на фиг. 2 и 3. Клонирование проводили, как описано выше.- 59 044676 cAMP-CRP plus a number of binding sites for other regulatory elements, such as one or more GlpR repressor binding sites. A schematic view of the cloned promoter elements is shown in FIG. 2 and 3. Cloning was performed as described above.

Пример 2. Уровень экспрессии с единственной копии слитых конструкций Pglp-lacZ.Example 2. Expression level from a single copy of Pglp-lacZ fusion constructs.

Плазмиду для изучения промоторов, содержащую ген lacZ без промотора, использовали в качестве системы клонирования для идентификации промоторных элементов Е.coli, которые могли бы поддерживать высокую и регулируемую экспрессию белка. Уровни экспрессии lacZ определяли как с единственной копии Pglp-lacZ, интегрированной в хромосомную ДНК, так и с плазмиды с большим количеством копий (как описано в примере 11). Делеция ΔlacZM15 в гене lacZ в Е.coli MDO не может продуцировать активный фермент β-галактозидазу и поэтому использовалась в качестве фонового штамма при скрининге. В качестве положительного эталона для экспрессии lacZ был использован промоторный элемент Plac. Промоторные элементы, происходящие из оперонов glp, glpTQ, glpACB, glpD и glpFKX, или Plac были слиты с лишенным промотора геном lacZ и вставлены в геном Escherichia coli с помощью сайтспецифической рекомбинации, что привело к получению штаммов МАР1367, МАР1365, МАР1366, MAP 1368 и MAP 1370 соответственно. Все выделенные промоторные фрагменты ДНК, pglpTQ, pglpACB, pglpD, pglpFKX и plac, слитые с lacZ, могут экспрессировать фермент β-галактозидазу, и активность фермента была измерена, как показано на фиг. 4. Следует обратить внимание, что активность промотора Plac была измерена в присутствии IPTG.A promoter plasmid containing the lacZ gene without a promoter was used as a cloning system to identify E. coli promoter elements that could support high and regulated protein expression. Levels of lacZ expression were determined from both a single copy of Pglp-lacZ integrated into chromosomal DNA and from a high copy number plasmid (as described in Example 11). The ΔlacZM15 deletion in the lacZ gene in E. coli MDO fails to produce active β-galactosidase enzyme and was therefore used as a background strain in the screen. The Plac promoter element was used as a positive reference for lacZ expression. Promoter elements derived from the glp, glpTQ, glpACB, glpD and glpFKX, or Plac operons were fused to the promoterless lacZ gene and inserted into the Escherichia coli genome by site-specific recombination, resulting in strains MAP1367, MAP1365, MAP1366, MAP 1368 and MAP 1370 respectively. All isolated promoter DNA fragments, pglpTQ, pglpACB, pglpD, pglpFKX and plac fused to lacZ, can express β-galactosidase enzyme, and enzyme activity was measured as shown in FIG. 4. It should be noted that Plac promoter activity was measured in the presence of IPTG.

В другой серии экспериментов нуклеотидная последовательность из 16 пар оснований, расположенная перед сайтами начала трансляции в генах glpF, glpA, glpD, glpT и lacZ, включенных в экспрессионные кассеты, содержащие pglpFKX, pglpACB, pglpD и pglpTQ, была заменена последовательностью 5’-CAAGGAGGAAACAGCT-3’ (seq id no: 10), что дало штаммы МАР808, MAP1025, MAP1026 и MAP1027 соответственно. Модификация 16 пар оснований перед сайтом начала трансляции в конструкциях, содержащих промоторные элементы PglpF, PglpA и PglpT и оригинальный ДНК-фрагмент 5'UTR соответствующего гена glp, увеличивала экспрессию фермента β-галактозидазы приблизительно в 10000 раз для PglpF, в 2 раза для PglpA и PglpT (фиг. 4). Неожиданно, но дополнительная замена исходной 54-нуклеотидной ДНК-последовательности 5'UTR, расположенной ниже точки инициации транскрипции в конструкциях PglpA и PglpT на SEQ ID NO: 36 из 5'UTR ДНК гена glpF (полученные конструкции ДНК PglpA_70UTR (SEQ ID NO: 50) и PglpT 70UTR (SEQ ID NO: 51)), давала значительное увеличение экспрессии репортерного гена с этих конструкций (фиг. 4), демонстрируя неожиданный синергетический эффект последовательности 70UTR на экспрессию гена.In another set of experiments, a 16-bp nucleotide sequence located upstream of the translation start sites in the glpF, glpA, glpD, glpT, and lacZ genes included in expression cassettes containing pglpFKX, pglpACB, pglpD, and pglpTQ was replaced by the sequence 5'-CAAGGAGGAAACAGCT- 3' (seq id no: 10), resulting in strains MAP808, MAP1025, MAP1026 and MAP1027, respectively. Modification of 16 base pairs upstream of the translation start site in constructs containing the PglpF, PglpA and PglpT promoter elements and the original 5'UTR DNA fragment of the corresponding glp gene increased the expression of the β-galactosidase enzyme approximately 10,000-fold for PglpF, 2-fold for PglpA and PglpT (Fig. 4). Surprisingly, an additional replacement of the original 54 nucleotide 5'UTR DNA sequence located downstream of the transcription start point in the PglpA and PglpT constructs to SEQ ID NO: 36 of the 5'UTR DNA of the glpF gene (resulting PglpA_70UTR DNA constructs (SEQ ID NO: 50 ) and PglpT 70UTR (SEQ ID NO: 51)), gave a significant increase in reporter gene expression from these constructs (Fig. 4), demonstrating the unexpected synergistic effect of the 70UTR sequence on gene expression.

Таблица 12Table 12

Праймеры, используемые для конструирования PglpA_70UTR и PglpT_70UTRPrimers used to construct PglpA_70UTR and PglpT_70UTR

PglpA_ 70UTR PglpA_ 70UTR 037 8 037 8 ATGCGCAAAUGAAAACATTCATAAATTAAATGTG ATGCGCAAAUGAAAACATTCATAAATTAAATGTG SEQ ID NO:94 SEQ ID NO:94 081 2 081 2 AGCTGTTUCCTCCTTGGTTAATGTTTGTTGTATGCGT GAAAGTCACGGACCTCCACGATGCTTGTAGGCATCG CGCATATTCGCTCATAATTC AGCTGTTUCCTCCTTGGTTAATGTTTGTTGTATGCGT GAAAGTCACGGACCTCCACGATGCTTGTAGGCATCG CGCATATTCGCTCATAATTC SEQ ID NO:95 SEQ ID NO:95 PglpT. 70UTR PglpT. 70UTR 038 0 038 0 ATGCGCAAAUCCATTTAGCCATAGTAAAAACATG ATGCGCAAAUCCATTTAGCCATAGTAAAAACATG SEQ ID NO:96 SEQ ID NO:96 081 5 081 5 AGCTGTTUCCTCCTTGGTTAATGTTTGTTGTATGCGT GAAAGTCACGGACCTCCACGATGCTTGTAGGCATGC CGCGATGTTAAGAAAAC AGCTGTTUCCTCCTTGGTTAATGTTTGTTGTATGCGT GAAAGTCACGGACCTCCACGATGCTTGTAGGCATGC CGCGATGTTAAGAAAAC SEQ ID NO:97 SEQ ID NO:97

Пример 3. Уровень экспрессии с единственной копии слитых конструкций Pglp-lacZ является катаболически подавленным.Example 3. The level of expression from a single copy of Pglp-lacZ fusion constructs is catabolically suppressed.

Поскольку известно, что экспрессия с промоторов glp является катаболически подавленной, измеряли уровень экспрессии со слитых конструкций Pglp-lacZ, содержащих SEQ ID NO: 10. Штаммы МАР808, МАР1025, МАР1026 и МАР1027 выращивали в присутствии или в отсутствии глюкозы, и определяли активность β-галактозидазы, кодируемой lacZ (табл. 13). Как в LB, так и в минимальной среде, уровень экспрессии значительно снижался в присутствии глюкозы.Since expression from the glp promoters is known to be catabolically repressed, the level of expression from Pglp-lacZ fusion constructs containing SEQ ID NO: 10 was measured. Strains MAP808, MAP1025, MAP1026 and MAP1027 were grown in the presence or absence of glucose, and β- activity was determined. galactosidase encoded by lacZ (Table 13). In both LB and minimal medium, expression levels were significantly reduced in the presence of glucose.

- 60 044676- 60 044676

Таблица 13Table 13

Уровни . экспрессии с единственных копий слитых конструкций Pglp-lacZLevels. expression from single copies of Pglp-lacZ fusion constructs

Штамм Strain Промотор ный элемент Promoter element LB (MU) LB (MU) LBглюкоза (MU) LBglucose (MU) МАР8О8 MAR8O8 PglpF PglpF 8,850±l, 415 8.850±l, 415 279±3 279±3 МАР102 5 MAR102 5 PglpA PglpA 3,732±23 4 3.732±23 4 72±70 72±70 МАР102 6 MAR102 6 PglpD PglpD 3,969±60 3 3.969±60 3 618±223 618±223 МАР102 7 MAR102 7 PglpT PglpT 647±23 647±23 15±15 15±15

Степень подавле НИЯ (разы) Degree of suppression of scientific research (times) ММглицерин MMglycerin ММглюкоза MMglucose Степе нь подав ления (разы ) Degree of suppression (times) 32 32 13,450 ±786 13,450 ±786 3,699±35 3 3.699±35 3 4 4 51 51 5,677±154 5.677±154 1,874±33 2 1.874±33 2 3 3 6 6 4,529±132 4.529±132 1,398±12 1 1.398±12 1 3 3 43 43 1,110±139 1.110±139 290±44 290±44 4 4

Пример 4. Экспрессия с единственной копии PglpF-lacZ регулируется и зависит от источника углерода в носителе.Example 4. Expression from a single copy of PglpF-lacZ is regulated and depends on the carbon source in the carrier.

Чтобы определить, регулируется ли уровень экспрессии с PglpF-lacZ другими источниками углерода, кроме глюкозы, штамм МАР808, который содержит единственную копию слитой конструкции PglpF-lacZ, выращивали в среде LB с глюкозой и без нее, и в минимальной среде с использованием глицерина, сорбита, мальтозы или глюкозы в качестве единственного источника углерода. Высокий уровень экспрессии lacZ наблюдался в среде LB, однако добавление 0,2% глюкозы значительно снижало экспрессию lacZ (в 32 раза) в среде LB (табл. 13, фиг. 5). Высокий уровень экспрессии lacZ в штамме МАР808 наблюдался в минимальной среде, когда глицерин или сорбит использовались в качестве единственного источника углерода, тогда как использование мальтозы или глюкозы в минимальной среде снижало экспрессию lacZ.To determine whether the expression level of PglpF-lacZ is regulated by carbon sources other than glucose, strain MAP808, which contains a single copy of the PglpF-lacZ fusion construct, was grown in LB medium with and without glucose, and in minimal medium using glycerol, sorbitol , maltose or glucose as the sole carbon source. High levels of lacZ expression were observed in LB medium, but the addition of 0.2% glucose significantly reduced lacZ expression (32-fold) in LB medium (Table 13, Fig. 5). High levels of lacZ expression in strain MAP808 were observed in minimal media when glycerol or sorbitol was used as the sole carbon source, whereas the use of maltose or glucose in minimal media reduced lacZ expression.

Пример 5. Уровень экспрессии в конструкциях PglpF и Т может быть значительно изменен при изменении сайта связывания рибосомы, содержащегося в SEQ ID NO: 10.Example 5 The level of expression in the PglpF and T constructs can be significantly changed by changing the ribosome binding site contained in SEQ ID NO: 10.

Эффект модификаций рекомбинантной последовательности (SEQ ID NO: 10), содержащей сайт связывания рибосомы (последовательность Шайна-Дальгарно), в конструкциях, содержащих PglpF и PglpT (SEQ ID NO: 54 и 49), и последовательности 70UTR (SEQ ID NO: 37) на экспрессию генов определяли путем измерения уровня экспрессии репортерного гена (lacZ), экспрессируемого с различных конструкций PglpF и PglpT, содержащих варианты SEQ ID NO: 10, как показано на фиг. 6. Уровень экспрессии lacZ изменялся значительно (снижался на 9-95% или увеличивался на 60%) (фиг. 6).Effect of modifications to the recombinant sequence (SEQ ID NO: 10) containing the ribosome binding site (Shine-Dalgarno sequence) in constructs containing PglpF and PglpT (SEQ ID NO: 54 and 49), and the 70UTR sequence (SEQ ID NO: 37) gene expression was determined by measuring the expression level of a reporter gene (lacZ) expressed from various PglpF and PglpT constructs containing variants of SEQ ID NO: 10, as shown in FIG. 6. The expression level of lacZ changed significantly (decreased by 9-95% or increased by 60%) (Fig. 6).

Пример 6. Уровень экспрессии с PglpF можно изменить, изменив последовательность области -10.Example 6 The expression level of PglpF can be changed by changing the sequence of the -10 region.

Нуклеотидные модификации вводили в область-10: 5'-TAAGT-3' экспрессионного элемента PglpF длиной 310 п.н., что давало штаммы МАР1010-19, МАР1010-20, МАР1010-13, МАР1010-17, МАР1010-11 и МАР1010-9. Уровень экспрессии lacZ измеряли в каждом штамме, и результаты показали, что экспрессия lacZ снижалась на 16-60%, показывая важность области-10 для изменения уровня экспрессии (фиг. 7).Nucleotide modifications were introduced into region-10: 5'-TAAGT-3' of the 310 bp PglpF expression element, resulting in strains MAP1010-19, MAP1010-20, MAP1010-13, MAP1010-17, MAP1010-11 and MAP1010- 9. The expression level of lacZ was measured in each strain, and the results showed that lacZ expression was reduced by 16–60%, showing the importance of region-10 in changing expression levels (Fig. 7).

Пример 7. Фрагмент в 120 п.н., содержащий PglpF, содержит функциональный промотор.Example 7 The 120 bp fragment containing PglpF contains a functional promoter.

Активность PglpF исследовали путем укорачивания его на 15, 140, 165 или 180 пар оснований с 5'-конца, что привело к образованию штаммов MAP1210, МАР1211, MAP1086 и MAP1209 соответственно. Уровень экспрессии lacZ измеряли в каждом штамме, и результаты показали, что экспрессия с PglpF сохраняется, даже если длина последовательности PglpF была уменьшена с 300 пар оснований до 120 пар оснований (фиг. 8).The activity of PglpF was examined by truncation by 15, 140, 165, or 180 bp from the 5' end, resulting in strains MAP1210, MAP1211, MAP1086, and MAP1209, respectively. The expression level of lacZ was measured in each strain, and the results showed that expression with PglpF was maintained even when the PglpF sequence length was reduced from 300 bp to 120 bp (Fig. 8).

Пример 8. Удаление транскрипционного репрессора GlpR увеличивает экспрессию с элемента PglpF.Example 8: Removal of the transcriptional repressor GlpR increases expression from the PglpF element.

Известно, что промотор PglpF негативно регулируется белком-репрессором транскрипции GlpR. PglpF из 300 пар оснований содержит четыре сайта связывания для белка-репрессора GlpR (фиг. 2). Для того, чтобы определить важность репрессора GlpR на транскрипцию с PglpF, ген репрессора glpR был отключен, что давало штамм MAP1356. Уровень экспрессии lacZ измеряли в отсутствие и в присутствии репрессора GlpR, и уровень экспрессии повышался почти на 20% в его отсутствии (фиг. 9).The PglpF promoter is known to be negatively regulated by the transcriptional repressor protein GlpR. The 300-bp PglpF contains four binding sites for the repressor protein GlpR (Fig. 2). To determine the importance of the GlpR repressor on transcription from PglpF, the glpR repressor gene was knocked out, resulting in strain MAP1356. The expression level of lacZ was measured in the absence and presence of the repressor GlpR, and the expression level increased by almost 20% in its absence (Fig. 9).

Пример 9. Экспрессия рекомбинантных генов с использованием экспрессионного элемента PglpF зависит от источника углерода, используемого в питательной среде.Example 9 Expression of recombinant genes using the PglpF expression element depends on the carbon source used in the growth medium.

Выращивание клеток в разных средах оказывает значительное влияние на уровень LacZ, экспрессируемого с PglpF (фиг. 5). Чтобы проверить, могут ли гетерологичные гены экспрессироваться с промоторного элемента PglpF, связанного с последовательностью ДНК 70UTR, и влияет ли на экспрессию исGrowing cells in different media has a significant effect on the level of LacZ expressed with PglpF (Fig. 5). To test whether heterologous genes can be expressed from the PglpF promoter element linked to the 70UTR DNA sequence and whether expression is affected by

- 61 044676 точник углерода, используемый в среде, были сконструированы штаммы МАР710 и МАР986, экспрессирующие транссиалидазу nst или Pd2 с PglpF в единственной копии, соответственно, и культивировались в минимальных средах, содержащих глюкозу или глицерин в качестве источника углерода. Когда глицерин использовали в качестве источника углерода, ферментативная активность была по меньшей мере в 7 раз выше, чем когда клетки выращивались на средах, содержащих глюкозу в качестве источника углерода (фиг. 10), показывая, что рекомбинантные гены можно экспрессировать с использованием PglpF и что эта экспрессия может регулироваться с помощью источник углерода, присутствующего в среде.- 61 044676 carbon source used in the medium, strains MAP710 and MAP986 were constructed expressing nst or Pd2 transsialidase with a single copy of PglpF, respectively, and cultured in minimal media containing glucose or glycerol as a carbon source. When glycerol was used as a carbon source, enzymatic activity was at least 7 times higher than when cells were grown on media containing glucose as a carbon source (Fig. 10), showing that recombinant genes can be expressed using PglpF and that this expression can be regulated by the carbon source present in the medium.

Пример 10. Высокий уровень экспрессии рекомбинантных генов с использованием экспрессионного элемента PglpF по сравнению с использованием промоторного элемента Plac.Example 10. High level of expression of recombinant genes using the PglpF expression element compared to using the Plac promoter element.

Экспрессию гетерологичных генов из слитых конструкций PglpF-70UTR-Pd2 и PglpF-70UTR-nst определяли для единичных копий, интегрированным в хромосому хозяина, с последующим измерением ферментативной активности экспрессированных белков. Ферментативную активность измеряли в клеточных лизатах, экспрессирующих Pd2 с промотора Plac (при индукции с IPTG) или с промотора PglpF (фиг. 10). Продукция 6'SL была в 7 раз выше в клеточных лизатах, экспрессирующих Pd2 из PglpF, по сравнению с Plac. Аналогичным образом ферментативная активность клеточного лизата, экспрессирующего сиаллилтрансферазу nst с промотора Plac (индуцируемую с помощью IPTG) или с промотора PglpF (фиг. 10), показала почти в 14 раз более высокую активность, когда nst экспрессировалась с PglpF, чем с Plac.The expression of heterologous genes from the fusion constructs PglpF-70UTR-Pd2 and PglpF-70UTR-nst was determined for single copies integrated into the host chromosome, followed by measurement of the enzymatic activity of the expressed proteins. Enzyme activity was measured in cell lysates expressing Pd2 from the Plac promoter (induction with IPTG) or from the PglpF promoter (Fig. 10). 6′SL production was 7-fold higher in cell lysates expressing Pd2 from PglpF compared to Plac. Similarly, the enzymatic activity of cell lysate expressing nst siallyltransferase from the Plac promoter (inducible by IPTG) or from the PglpF promoter (Fig. 10) showed almost 14-fold higher activity when nst was expressed with PglpF than with Plac.

Пример 11. Pglp-содержащие конструкции нуклеиновых кислот могут быть использованы для экспрессии в высококопийных плазмидах.Example 11 Pglp-containing nucleic acid constructs can be used for expression in high copy number plasmids.

Все конструкции нуклеиновых кислот PglpF, PglpA и PglpT содержат фрагмент промоторной ДНК, выделенный из соответствующих оперонов glp, и синтетическую ДНК-последовательность, содержащую ДНК-последовательность 5'UTR, выделенную из соответствующего промотора, которая была слита с SEQ ID NO: 10 и помещена выше сайта начала трансляции репортерного гена (lacZ). Конструкции были клонированы в высококопийную плазмиду. Уровни экспрессии lacZ измеряли как активность фермента β-галактозидазы в клетках, выращенных в среде LB в присутствии или в отсутствие глюкозы (табл. 14, фиг. 11). Результаты в табл. 4 показывают, что Pglp поддерживает высокую экспрессию с плазмид с большим числом копий и что эта экспрессия регулируется катаболической репрессией в присутствии глюкозы (табл. 14, фиг. 11).The PglpF, PglpA and PglpT nucleic acid constructs all contain a promoter DNA fragment isolated from the respective glp operons and a synthetic DNA sequence containing the 5'UTR DNA sequence isolated from the corresponding promoter, which has been fused to SEQ ID NO: 10 and placed upstream of the translation start site of the reporter gene (lacZ). The constructs were cloned into a high copy number plasmid. lacZ expression levels were measured as β-galactosidase enzyme activity in cells grown in LB medium in the presence or absence of glucose (Table 14, Fig. 11). Results in table. 4 show that Pglp maintains high expression from high copy number plasmids and that this expression is regulated by catabolic repression in the presence of glucose (Table 14, Fig. 11).

Таблица 14Table 14

Уровни экспрессии со слитых конструкций промотор-lacZ в плазмиде с большим числом копийExpression levels from promoter-lacZ fusion constructs in a high copy number plasmid

Плазмида Plasmid Промоторный элемент Promoter element Исходный оперон Original operon Активность в LB (MU) Activity in LB (MU) Активность в LB+глюкоза (MU) Activity in LB+glucose (MU) рМАР205 pMAP205 PglpF PglpF glpFKX glpFKX 51,245±4,560 51.245±4.560 6,664 6,664 рМАР431 pMAP431 PglpA PglpA glpACB glpACB 27,377±549 27.377±549 457±469 457±469 рМАР433 pMAP433 PglpT PglpT glpTQ glpTQ ll,019±575 ll.019±575 400±10 400±10

Пример 12. Создание Escherichia coli для получения LNnT с использованием промотора PglpF.Example 12: Engineering of Escherichia coli to produce LNnT using the PglpF promoter.

Штамм Escherichia coli K-12 (DH1) MD0 можно изменять для эпизодической экспрессии представляющих интерес гетерологичных генов. Например, штамм MDO1 является 2-плазмидным штаммом с плазмидой со средним числом копий (30-40 копий на клетку), несущей ген lgtA, и плазмидой с высоким числом копий (300-500 копий на клетку) с геном galT. Промотор Plac контролирует экспрессию обоих гетерологичных генов в этих плазмидах. В альтернативном варианте гетерологичные гены могут быть интегрированы в геном штамма Escherichia coli K-12 (DH1) MDO для создания продуцируемых геномом производственных систем. Таким образом, среднекопийная плазмида с геном lgtA заменяется одной геномной копией экспрессионной кассеты PglpF-lgtA в штамме МР1497, которая все еще несет высококопийную плазмиду с Plac-galT. В другом примере высококопийную плазмиду с геном galT заменяют одной геномной копией экспрессионной кассеты PglpF-galT в штамме МР1499, которая все еще несет среднекопийную плазмиду с Plac-lgtA Как показано на фиг. 12А, сходные титры LNnT достигаются, когда экспрессия обоих гетерологичных генов, lgtA и galT, экспрессируется с помощью плазмидного промотора Plac (штамм MDO1) или когда один из генов экспрессируется с фрагмента с промотором PglpF, интегрированного в хромосомную ДНК, и второй ген экспрессируется с плазмидного промотора Plac (штаммы МР1497 и МР1499).Escherichia coli strain K-12 (DH1) MD0 can be modified to sporadically express heterologous genes of interest. For example, strain MDO1 is a 2-plasmid strain with a medium copy number plasmid (30-40 copies per cell) carrying the lgtA gene and a high copy number plasmid (300-500 copies per cell) carrying the galT gene. The Plac promoter controls the expression of both heterologous genes in these plasmids. Alternatively, heterologous genes can be integrated into the genome of Escherichia coli strain K-12 (DH1) MDO to create genome-derived production systems. Thus, the mid-copy plasmid with the lgtA gene is replaced by one genomic copy of the PglpF-lgtA expression cassette in strain MP1497, which still carries the high-copy plasmid with Plac-galT. In another example, the high-copy galT gene plasmid is replaced with one genomic copy of the PglpF-galT expression cassette in strain MP1499, which still carries the mid-copy Plac-lgtA plasmid. As shown in FIG. 12A, similar LNnT titers are achieved when expression of both heterologous genes, lgtA and galT, is expressed from the plasmid Plac promoter (strain MDO1) or when one of the genes is expressed from a fragment with the PglpF promoter integrated into chromosomal DNA and the second gene is expressed from the plasmid Plac promoter (strains MP1497 and MP1499).

Штаммы МР2622 и МР1825 экспрессируют гены lgtA и galT с одной геномной копии под контролем промоторов Plac или PglpF, соответственно. Штамм МР166 имеет три Plac-контролируемые геномные копии обоих генов. За исключением штамма МР2622, ген lacI удаляется из генома обсуждаемых в настоящем документе штаммов, а кассета СР6-galK вставляется в локус lacI. Из гистограмм на фиг. 12ВStrains MP2622 and MP1825 express the lgtA and galT genes from one genomic copy under the control of the Plac or PglpF promoters, respectively. Strain MP166 has three Plac-controlled genomic copies of both genes. With the exception of strain MP2622, the lacI gene is removed from the genome of the strains discussed herein, and the CP6-galK cassette is inserted into the lacI locus. From the histograms in Fig. 12V

- 62 044676 очевидно, что экспрессия генов lgtA и galT с одной, контролируемой PglpF геномной копии (штамм МР1825) достаточна для достижения титров LNnT, которые значительно выше, чем титры, достигаемые при одиночных (штамм МР2622) или множественных (штамм МР166) Plac-контролируемых геномных копиях lgtA и galT, интегрированных в геном.- 62 044676 it is obvious that the expression of the lgtA and galT genes from a single PglpF-controlled genomic copy (strain MP1825) is sufficient to achieve LNnT titers, which are significantly higher than the titers achieved with single (strain MP2622) or multiple (strain MP166) Plac- controlled genomic copies of lgtA and galT integrated into the genome.

Пример 13. Конструирование Escherichia coli для получения LNT с использованием промотора PglpF.Example 13: Engineering Escherichia coli to produce LNT using the PglpF promoter.

Штамм Escherichia coli K-12 (DH1) MDO можно модифицировать для эпизодической экспрессии представляющих интерес гетерологичных генов. Штамм MDO15 представляет собой 2-плазмидный штамм с плазмидой со средним количеством копий (30-40 копий на клетку), несущей ген lgtA и плазмидой с большим количеством копий (300-500 копий на клетку) с геном galTK. Экспрессия обоих гетерологичных генов в этих плазмидах контролируется промотором Plac. В альтернативном варианте, гетерологичные гены могут быть интегрированы в геном штамма Escherichia coli K-12 (DH1) MDO для создания продуцируемых геномом продуцирующих систем. Таким образом, плазмида со средним числом копий с геном lgtA заменяется одной копией экспрессионной кассеты PglpF-lgtA в штамме МР1498, которая все еще несет высококопийную плазмиду с Plac-galTK (фиг. 13А). В другом примере высококопийную плазмиду с геном galTK заменяют двумя геномными копиями экспрессионный кассеты PglpF-galTK в штамме МР1655, который все еще несет плазмиду со средним числом копий с Plac-lgtA (фиг. 13А). Как показано на фиг. 13А, сходные титры LNT могут быть достигнуты, когда экспрессия обоих гетерологичных генов, lgtA и galTK, контролируется плазмидным промотором Plac (штамм MDO15), или когда экспрессия lgtA управляется кассетой PglpF-lgtA, вставленной в хромосомную ДНК хозяина, и плазмидный промотор Plac контролирует экспрессию гена galTK (штамм МР1498). Подобные титры продукта также могут быть достигнуты, когда две интегрированные в геном кассеты PglpF-lgtA управляют экспрессией гена galTK, а экспрессия lgtA находится под контролем плазмидного промотора Plac (штамм МР1655 на фиг. 13А).Escherichia coli strain K-12 (DH1) MDO can be modified to sporadically express heterologous genes of interest. Strain MDO15 is a 2-plasmid strain with a medium copy number plasmid (30-40 copies per cell) carrying the lgtA gene and a high copy number plasmid (300-500 copies per cell) carrying the galTK gene. The expression of both heterologous genes in these plasmids is controlled by the Plac promoter. Alternatively, heterologous genes can be integrated into the genome of Escherichia coli strain K-12 (DH1) MDO to create genome-wide production systems. Thus, the medium copy number plasmid with the lgtA gene is replaced by one copy of the PglpF-lgtA expression cassette in strain MP1498, which still carries the high copy number plasmid with Plac-galTK (Fig. 13A). In another example, the high copy number plasmid with the galTK gene is replaced by two genomic copies of the PglpF-galTK expression cassette in strain MP1655, which still carries the medium copy number plasmid with Plac-lgtA (Fig. 13A). As shown in FIG. 13A, similar LNT titers can be achieved when expression of both heterologous genes, lgtA and galTK, is controlled by the plasmid Plac promoter (strain MDO15), or when lgtA expression is driven by a PglpF-lgtA cassette inserted into the host chromosomal DNA and the plasmid Plac promoter controls expression galTK gene (strain MP1498). Similar product titers can also be achieved when two genome-integrated PglpF-lgtA cassettes drive galTK gene expression and lgtA expression is under the control of the plasmid Plac promoter (strain MP1655 in Fig. 13A).

Экспрессия трех геномных копий lgtA и двух galTK в штамме МР245 находится под контролем промотора Plac. Одна копия каждого гетерологичного гена экспрессируется с промотора PglpF в штамме МР1920. Ген lacI удаляется из генома этих штаммов путем введения кассеты СРб-galK в локус lacI. Из графиков на фиг. 13В очевидно, что экспрессия генов lgtA и galTK с одной, контролируемой PglpF геномной копии (штамм МР1920), достигает титров LNT, которые намного выше, чем достигаемые в варианте, когда множественные геномные копии lgtA и galT, контролируемые Plac (штамм МР245), интегрированы в хромосому.The expression of three genomic copies of lgtA and two galTK in strain MP245 is under the control of the Plac promoter. One copy of each heterologous gene is expressed from the PglpF promoter in strain MP1920. The lacI gene is removed from the genome of these strains by introducing a Cpb-galK cassette into the lacI locus. From the graphs in Fig. 13B it is obvious that the expression of the lgtA and galTK genes from a single PglpF-controlled genomic copy (strain MP1920) achieves LNT titers that are much higher than those achieved in the variant when multiple genomic copies of lgtA and galT controlled by Plac (strain MP245) are integrated into a chromosome.

Пример 14. Конструирование Escherichia coli для получения LNFP-I с использованием промотора PglpF.Example 14: Engineering Escherichia coli to produce LNFP-I using the PglpF promoter.

Геномную систему продукции LNFP-I можно разработать путем интеграции соответствующих гетерологичных генов в геном штамма Escherichia coli K-12 (DH1) MDO. Например, штамм МР2239 экспрессирует гетерологичные гены lgtA, galTK и futC с одной геномной копии под контролем промотора PglpF, тогда как экспрессия генов колановой кислоты (СА) - gmd, wcaJ (fcI), wcaH (gmm), wcaI, cpsB (manC) и cpsG (manB) -контролируется с помощью Plac. Интеграция внегеномных копий генов пути синтеза колановой кислоты в штамме МР2239 под контролем промотора PglpF дает штамм МР2374. Ген lacI удаляется из генетического фона обоих штаммов. Заметное улучшение титра LNFP-I наблюдается, когда дополнительные копии генов пути синтеза колановой кислоты интегрируется в штамм МР2239 и экспрессируются с промотора PglpF (фиг. 14).A genomic LNFP-I production system can be developed by integrating the corresponding heterologous genes into the genome of Escherichia coli strain K-12 (DH1) MDO. For example, strain MP2239 expresses the heterologous genes lgtA, galTK and futC from one genomic copy under the control of the PglpF promoter, while the expression of the colanic acid (CA) genes is gmd, wcaJ (fcI), wcaH (gmm), wcaI, cpsB (manC) and cpsG (manB) - controlled by Plac. Integration of extragenomic copies of genes for the colanic acid synthesis pathway in strain MP2239 under the control of the PglpF promoter produces strain MP2374. The lacI gene is removed from the genetic background of both strains. A marked improvement in LNFP-I titer was observed when additional copies of colanic acid synthesis pathway genes were integrated into strain MP2239 and expressed from the PglpF promoter (Fig. 14).

Пример 15. Конструирование Escherichia coli для продукции 3'SL с использованием промотора PglpF.Example 15: Engineering Escherichia coli to produce 3'SL using the PglpF promoter.

В штамме МАР425 промотор Plac был использован для экспрессии i) гетерологичного гена nst и кластера гетерологичных генов neuBCA, интегрированных в хромосому Escherichia coli K-12 (DH1) MDO; и ii) кластера гетерологичных генов neuBCA с высококопийной плазмиды (300-500 копий на клетку). В штамме МАР1214 промотор PglpF использовали для экспрессии гетерологичных генов nst, neuA, neuB и neuC, интегрированных в единичных копиях в хромосому Escherichia coli K-12 (DH1) MDO. Как показано на рисунке 15, сходные 3'SL-титры были достигнуты, когда Plac использовался для экспрессии кластера генов neuBCA с высококопийной плазмиды (штамм МАР425), и когда PglpF использовался для экспрессии nst, neuA, neuB и neuC с единичных интегрированных копий генов (штамм МАР1214) (фиг. 15).In strain MAP425, the Plac promoter was used to express i) the heterologous nst gene and the heterologous neuBCA gene cluster integrated into the Escherichia coli K-12 (DH1) MDO chromosome; and ii) a cluster of heterologous neuBCA genes from a high copy number plasmid (300-500 copies per cell). In strain MAP1214, the PglpF promoter was used to express heterologous genes nst, neuA, neuB and neuC, integrated in single copies into the Escherichia coli K-12 (DH1) MDO chromosome. As shown in Figure 15, similar 3'SL titers were achieved when Plac was used to express the neuBCA gene cluster from a high copy number plasmid (strain MAP425), and when PglpF was used to express nst, neuA, neuB and neuC from single integrated copies of the genes ( strain MAP1214) (Fig. 15).

Пример 16. Конструирование Escherichia coli для продукции 6'SL с использованием промотора PglpF.Example 16: Engineering Escherichia coli to produce 6'SL using the PglpF promoter.

В штамме МАР265 промотор Plac использовали для экспрессии i) гетерологичного гена Pd2, введенного в хромосому Escherichia coli K-12 (DH1) MDO, и ii) кластера гетерологичных генов neuBCA с высококопийной плазмиды (300-500 копий). В штамме MAP1200 фрагмент промотора PglpF был использован для экспрессии гетерологичных генов Pd2, neuA, neuB и neuC, интегрированных в единичных копиях в хромосому Escherichia coli K-12 (DH1) MDO. Как показано на фиг. 16, титр 6'SL был значительно выше, когда PglpF использовался для экспрессии Pd2, neuA, neuB и neuC с единичных интегрированных копий генов, чем когда Plac использовался для экспрессии кластера генов neuBCA с высококопийной плазмиды (штамм МАР265) (фиг. 16).In strain MAP265, the Plac promoter was used to express i) the heterologous Pd2 gene introduced into the Escherichia coli K-12 (DH1) MDO chromosome, and ii) the heterologous neuBCA gene cluster from a high-copy plasmid (300-500 copies). In strain MAP1200, a fragment of the PglpF promoter was used to express the heterologous genes Pd2, neuA, neuB and neuC, integrated in single copies into the Escherichia coli K-12 (DH1) MDO chromosome. As shown in FIG. 16, the 6'SL titer was significantly higher when PglpF was used to express Pd2, neuA, neuB and neuC from single integrated gene copies than when Plac was used to express the neuBCA gene cluster from a high copy plasmid (strain MAP265) (Fig. 16).

--

Claims (16)

Пример 17. Конструирование Escherichia coli для продукции 2'FL с использованием промотора PglpF.Example 17: Engineering Escherichia coli to produce 2'FL using the PglpF promoter. Штамм FT18 представляет собой 2-плазмидный штамм с плазмидой со средним числом копий (30-40 копий на клетку), несущей гены пути биосинтеза колановой кислоты gmd, wcaJ (fcI), cpsB (manC) и cpsG (manB), выделенные из Escherichia coli K-12 DH1 и высококопийной плазмидой (300-500 копий на клетку) с геном futC. Промотор Plac контролирует экспрессию клонированных генов в этих плазмидах. Экспрессия генов futC и генов биосинтеза колановой кислоты gmd, wcaJ (fcI), cpsB (manC) и cpsG (manB) в штамме МР965 находится под контролем промотора PglpF. Единственная копия генов futC и колановой кислоты экспрессируется с промотора PglpF в штамме МАР965. Результаты, представленные на фиг. 17, показывают, что экспрессия генов futC и СА из генов биосинтеза колановой кислоты с одной, контролируемой PglpF геномной копии (штамм МАР965) позволяет получить почти такие же титры 2TL, что и при экспрессии с множества копий генов, контролируемых Plac (фиг. 17).Strain FT18 is a 2-plasmid strain with a medium copy number plasmid (30-40 copies per cell) carrying the colanic acid biosynthetic pathway genes gmd, wcaJ (fcI), cpsB (manC) and cpsG (manB) isolated from Escherichia coli K-12 DH1 and a high-copy plasmid (300-500 copies per cell) with the futC gene. The Plac promoter controls the expression of cloned genes in these plasmids. Expression of the futC genes and the colanic acid biosynthesis genes gmd, wcaJ (fcI), cpsB (manC), and cpsG (manB) in strain MP965 is under the control of the PglpF promoter. A single copy of the futC and colanic acid genes is expressed from the PglpF promoter in strain MAP965. The results presented in Fig. 17 show that expression of the futC and CA genes from the colanic acid biosynthesis genes from a single PglpF-controlled genomic copy (strain MAP965) allows one to obtain almost the same 2TL titers as when expressed from multiple copies of the Plac-controlled genes (Fig. 17) . ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Конструкция нуклеиновой кислоты, подходящая для модификации экспрессии желаемого гена, содержащая синтетическую некодирующую ДНК-последовательность (i), которая содержит первый фрагмент ДНК и второй фрагмент ДНК, где первый фрагмент ДНК представляет собой ДНКпоследовательность, полученную из 5'-нетранслируемой области (5'-UTR) гена glpF, glpT, glpA или glpD из Escherichia coli, и второй фрагмент ДНК представляет собой ДНК-последовательность CAAGGAGGAAACAGCT (SEQ ID NO: 10) или вариант указанной последовательности, выбранный из последовательностей ДНК SEQ ID NO: 38-47, и где первый фрагмент расположен выше второго фрагмента.1. A nucleic acid construct suitable for modifying the expression of a desired gene, comprising a synthetic non-coding DNA sequence (i) that contains a first DNA fragment and a second DNA fragment, wherein the first DNA fragment is a DNA sequence derived from the 5' untranslated region (5 '-UTR) of the glpF, glpT, glpA or glpD gene from Escherichia coli, and the second DNA fragment is the DNA sequence CAAGGAGGAAACAGCT (SEQ ID NO: 10) or a variant of the said sequence selected from the DNA sequences SEQ ID NO: 38-47, and where the first fragment is located above the second fragment. 2. Конструкция нуклеиновой кислоты по п.1, дополнительно содержащая промоторную ДНКпоследовательность (ii), где промоторная ДНК функционально связана с последовательностью синтетической некодирующей ДНК (i) и расположена перед первым фрагментом ДНК последовательности синтетической некодирующей ДНК (i).2. The nucleic acid construct according to claim 1, further comprising a promoter DNA sequence (ii), where the promoter DNA is operably linked to the synthetic non-coding DNA sequence (i) and is located before the first DNA fragment of the synthetic non-coding DNA sequence (i). 3. Конструкция нуклеиновой кислоты по п.1 или 2, дополнительно содержащая кодирующую ДНКпоследовательность (iii), где кодирующая ДНК-последовательность (iii) функционально связана с синтетической некодирующей последовательностью ДНК (i) и расположена ниже второго фрагмента синтетической некодирующей ДНК-последовательности (i).3. The nucleic acid construct according to claim 1 or 2, further comprising a coding DNA sequence (iii), where the coding DNA sequence (iii) is operably linked to a synthetic non-coding DNA sequence (i) and is located downstream of a second fragment of the synthetic non-coding DNA sequence (i ). 4. Конструкция нуклеиновой кислоты по пп.1, 2 или 3, где первый фрагмент ДНК синтетической некодирующей ДНК-последовательности (i) получен из ДНК-последовательности 5'UTR гена glpF, glpA или glpD Escherichia coli.4. The nucleic acid design according to claim 1, 2 or 3, wherein the first DNA fragment of the synthetic non-coding DNA sequence (i) is derived from the 5'UTR DNA sequence of the glpF, glpA or glpD gene of Escherichia coli. 5. Конструкция нуклеиновой кислоты по пп.1, 2 или 3, где первый фрагмент ДНК синтетической некодирующей ДНК-последовательности (i) содержит от примерно 5 до примерно 65 последовательных нуклеотидов после начала транскрипции гена glp, причем предпочтительно ген glp представляет собой glpF.5. The nucleic acid construct of claim 1, 2 or 3, wherein the first DNA fragment of the synthetic non-coding DNA sequence (i) contains from about 5 to about 65 contiguous nucleotides after the start of transcription of the glp gene, wherein preferably the glp gene is glpF. 6. Конструкция нуклеиновой кислоты по любому из предшествующих пунктов, где первый фрагмент ДНК из (i) представляет собой или содержит SEQ ID NO: 36, его фрагмент.6. The nucleic acid construct of any one of the preceding claims, wherein the first DNA fragment of (i) is or contains SEQ ID NO: 36, a fragment thereof. 7. Конструкция нуклеиновой кислоты по любому из предшествующих пунктов, в которой синтетическая некодирующая последовательность ДНК (i) представляет собой SEQ ID NO: 37.7. The nucleic acid construct of any one of the preceding claims, wherein the synthetic non-coding DNA sequence (i) is SEQ ID NO: 37. 8. Конструкция нуклеиновой кислоты по любому из пп.2-7, где последовательность промоторной ДНК (ii) происходит из последовательности промоторной ДНК, которая в природе инициирует транскрипцию оперона glpFKX, glpABC, glpD или glpTQ Escherichia coli.8. The nucleic acid construct according to any one of claims 2 to 7, wherein the promoter DNA sequence (ii) is derived from a promoter DNA sequence that naturally initiates transcription of the Escherichia coli glpFKX, glpABC, glpD or glpTQ operon. 9. Конструкция нуклеиновой кислоты по любому из пп.2-8, где промоторная последовательность ДНК (ii) выбрана из SEQ ID NO: 48, 49 или 54.9. The nucleic acid design according to any one of claims 2 to 8, wherein the promoter DNA sequence (ii) is selected from SEQ ID NO: 48, 49 or 54. 10. Конструкция нуклеиновой кислоты по любому из предшествующих пунктов, которая выбрана из любой из нуклеотидных последовательностей, указанных в SEQ ID NO: 12-35, 50-53, или она представляет собой фрагмент или вариант указанной последовательности.10. The nucleic acid construct of any one of the preceding claims, which is selected from any of the nucleotide sequences specified in SEQ ID NO: 12-35, 50-53, or it is a fragment or variant of the specified sequence. 11. Конструкция нуклеиновой кислоты по любому из предшествующих пунктов, где кодирующая ДНК-последовательность (iii) кодирует белок или РНК, где предпочтительно белок или РНК имеют функцию, которая необходима или полезна для продукции одного или более олигосахаридов человеческого молока (НМО) в рекомбинантном организме.11. The nucleic acid construct of any one of the preceding claims, wherein the DNA coding sequence (iii) encodes a protein or RNA, wherein preferably the protein or RNA has a function that is necessary or useful for the production of one or more human milk oligosaccharides (HMOs) in a recombinant organism . 12. Конструкция нуклеиновой кислоты по любому из предшествующих пунктов, где конструкция представляет собой экспрессионную кассету, которая интегрирована в геномную или плазмидную ДНК рекомбинантного организма.12. The nucleic acid construct of any one of the preceding claims, wherein the construct is an expression cassette that is integrated into the genomic or plasmid DNA of a recombinant organism. 13. Рекомбинантная клетка, содержащая одну или более нуклеотидных конструкций по любому из пп.1-12.13. A recombinant cell containing one or more nucleotide constructs according to any one of claims 1 to 12. 14. Рекомбинантная клетка по п.13, где клетка представляет собой бактериальную клетку.14. The recombinant cell according to claim 13, wherein the cell is a bacterial cell. 15. Рекомбинантная клетка по п.14, где бактериальная клетка представляет собой E.coli.15. The recombinant cell according to claim 14, wherein the bacterial cell is E. coli. 16. Экспрессионная система, содержащая нуклеотидную конструкцию по любому из пп.1-12 или рекомбинантную клетку по любому из пп.13-15.16. An expression system containing a nucleotide construct according to any of claims 1-12 or a recombinant cell according to any of claims 13-15. --
EA202091536 2017-12-21 2018-12-19 NUCLEIC ACID CONSTRUCTION FOR GENE EXPRESSION IN VITRO AND IN VIVO EA044676B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA201700737 2017-12-21
DKPA201800173 2018-04-18
DKPA201800231 2018-05-24

Publications (1)

Publication Number Publication Date
EA044676B1 true EA044676B1 (en) 2023-09-22

Family

ID=

Similar Documents

Publication Publication Date Title
US11608504B2 (en) Nucleic acid construct for in vitro and in vivo gene expression
US20220267782A1 (en) Nucleic acid construct comprising 5' utr stem-loop for in vitro and in vivo gene expression
US20230193335A1 (en) Hmo production
EP3467100B1 (en) Microorganisms and methods for producing sialylated and n-acetylglucosamine-containing oligosaccharides
US20230072639A1 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
US20230227876A1 (en) Hmo production
US20230109661A1 (en) Hmo production
CN113166789A (en) Synthesis of fucosylated oligosaccharide LNFP-V
US20230109937A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
EA044676B1 (en) NUCLEIC ACID CONSTRUCTION FOR GENE EXPRESSION IN VITRO AND IN VIVO
US20240026280A1 (en) Plasmid addiction systems
DK181319B1 (en) Genetically engineered cells and methods comprising use of a sialyltransferase for in vivo synthesis of 3’sl
EA046241B1 (en) OBTAINING OGM
EA046260B1 (en) OBTAINING OGM
DK202200591A1 (en) New sialyltransferases for in vivo synthesis of lst-c
WO2023166035A2 (en) New sialyltransferases for in vivo synthesis of 3'sl and 6'sl
WO2023166034A1 (en) New sialyltransferases for in vivo synthesis of lst-a
EA046005B1 (en) A NEW MAIN FACTOR SUPERFAMILY (MFS) PROTEIN (Fred) IN THE PRODUCTION OF OGM
EA046248B1 (en) OBTAINING OGM
CN116490609A (en) Plasmid addiction system