RU2307169C1 - Method for investigation and prognosis of methyonin biosynthesis rout in related corynebacteria genomes - Google Patents

Method for investigation and prognosis of methyonin biosynthesis rout in related corynebacteria genomes Download PDF

Info

Publication number
RU2307169C1
RU2307169C1 RU2006127265/13A RU2006127265A RU2307169C1 RU 2307169 C1 RU2307169 C1 RU 2307169C1 RU 2006127265/13 A RU2006127265/13 A RU 2006127265/13A RU 2006127265 A RU2006127265 A RU 2006127265A RU 2307169 C1 RU2307169 C1 RU 2307169C1
Authority
RU
Russia
Prior art keywords
genomes
operon
mcbr
genes
biosynthesis
Prior art date
Application number
RU2006127265/13A
Other languages
Russian (ru)
Inventor
Михаил Сергеевич Гельфанд (RU)
Михаил Сергеевич Гельфанд
Галина Юрьевна Ковалева (RU)
Галина Юрьевна Ковалева
Original Assignee
Михаил Сергеевич Гельфанд
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Михаил Сергеевич Гельфанд filed Critical Михаил Сергеевич Гельфанд
Priority to RU2006127265/13A priority Critical patent/RU2307169C1/en
Application granted granted Critical
Publication of RU2307169C1 publication Critical patent/RU2307169C1/en

Links

Images

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

FIELD: bioinformatics, in particular pharmaceutical industry and biothectnology.
SUBSTANCE: of methyonon biosynthesis rout in related corynebacteria genomes is forecasted on the base of screening of possible binding sites of McbR regulone among predicted and suggested regulatory regions before genes of enzymes, participated in methyonon biosynthesis and orthologs of methyonon biosynthesis rout in corynebacteria genomes, as well as determination of operone composition. Obtained data are represented in form of table of gene compatibility to possible binding sites of McbR regulone and related corynebacteria genomes and diagram of McbR regulone operone structure. Participates and courses pf methyonon biosynthesis rout are forecasted by position comparison of content of said table and diagram.
EFFECT: improved method for prognosis of methyonin biosynthesis rout in related corynebacteria; large-scale methyonin production of decreased cost.
4 cl, 7 dwg

Description

Изобретение относится к компьютерным системам, использующим генетические модели при разработке новых соединений для фармацевтики, биотехнологии и других областей промышленности, для которых существенно использование новых белковых соединений на основе аминокислот.The invention relates to computer systems using genetic models in the development of new compounds for pharmaceuticals, biotechnology and other industries, for which the use of new protein compounds based on amino acids is essential.

Метионин является одной из незаменимых аминокислот и, кроме того, первой аминокислотой в большинстве белковых молекул, поэтому большое внимание уделяется возможности его синтеза в промышленных масштабах, что, в свою очередь, требует детального изучения пути биосинтеза метионина.Methionine is one of the essential amino acids and, in addition, the first amino acid in most protein molecules, so much attention is paid to the possibility of its synthesis on an industrial scale, which, in turn, requires a detailed study of the methionine biosynthesis pathway.

Известно, что некоторые мутанты Escherichia coli, устойчивые к аналогам метионина, могут продуцировать метионин.It is known that some mutants of Escherichia coli that are resistant to methionine analogues can produce methionine.

Было установлено, что мутанты Escherichia coli, устойчивые к этионину и утратившие способность к ингибированию конечным продуктом, способны производить метионин (Abelberg E.A., J.Bacteriol., 76, 326-328 (1958)).It was found that mutants of Escherichia coli, resistant to ethionine and having lost the ability to inhibit the final product, are able to produce methionine (Abelberg E.A., J. Bacteriol., 76, 326-328 (1958)).

Также была описана продукция метионина мутантами Escherichia coli, устойчивыми к норлейцину (Rowbury R.J., Nature, 206, 962 (1965)).The production of methionine by Escherichia coli mutants resistant to norleucine has also been described (Rowbury R. J., Nature, 206, 962 (1965)).

Но были получены только следовые количества метионина.But only trace amounts of methionine were obtained.

Описан микроорганизм, полученный введением в реципиентный штамм Escherichia гибридной плазмиды, содержащей фрагмент ДНК, выделенный из донорного штамма Escherichia, устойчивого к этионину (патент Великобритании GB2075055). Также описан вариационный тип гена metJ со специфической последовательностью, кодирующей связанный с биосинтезом метионина белок-репрессор из Escherichia coli, у которого активность к репрессии понижена и который полезен в продукции метионина (JP 157267 A2). Но выходы в процессе продукции метионина указанными мутантами (около 0,3-0,5 г/л) не могут удовлетворить растущие потребности в данной аминокислоте.A microorganism is described, obtained by introducing into a recipient strain of Escherichia a hybrid plasmid containing a DNA fragment isolated from the donor strain of Escherichia resistant to ethionine (UK patent GB2075055). A variation type of the metJ gene is also described with a specific sequence encoding the methionine biosynthesis-related repressor protein from Escherichia coli, in which repression activity is reduced and which is useful in methionine production (JP 157267 A2). But the yields in the production of methionine by these mutants (about 0.3-0.5 g / l) cannot satisfy the growing demand for this amino acid.

Известен способ получения метионина, в котором его получают путем выращивания бактерии Escherichia coli, обладающей способностью к продукции по крайней мере 0,5 г/л метионина в процессе выращивания на минимальной среде и устойчивой к аналогу метионина. Такими свойствами обладает штамм Escherichia coli 218 (ВКПМ В-8125). Накопленную аминокислоту выделяют из культуральной жидкости. Данное изобретение позволяет получать метионин с относительно высокой степенью эффективности (RU 2209248, 2001). Однако и этот способ не может удовлетворить потребности промышленности в метионине.A known method of producing methionine, in which it is obtained by growing the bacteria Escherichia coli, with the ability to produce at least 0.5 g / l methionine in the process of growing on minimal medium and resistant to the methionine analogue. These properties are possessed by the strain Escherichia coli 218 (VKPM B-8125). The accumulated amino acid is isolated from the culture fluid. This invention allows to obtain methionine with a relatively high degree of efficiency (RU 2209248, 2001). However, this method cannot satisfy the needs of industry in methionine.

Все указанные выше способы получения метионина, помимо невысокой производительности, трудоемки и являются дорогостоящими.All of the above methods for producing methionine, in addition to low productivity, are time consuming and expensive.

В связи с этим насущной необходимостью является изыскание генетических моделей и прогнозирование новых путей получения метионина с использованием накопленного опыта, информационных технологий и сравнительной геномики.In this regard, the search for genetic models and the prediction of new ways of producing methionine using accumulated experience, information technology and comparative genomics is an urgent need.

Вид Corynebacterium glutamicum представлен свободно-живущими почвенными бактериями, которые используются в промышленном производстве большого количества аминокислот, в основном лизина, аргинина, треонина, изолейцина, валина, серина, триптофана, фенилаланина и гистидина [1], но не метионина, несмотря на общность путей биосинтеза лизина и треонина с биосинтезом метионина. В последние годы биосинтез метионина в С.glutamicum детально изучался с целью использования этой бактерии как промышленного продуцента метионина.The species Corynebacterium glutamicum is represented by free-living soil bacteria that are used in the industrial production of a large number of amino acids, mainly lysine, arginine, threonine, isoleucine, valine, serine, tryptophan, phenylalanine and histidine [1], but not methionine, despite the common pathways biosynthesis of lysine and threonine with methionine biosynthesis. In recent years, the biosynthesis of methionine in C. glutamicum has been studied in detail in order to use this bacterium as an industrial producer of methionine.

Структурные гены генетической модели пути синтеза метионина можно разделить на две части - гены пути включения серы в углеродный скелет и пути биосинтеза непосредственно метионина (см. фиг.1 - схема биосинтеза). Основной путь ассимиляции серы представляет собой путь восстановления сульфата до сульфида. Сера, входящая в состав сульфида, затем входит в путь биосинтеза метионина либо в составе цистеина, либо в составе цистатионина в зависимости от микроорганизма [2]. Гены ферментов восстановления сульфата формируют в геноме C.glutamicum единый оперон (фиг.4, позиция A, C.glutamicum). Помимо сульфата, в качестве источника серы для почвенных бактерий могут выступать и другие соединения, такие как сульфатные эфиры и сульфонаты, утилизация которых требует наличия соответствующих ферментов. Они также организованы в единые опероны.The structural genes of the genetic model of the methionine synthesis pathway can be divided into two parts - the genes of the pathway for incorporating sulfur into the carbon skeleton and the biosynthesis pathway of methionine directly (see Fig. 1 - biosynthesis scheme). The main pathway for sulfur assimilation is the pathway for reducing sulfate to sulfide. Sulfur, which is part of the sulfide, then enters the biosynthesis pathway of methionine either as part of cysteine or as part of cystathionine, depending on the microorganism [2]. The sulfate reduction enzyme genes form a single operon in the C. glutamicum genome (Fig. 4, position A, C. glutamicum). In addition to sulfate, other compounds, such as sulfate esters and sulfonates, whose utilization requires the presence of appropriate enzymes, can also serve as a source of sulfur for soil bacteria. They are also organized into single operons.

Для генов модели синтеза непосредственно метионина объединение в крупные опероны не характерно. Биосинтез метионина идет от аспартата с последующим образованием гомосерина, который, в свою очередь, преобразуется либо в ацетилгомосерин в Neurospora crassa, Saccharomyces cerevisiae и C.glutamicum, либо в сукцинилгомосерин в Escherichia coli и Pseudomonas aeruginosa. Затем идет образование гомоцистеина, которое может происходить двумя путями: по прямому пути сульфгидрилирования (C.glutamicum, Pseudomonas aeruginosa и Saccharomyces cerevisiae) или по пути транс-сульфурилирования с образованием промежуточного продукта - цистатионина, этот путь характерен для Escherichia coli, Neurospora crassa и C.glutamicum [2; 3]. Таким образом, в отличие от большинства микроорганизмов, которые используют один из путей синтеза гомоцистеина, для C.glutamicum характерно наличие обоих полностью функциональных путей модели биосинтеза [3] (см. фиг.1).For genes of the methionine synthesis model itself, unification into large operons is not characteristic. The methionine biosynthesis proceeds from aspartate, followed by the formation of homoserine, which, in turn, is converted either to acetyl homoserine in Neurospora crassa, Saccharomyces cerevisiae and C. glutamicum, or to succinyl homoserine in Escherichia coli and Pseudomonas aeruginosa. Then there is the formation of homocysteine, which can occur in two ways: along the direct sulfhydrylation pathway (C. glutamicum, Pseudomonas aeruginosa and Saccharomyces cerevisiae) or along the trans sulfurylation pathway with the formation of an intermediate product - cystathionine, this pathway is characteristic of Escherichia coli, Neurospora crassa .glutamicum [2; 3]. Thus, unlike most microorganisms that use one of the pathways for the synthesis of homocysteine, C. glutamicum is characterized by the presence of both fully functional pathways of the biosynthesis model [3] (see Fig. 1).

Гены биосинтеза метионина в геноме C.glutamicum находятся под регуляцией как минимум двух регуляторов. Одним из них является непрямой регулятор, кодируемый геном cg3031. Соответствующий белок cg3031p подавляет биосинтез метионина, но при этом не способен к связыванию с ДНК [4].Genes for methionine biosynthesis in the C. glutamicum genome are regulated by at least two regulators. One of them is an indirect regulator encoded by the cg3031 gene. The corresponding cg3031p protein inhibits the methionine biosynthesis, but is not capable of binding to DNA [4].

Известен для Corynebacterium glutamicum [5; 6] транскрипционный регулятор генов пути биосинтеза метионина, mcbR (methionine and cysteine biosynthesis represser gene) и предполагаемая оперонная структура регулона mcbR.Known for Corynebacterium glutamicum [5; 6] a transcriptional regulator of genes for the methionine biosynthesis pathway, mcbR (methionine and cysteine biosynthesis represser gene) and the putative operon structure of the mcbR regulon.

Это димерный транскрипционный репрессор, принадлежащий к TetR-семейству, связывающийся с палиндромной последовательностью TAGAC-N6-GTCTA [6] в регуляторных областях генов метаболического пути. Большая часть сайтов связывания данного регулятора в C.glutamicum была предсказана на основании выравнивания регуляторных областей генов-мишеней и предсказание было экспериментально проверено и подтверждено для пяти регулируемых генов, таких как hom, cysI, cysK, metK и mcbR [6]. В целом в работе [6] была предсказана оперонная организация генов пути биосинтеза метионина (см. фиг.4, C.glutamicim) и были предъявлены потенциальные сайты связывания транскрипционного репрессора перед большей частью оперонов в геноме C.glutamicum (см. фиг.4, C.glutamicum - оперонная структура из [6] и соответствующие сайты).This is a dimeric transcriptional repressor belonging to the TetR family that binds to the palindromic sequence TAGAC-N6-GTCTA [6] in the regulatory regions of the metabolic pathway genes. Most of the binding sites of this regulator in C. glutamicum were predicted by aligning the regulatory regions of the target genes and the prediction was experimentally verified and confirmed for five regulated genes, such as hom, cysI, cysK, metK and mcbR [6]. In general, in [6], the operon organization of genes of the methionine biosynthesis pathway was predicted (see Fig. 4, C. glutamicim) and potential binding sites of the transcriptional repressor were presented in front of most operons in the C. glutamicum genome (see Fig. 4, C. glutamicum is the operon structure from [6] and the corresponding sites).

Несмотря на то, что биосинтез метионина детально исследован в большинстве таксономических групп бактерий, очень немногое известно об этом метаболическом пути для организмов класса актиномицет.Despite the fact that the biosynthesis of methionine has been studied in detail in most taxonomic groups of bacteria, very little is known about this metabolic pathway for actinomycetes.

Задачей предлагаемого изобретения является расширение функциональных возможностей способа прогнозирования, увеличение его оперативности, а также, в перспективе, уменьшение затрат на промышленное производство метионина.The objective of the invention is to expand the functionality of the forecasting method, increase its efficiency, and also, in the future, reduce the cost of industrial production of methionine.

Указанная задача решается в способе исследования и прогнозирования пути биосинтеза метионина в родственных геномах коринебактерий, включающем этапы, на которых:This problem is solved in the method of research and prediction of the pathway of methionine biosynthesis in related genomes of corynebacteria, including the stages in which:

а) составляют исходную обучающую выборку на основе предсказанных ранее и подтвержденных экспериментально регуляторных сигналов перед ферментами, участвующими в биосинтезе метионина, и записывают ее на информационный носитель;a) compile the initial training sample based on previously predicted and experimentally confirmed regulatory signals before the enzymes involved in methionine biosynthesis, and record it on an information carrier;

б) вводят в компьютер записанную на информационный носитель исходную обучающую выборку и обрабатывают ее заранее записанной в память компьютера программой SignalX для построения матриц позиционных весов нуклеотидов;b) enter into the computer the source training sample recorded on the information carrier and process it with the SignalX program written in the computer memory in advance to construct the matrix of positional nucleotide weights;

в) обрабатывают исходную обучающую выборку заранее записанными в память компьютера алгоритмами из пакета программ Genome Explorer соответственно для поиска потенциальных сайтов связывания регулона McbR и анализа ортологов белков, при этом область поиска потенциальных сайтов связывания ограничивают диапазоном - 400...+100 пар нуклеотидов относительно старта трансляции гена, а сам ген считают принадлежащим оперону в случае одинакового направления считывания и расстояния не более 100 пар нуклеотидов от других генов этого оперона и записывают результаты обработки в память компьютера;c) the initial training set is processed using algorithms previously stored in the computer’s memory from the Genome Explorer software package, respectively, to search for potential McbR regulon binding sites and to analyze protein orthologs, while the search for potential binding sites is limited to the range of 400 ... + 100 nucleotides relative to the start gene translation, and the gene itself is considered to belong to the operon in the case of the same reading direction and the distance of not more than 100 pairs of nucleotides from other genes of this operon and record the result you are processing in the computer memory;

г) производят поиск ортологов белков пути биосинтеза метионина во всех родственных геномах, а результаты поиска и обработки по пункту в) разделяют на два выходных текстовых файла, первый из которых выводят на информационный носитель в виде таблицы соответствия генов пути биосинтеза метионина потенциальным сайтам связывания регулона McbR и родственным геномам коринебактерий, а второй - в виде диаграммы структуры оперонов регулона McbR;d) they search for orthologs of proteins of the methionine biosynthesis pathway in all related genomes, and the results of the search and processing for c) are divided into two output text files, the first of which is displayed on an information medium in the form of a table of correspondence of the genes of the methionine biosynthesis pathway with potential McbR regulatory binding sites and related genomes of corynebacteria, and the second in the form of a diagram of the structure of operons of the McbR regulon;

д) на основе позиционного сравнения содержания обоих выходных текстовых файлов с учетом результатов поиска регуляторных сайтов связывания в более филогенетически отдаленных геномах для первого выходного текстового файла и с учетом характерных эволюционных событий формирования структуры оперонов для второго выходного текстового файла прогнозируют направление пути биосинтеза метионина.e) based on the positional comparison of the contents of both output text files, taking into account the search results for regulatory binding sites in more phylogenetically distant genomes for the first output text file and taking into account the characteristic evolutionary events of the formation of the structure of operons for the second output text file, the direction of the methionine biosynthesis path is predicted.

Кроме того, в качестве эволюционных событий фиксируют неортологичные замещения, оперонные перестройки, паралоги и дупликации, утрату ортологов или полную консервативность в структуре оперона.In addition, non-orthologic substitutions, operon rearrangements, paralogs and duplications, loss of orthologs, or complete conservatism in the structure of the operon are recorded as evolutionary events.

Кроме того, при фиксировании наличия паралогов и дупликаций используют эволюционные деревья, построение которых производят по методу максимального правдоподобия (maximum likelyhood) с помощью программы из программного пакета PHYLIP 3.63.In addition, when fixing the presence of paralogs and duplications, evolutionary trees are used, the construction of which is carried out by the maximum likelihood method using the program from the PHYLIP 3.63 software package.

Кроме того, при составлении исходной обучающей выборки формируют полные последовательности геномов актинобактерий на основе базы данных Gen Bank, поиск гомологов в базе данных производят с помощью программы BLAST, а построение множественных выравниваний аминокислот и нуклеотидных последовательностей осуществляют посредством алгоритмов программы ClustalX.In addition, when compiling the initial training sample, complete sequences of actinobacteria genomes are formed on the basis of the Gen Bank database, homologs are searched in the database using the BLAST program, and multiple alignments of amino acids and nucleotide sequences are constructed using the algorithms of the ClustalX program.

Предлагаемый способ был применен для регулона mcbR во всех геномах, где присутствует данный регулятор, - это семь геномов порядка Actinomycetales.The proposed method was applied to the mcbR regulon in all genomes where this regulator is present — these are seven genomes of the Actinomycetales order.

На фиг.1. представлена генетическая модель схемы биосинтеза метионина, отмечены используемые различными микроорганизмами (альтернативные) пути прямого сульфгидрилирования и транс-сульфурилирования (сокращения названий геномов: Cgl - C.glutamicum, Cdp - C.diphtheriae, Cef - C.effiiciens, Eco - Escherichia coli, Рае - Pseudomonas aeruginosa);In figure 1. a genetic model of methionine biosynthesis scheme is presented; (alternative) direct sulfhydrylation and trans-sulfurylation pathways used by various microorganisms (abbreviations of genome names: Cgl - C.glutamicum, Cdp - C. diphtheriae, Cef - C.effiiciens, Eco - Escherichia coli, Pae - Pseudomonas aeruginosa);

на фиг.2 показано эволюционное дерево McbR, выделена ветка, на которой находится McbR C.glutamicum и его ортологи;figure 2 shows the evolutionary tree McbR, highlighted the branch on which McbR C.glutamicum and its orthologs are located;

на фиг.3 представлен выход первого текстового файла в виде таблицы потенциальных сайтов связывания McbR перед генами пути биосинтеза метионина C.glutamicum и их ортологами в родственных геномах, имена генов и ортологов соответствуют названиям генов в геноме C.glutamicum за исключением генов DIP0611 C.diptheriae, у которого отсутствует ортолог в геноме C.glutamicum, и ортолога гена СЕ2636 C.efficiens в C.diphtheriae;figure 3 shows the output of the first text file in the form of a table of potential McbR binding sites in front of the genes of the C. glutamicum methionine biosynthesis pathway and their orthologs in related genomes, the names of the genes and orthologs correspond to the names of the genes in the C. glutamicum genome except for the Dip0611 C. diputriae genes , which lacks an ortholog in the C. glutamicum genome and an ortholog of the C.efficiens CE2636 gene in C. diphtheriae;

на фиг.4. представлен выход второго текстового файла в виде структуры пяти оперонов регулона McbR, претерпевших наибольшие эволюционные перестройки, тривиальные имена генов приведены для C.glutamicum, для ортологов, имеющих в GenBank другие названия, имена генов приведены в скобках над соответствующим геном, ортологичные гены имеют одинаковую контрастность (сокращения названий геномов: Cgl - C.glutamicum, Cdp - C.diphtheriae, Cef - C.effiiciens, Cjk - C.jeikeium, Nfa - Nocardia faricnica, Lxl - Leifsonia xyli и Scc - Streptomyces coelicolor);figure 4. the output of the second text file is presented in the form of the structure of five operons of the McbR regulon that underwent the largest evolutionary rearrangements, trivial gene names are given for C. glutamicum, for orthologs with different names in GenBank, gene names are shown in brackets above the corresponding gene, orthologous genes have the same contrast (genome abbreviations: Cgl - C.glutamicum, Cdp - C. diphtheriae, Cef - C.effiiciens, Cjk - C.jeikeium, Nfa - Nocardia faricnica, Lxl - Leifsonia xyli and Scc - Streptomyces coelicolor);

на фиг.5 показано эволюционное дерево Fpr, выделена ветка, на которой находятся Fpr C.jeikeium и его ортологи;figure 5 shows the evolutionary tree Fpr, highlighted the branch on which Fpr C.jeikeium and its orthologs are located;

на фиг.6 показано эволюционное дерево CysN, выделены ветки ортологов белков CysN и CysN2, белок Nfa33920 и его ближайшие гомологи из группы альфа-протеобактерий;figure 6 shows the evolutionary tree CysN, the branches of the orthologs of the proteins CysN and CysN2, the protein Nfa33920 and its closest homologues from the group of alpha proteobacteria are highlighted;

на фиг.7 показано эволюционное дерево CysD. Выделены ветки ортологов белков CysD и CysD2, белок Nfa33930 и его ближайшие гомологи из группы гамма-протеобактерий.7 shows the evolutionary tree of CysD. Branches of orthologs of the CysD and CysD2 proteins, the Nfa33930 protein, and its closest homologues from the gamma-proteobacteria group were identified.

Способ осуществляется следующим образом.The method is as follows.

Определение членов регулонаDefinition of members of regulon

Для поиска потенциальных сайтов связывания mcbR использовался метод матриц позиционных весов нуклеотидов [Mironov A.A., Koonin E.V., Roytberg M.A., Gelfand M.S. 1999. Computer analysis of transcription regulatory patterns in completely sequenced bacterial genomes. Nucleic Acid Res. 27,2981-2989]. Процедура построения такой матрицы для поиска mcbR-сайтов подробно описана ниже.To search for potential mcbR binding sites, the method of matrices of positional nucleotide weights was used [Mironov A.A., Koonin E.V., Roytberg M.A., Gelfand M.S. 1999. Computer analysis of transcription regulatory patterns in completely sequenced bacterial genomes. Nucleic Acid Res. 27.2981-2989]. The procedure for constructing such a matrix for searching mcbR sites is described in detail below.

Для определения принадлежности гена к регулону был применен метод проверки соответствия. Согласно данному методу ген считается членом регулона, если в его регуляторной области обнаружен потенциальный сайт, который сохраняется перед ортологичными генами в родственных геномах (там же).To determine whether a gene belongs to the regulon, a conformance check method was used. According to this method, a gene is considered a member of the regulon if a potential site is found in its regulatory region, which is stored before the orthologous genes in related genomes (ibid.).

Поиск потенциальных сайтов производился в области -400...+100 пар нуклеотидов относительно старта трансляции гена. В случае, когда оперонная структура данного фрагмента последовательности неизвестна, гены считались принадлежащими к одному оперону, если они имели одинаковое направление считывания, а расстояние между ними не превышало 100 пар нуклеотидовSearch for potential sites was carried out in the region of -400 ... + 100 pairs of nucleotides relative to the start of gene translation. In the case when the operon structure of this fragment of the sequence is unknown, the genes were considered to belong to the same operon if they had the same reading direction and the distance between them did not exceed 100 nucleotide pairs

Программное обеспечениеSoftware

Для поиска потенциальных сайтов связывания mcbR, а также анализа ортологов использовался пакет программ GenomeExplorer [Миронов А.А., Винокурова Н.П., Гельфанд М.С. 2000. Программное обеспечение анализа бактериальных геномов. Мол. Биол. 34, 253-262]. Для построения матриц позиционных весов была использована программа SignalX [там же]. Поиск гомологов в базах данных проводился с помощью программы BLAST [Altschul S.F., Madden T.L., Schaffer А.А., Zhang J., Zhang Z M.W., Lipman D.J. 1997. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acid Res. 25, 3389-3402]. Для построения множественных выравниваний аминокислотных и нуклеотидных последовательностей была использована программа ClustalX [Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. 1997. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acid Res. 25, 4876-4882]. Построение эволюционных деревьев производилось по методу максимального правдоподобия (maximum likelyhood) [Felsenstein J. 1996. Inferring phylogenies from protein sequences by parsimony, distance and likelihood methods. Methods Enzymol. 266, 418-427] с помощью программы proml из программного пакета PHYLIP 3.63 (http://evolution.genetics.washington.edu/).To search for potential mcbR binding sites, as well as the analysis of orthologs, the GenomeExplorer software package was used [A. Mironov, N. Vinokurova, M. S. Gelfand 2000. Bacterial Genome Analysis Software. Like Biol. 34, 253-262]. The SignalX program [ibid] was used to construct positional weight matrices. The homologs in the databases were searched using the BLAST program [Altschul S.F., Madden T.L., Schaffer A.A., Zhang J., Zhang Z M.W., Lipman D.J. 1997. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acid Res. 25, 3389-3402]. The ClustalX program [Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. was used to construct multiple alignments of amino acid and nucleotide sequences. 1997. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acid Res. 25, 4876-4882]. Evolutionary trees were constructed using the maximum likelihood method (Felsenstein J. 1996. Inferring phylogenies from protein sequences by parsimony, distance and likelihood methods. Methods Enzymol. 266, 418-427] using the proml program from the PHYLIP 3.63 software package (http://evolution.genetics.washington.edu/).

В общей сложности было рассмотрено 7 геномов актинобактерий. Полные последовательности геномов:A total of 7 actinobacterial genomes were examined. Complete genome sequences:

Corynebacterium glutamicum ATCC 13032 [Kalinowski J., Bathe В., Bartels D., Bischoff N., Bott M., Burkovski A., Dusch N., Eggeling L., Eikmanns B.J., Gaigalat L., Goesmann A., Hartmann M., Huthmacher K., Kramer R., Linke В., McHardy A.C., Meyer F., Mockel В., Pfefferle W., Puhler A., Rey D.A., Ruckert C., Rupp О., Sahm H., Wendisch V.F., Wiegrabe I., Tauch A. 2003. The complete Corynebacterium glutamicum ATCC 13032 genome sequence and its impact on the production of L-aspartate-derived amino acids and vitamins. J. Biotechnol. 104, 5-25],Corynebacterium glutamicum ATCC 13032 [Kalinowski J., Bathe B., Bartels D., Bischoff N., Bott M., Burkovski A., Dusch N., Eggeling L., Eikmanns BJ, Gaigalat L., Goesmann A., Hartmann M ., Huthmacher K., Kramer R., Linke B., McHardy AC, Meyer F., Mockel B., Pfefferle W., Puhler A., Rey DA, Ruckert C., Rupp O., Sahm H., Wendisch VF , Wiegrabe I., Tauch A. 2003. The complete Corynebacterium glutamicum ATCC 13032 genome sequence and its impact on the production of L-aspartate-derived amino acids and vitamins. J. Biotechnol. 104, 5-25],

Corynebacterium diphtheriae NCTC 13129 [Cerdeno-Tarraga A.M., Efstratiou A., Dover L.G., Holden M.T., Pallen M., Bentley S.D., Besra G.S., Churcher C., James K.D., De Zoysa A., Chillingworth Т., Cronin A., Dowd L., Feltwell Т., Hamlin N., Holroyd S., Jagels K., Moule S., Quail M.A., Rabbinowitsch E., Rutherford K.M., Thomson N.R., Unwin L., Whitehead S., Barrell B.G., Parkhill J. 2003. The complete genome sequence and analysis of Corynebacterium diphtheriae NCTC13129. Nucleic Acids Res. 31, 6516-6523],Corynebacterium diphtheriae NCTC 13129 [Cerdeno-Tarraga AM, Efstratiou A., Dover LG, Holden MT, Pallen M., Bentley SD, Besra GS, Churcher C., James KD, De Zoysa A., Chillingworth T., Cronin A., Dowd L., Feltwell T., Hamlin N., Holroyd S., Jagels K., Moule S., Quail MA, Rabbinowitsch E., Rutherford KM, Thomson NR, Unwin L., Whitehead S., Barrell BG, Parkhill J 2003. The complete genome sequence and analysis of Corynebacterium diphtheriae NCTC13129. Nucleic Acids Res. 31, 6516-6523],

Corynebacterium efficiens YS-314 [Nishio Y., Nakamura Y., Kawarabayasi Y., Usuda Y., Kimura E., Sugimoto S., Matsui K., Yamagishi A., Kikuchi H., Ikeo K., Gojobori T. 2003. Comparative complete genome sequence analysis of the amino acid replacements responsible for the thermostability of Corynebacterium efficiens. Genome Res. 13, 1572-1579],Corynebacterium efficiens YS-314 [Nishio Y., Nakamura Y., Kawarabayasi Y., Usuda Y., Kimura E., Sugimoto S., Matsui K., Yamagishi A., Kikuchi H., Ikeo K., Gojobori T. 2003 Comparative complete genome sequence analysis of the amino acid replacements responsible for the thermostability of Corynebacterium efficiens. Genome Res. 13, 1572-1579],

Corynebacterium jeikeium K411 [Tauch A., Kaiser O., Hain Т., Goesmann A., Weisshaar В., Albersmeier A., Bekel Т., Bischoff N., Brune I., Chakraborty Т., Kalinowski J., Meyer F., Rupp O., Schneiker S., Viehoever P., Puhler A. 2005. Complete genome sequence and analysis of the multiresistant nosocomial pathogen Corynebacterium jeikeium K411, a lipid-requiring bacterium of the human skin flora. J. Bacteriol. 187, 4671-4682],Corynebacterium jeikeium K411 [Tauch A., Kaiser O., Hain T., Goesmann A., Weisshaar B., Albersmeier A., Bekel T., Bischoff N., Brune I., Chakraborty T., Kalinowski J., Meyer F ., Rupp O., Schneiker S., Viehoever P., Puhler A. 2005. Complete genome sequence and analysis of the multiresistant nosocomial pathogen Corynebacterium jeikeium K411, a lipid-requiring bacterium of the human skin flora. J. Bacteriol. 187, 4671-4682],

Nocardia farcinica IFM 10152 [Ishikawa J., Yamashita A., Mikami Y., Hoshino Y., Kurita H., Hotta K., Shiba Т., Hattori M. 2004. The complete genomic sequence of Nocardia farcinica IFM 10152. Proc. Natl. Acad. Sci. USA. 101, 14925-14930],Nocardia farcinica IFM 10152 [Ishikawa J., Yamashita A., Mikami Y., Hoshino Y., Kurita H., Hotta K., Shiba T., Hattori M. 2004. The complete genomic sequence of Nocardia farcinica IFM 10152. Proc. Natl. Acad. Sci. USA 101, 14925-14930],

Leifsonia xyli subsp. xyli str. CTCB07 [Monteiro-Vitorello C.B., Camargo L.E., Van Sluys M.A., Kitajima J.P., Truffi D., do Amaral A.M., Harakava R., de Oliveira J.C., Wood D., de Oliveira M.C., Miyaki C., Takita M.A., da Silva A.C., Furlan L.R., Carraro D.M., Camarotte G., Almeida N.F. Jr., Carrer H., Coutinho L.L., El-Dorry H.A., Ferro M.I., Gagliardi P.R., Giglioti E., Goldman M.H., Goldman G.H., Kimura E.T., Ferro E.S., Kuramae E.E., Lemos E.G., Lemos M.V., Mauro S.M., Machado M.A., Marino C.L., Menck C.F., Nunes L.R., Oliveira R.C., Pereira G.G., Siqueira W., de Souza A.A., Tsai S.M., Zanca A.S., Simpson A.J., Brumbley S.M., Setubal J.C. 2004. The genome sequence of the gram-positive sugarcane pathogen Leifsonia xyli subsp. xyli. Mol. Plant. Microbe. Interact. 17, 827-836] иLeifsonia xyli subsp. xyli str. CTCB07 [Monteiro-Vitorello CB, Camargo LE, Van Sluys MA, Kitajima JP, Truffi D., do Amaral AM, Harakava R., de Oliveira JC, Wood D., de Oliveira MC, Miyaki C., Takita MA, da Silva AC, Furlan LR, Carraro DM, Camarotte G., Almeida NF Jr., Carrer H., Coutinho LL, El-Dorry HA, Ferro MI, Gagliardi PR, Giglioti E., Goldman MH, Goldman GH, Kimura ET, Ferro ES, Kuramae EE, Lemos EG, Lemos MV, Mauro SM, Machado MA, Marino CL, Menck CF, Nunes LR, Oliveira RC, Pereira GG, Siqueira W., de Souza AA, Tsai SM, Zanca AS, Simpson AJ, Brumbley SM, Setubal JC 2004. The genome sequence of the gram-positive sugarcane pathogen Leifsonia xyli subsp. xyli. Mol. Plant. Microbe. Interact 17, 827-836] and

Streptomyces coelicolor A3(2) [Redenbach M., Kieser H.M., Denapaite D., Eichner A., Cullum J., Kinashi H., Hopwood D.A. 1996. A set of ordered cosmids and a detailed genetic and physical map for the 8 Mb Streptomyces coelicolor A3(2) chromosome. Mol. Microbiol. 21, 77-96, а также Bentley S.D., Chater K.F., Cerdeno-Tarraga A.M., Challis G.L., Thomson N.R., James K.D., Harris D.E., Quail M.A., Kieser H., Harper D., Bateman A., Brown S., Chandra G., Chen C.W., Collins M., Cronin A., Fraser A., Goble A., Hidalgo J., Homsby Т., Howarth S., Huang C.H., Kieser Т., Larke L., Murphy L., Oliver K., O'Neil S., Rabbinowitsch E., Rajandream M.A., Rutherford K., Rutter S., Seeger K., Saunders D., Sharp S., Squares R., Squares S., Taylor K., Warren Т., Wietzorrek A., Woodward J., Barrell B.G., Parkhill J., Hopwood D.A. 2002. Complete genome sequence of the model actinomycete Streptomyces coelicolor A3(2). Nature. 417, 141-147]Streptomyces coelicolor A3 (2) [Redenbach M., Kieser H.M., Denapaite D., Eichner A., Cullum J., Kinashi H., Hopwood D.A. 1996. A set of ordered cosmids and a detailed genetic and physical map for the 8 Mb Streptomyces coelicolor A3 (2) chromosome. Mol. Microbiol. 21, 77-96, as well as Bentley SD, Chater KF, Cerdeno-Tarraga AM, Challis GL, Thomson NR, James KD, Harris DE, Quail MA, Kieser H., Harper D., Bateman A., Brown S., Chandra G., Chen CW, Collins M., Cronin A., Fraser A., Goble A., Hidalgo J., Homsby T., Howarth S., Huang CH, Kieser T., Larke L., Murphy L., Oliver K., O'Neil S., Rabbinowitsch E., Rajandream MA, Rutherford K., Rutter S., Seeger K., Saunders D., Sharp S., Squares R., Squares S., Taylor K., Warren T., Wietzorrek A., Woodward J., Barrell BG, Parkhill J., Hopwood DA 2002. Complete genome sequence of the model actinomycete Streptomyces coelicolor A3 (2). Nature. 417, 141-147]

были взяты из базы данных GenBank [Benson D.A., Boguski M.S., Lipman D.J., Ostell J., Ouellette B.F., Rapp B.A., Wheeler D.L. 1999. GenBank. Nucleic Acids Res. 27, 12-17].were taken from the GenBank database [Benson D.A., Boguski M.S., Lipman D.J., Ostell J., Ouellette B.F., Rapp B.A., Wheeler D.L. 1999. GenBank. Nucleic Acids Res. 27, 12-17].

Эволюционное дерево регулятора mcbR (фиг.2) свидетельствует, что данный регулятор сохраняется в геномах рода Corynebacterium (C.glutamicum, C.diphtheriae, C.efficiens и C.jeikeium), а также в других геномах порядка Actinomycetales, таких как Nocardia farcinica, Leifsonia xyli и Streptomyces coelicolor. Поэтому этапы способа применялись только для этих геномов.The evolutionary tree of the mcbR regulator (Fig. 2) indicates that this regulator is preserved in the genomes of the genus Corynebacterium (C. glutamicum, C. diphtheriae, C.efficiens and C.jeikeium), as well as in other genomes of the Actinomycetales order, such as Nocardia farcinica, Leifsonia xyli and Streptomyces coelicolor. Therefore, the steps of the method were applied only to these genomes.

Позиционное сравнениеPositional comparison

Для C.glutamicum уже были показаны гены метаболического пути и их организация в опероны [6]. При реализации предлагаемого способа был произведен поиск ортологов белков пути биосинтеза метионина в родственных геномах и предсказание их организации в опероны (см. фиг.4). Анализ предсказанных оперонных структур позволил выделить несколько типов эволюционных событий:Genes of the metabolic pathway and their organization into operons have already been shown for C. glutamicum [6]. When implementing the proposed method, a search was made for protein orthologs of the pathway of methionine biosynthesis in related genomes and the prediction of their organization into operons (see Fig. 4). An analysis of the predicted operon structures made it possible to identify several types of evolutionary events:

1. Неортологичные замещения. C.jeikeium, Nocardia farcinica, Leifsonia xyli и Streptomyces coelicolor используют треонин-синтазу (thrC), характерную для большинства актиномицет. Треонин-синтаза при этом входит в состав оперона с генами гомосерин-дегидрогеназы {hom или thrA) и гомосерин-киназы thrB. Последовательность генов в опероне может меняться, так в C.jeikeium и Nocardia farcinica оперон выглядит как hom-thrB-thrC, а в Leifsonia xyli и Streptomyces coelicolor- как hom-thrC-thrB (фиг.4, позиция Д).1. Non-orthologic substitutions. C.jeikeium, Nocardia farcinica, Leifsonia xyli and Streptomyces coelicolor use threonine synthase (thrC), which is typical for most actinomycetes. At the same time, threonine synthase is part of the operon with the genes homoserine dehydrogenase (hom or thrA) and homoserine kinase thrB. The sequence of genes in the operon can vary, so in C.jeikeium and Nocardia farcinica the operon looks like hom-thrB-thrC, and in Leifsonia xyli and Streptomyces coelicolor-like hom-thrC-thrB (Fig. 4, position D).

В то же время в геномах C.glutamicum, C.diphtheriae и C.efficiens функции треонин-синтазы выполняет белок, не ортологичный thrC актиномицет. Его картирование и функциональность были проверены экспериментально, хотя происхождение этого белка не очевидно. Характерно, что эта треонин-синтаза уже не входит в состав оперона и таким образом образуется два независимых оперона: hom-thrB и нерегулируемый моноцистронный оперон thrC, расположенные в разных частях генома (фиг.4, позиция Д).At the same time, in the genomes of C. glutamicum, C. diphtheriae and C.efficiens, the function of threonine synthase is performed by a protein that is not orthologous to thrC actinomycete. Its mapping and functionality has been tested experimentally, although the origin of this protein is not obvious. Characteristically, this threonine synthase is no longer part of the operon and thus two independent operons are formed: hom-thrB and unregulated monocistronic operon thrC, located in different parts of the genome (Fig. 4, position D).

Для почвенных бактерий одними из основных источников серы являются сульфатные эфиры и сульфонаты. Сульфатные эфиры утилизуются посредством сульфатаз, которые присутствуют практически в каждом микроорганизме. Тем не менее, в геноме C.glutamicum для усвоения сульфатных эфиров есть отдельный оперон seuABC, кодирующий три потенциальных фермента десульфуризации [6], в состав которого также входит ssuD2 (см. ниже). Утилизация же сульфонатов требует обязательного наличия специфических ферментов. Во всех описанных случаях гены утилизации сульфонатов формируют один оперон, включающий в себя АВС-транспортер и NAD(Р)Н-зависимую монооксигеназу. Для C.glutamicum это оперон ssuABC-D1 (ssu - sulfonate-sulfur utilization) описан в [Koch D.J., Ruckert С., Rey D.A., Mix A., Puhler A., Kalinowski J. 2005. Role of the ssu and seu genes of Corynebacterium glulamicum ATCC 13032 in utilization of sulfonates and sulfonate esters as sulfur sources. Appl. Environ. Microbiol. 71, 6104-6114]. Интересно, что во всех исследованных геномах оба оперона практически полностью утрачены (см. ниже), однако в геноме C.efficiens в опероне утилизации сульфата cysIXHDNYZ (фиг.4, позиция А) появляется новый потенциальный член - СЕ2637, ближайшими ортологами которого являются члены белкового семейства люцифераз из геномов протеобактерий. Поиск консервативных белковых доменов в GenBank позволяет более точно предсказать функцию белка СЕ2637 как алкансульфонат-монооксигеназы, которая, по всей видимости, появилась в геноме C.efficiens вследствие неортологичного замещения. В опероне утилизации сульфата нет АВС-транспортера, однако субстрат для алкансульфонат-монооксигеназы, возможно, поставляется одним из двух АВС-транспортеров (cg0735-cg0737 и cg2675-cg2678 в геноме C.glutamicum) с неизвестной специфичностью. Оба транспортера и регуляторные сигналы перед кодирующими их оперонами (см. ниже) сохраняются в геноме C.efficiens (фиг.4, позиция А).For soil bacteria, sulfate esters and sulfonates are one of the main sources of sulfur. Sulphate esters are utilized through sulfatases, which are present in almost every microorganism. Nevertheless, the C. glutamicum genome for assimilation of sulfate esters contains a separate seuABC operon encoding three potential desulfurization enzymes [6], which also includes ssuD2 (see below). The disposal of sulfonates requires the presence of specific enzymes. In all the cases described, the sulfonate utilization genes form one operon, which includes the ABC transporter and NAD (P) H-dependent monooxygenase. For C. glutamicum, this is the ssuABC-D1 operon (ssu - sulfonate-sulfur utilization) operon described in [Koch DJ, Ruckert C., Rey DA, Mix A., Puhler A., Kalinowski J. 2005. Role of the ssu and seu genes of Corynebacterium glulamicum ATCC 13032 in utilization of sulfonates and sulfonate esters as sulfur sources. Appl. Environ. Microbiol. 71, 6104-6114]. Interestingly, in both genomes studied, both operons are almost completely lost (see below), however, a new potential member appears in the genome of C.efficiens in the cysIXHDNYZ sulfate utilization operon (Fig. 4, position A), the nearest orthologs of which are members of the protein luciferase families from proteobacterial genomes. A search for conservative protein domains in GenBank allows us to more accurately predict the function of the CE2637 protein as an alkanesulfonate monooxygenase, which appears to have appeared in the C.efficiens genome due to non-orthologous substitution. The sulfate utilization operon does not have an ABC transporter; however, the substrate for alkanesulfonate monooxygenase is probably supplied by one of two ABC transporters (cg0735-cg0737 and cg2675-cg2678 in the C. glutamicum genome) with unknown specificity. Both transporters and regulatory signals in front of the operons encoding them (see below) are stored in the C.efficiens genome (Fig. 4, position A).

2. Оперонные перестройки. Выше уже упоминалась ситуация с перестановкой генов в опероне thrABC. Аналогичные случаи характерны и для других оперонов. Так, гены гомосерин-ацетилтрансферазы (metX) и ацетилгомосерин-лиазы (metY) в разных геномах по-разному расположены относительно друг друга (фиг.4, позиция Г). В геноме C.glutamicum они находятся рядом, транскрибируются в одном направлении, расстояние между генами относительно невелико - 144 пары нуклеотидов и, тем не менее, гены разделены потенциальным терминатором [6]. В геномах C.diphtheriae и Nocardia farcinica эти гены также транскрибируются в одном направлении, однако уже сильно разнесены по геному. Для геномов C.efficiens и C.jeikeium характерно формирование единого оперона metXY. Кроме того, возможно и дивергентное расположение этих генов, когда metY (здесь cysD) расположен конвергентно с геном потенциальной дегидрогеназы, а дивергентно к ним расположен ген metX (здесь metA). Такая ситуация наблюдается в геноме Leifsoma xyli (фиг.4, позиция Г).2. Operon rearrangements. The situation with gene permutation in the thrABC operon has already been mentioned. Similar cases are characteristic of other operons. So, the genes of homoserine acetyltransferase (metX) and acetyl homoserine lyase (metY) in different genomes are located differently relative to each other (Fig. 4, position D). In the C. glutamicum genome, they are nearby, are transcribed in one direction, the distance between the genes is relatively small - 144 pairs of nucleotides and, nevertheless, the genes are separated by a potential terminator [6]. In the genomes of C. diphtheriae and Nocardia farcinica, these genes are also transcribed in the same direction, but they are already widely spaced across the genome. The genomes of C.efficiens and C.jeikeium are characterized by the formation of a single metXY operon. In addition, a divergent arrangement of these genes is possible when metY (here cysD) is located convergent with the potential dehydrogenase gene, and the metX gene (here metA) is diverged to them. This situation is observed in the genome of Leifsoma xyli (Fig. 4, position D).

Внутриоперонные перестановки генов характерны и для оперона cg0735-cg0737, кодирующего АВС-переносчик неизвестного субстрата (фиг.4, позиция В). В геномах рода Corynebacterium (кроме C.diphtheriae) так же, как и в геномах Nocardia farcinica и Leifsonia xyli, структура оперона сохраняется, тогда как в геноме Streptomyces coelicolor он изменен на cg0737-cg0735-cg0736. В геноме C.diphtheriae оперон удлинен за счет появления паралога белка cg0737 перед опероном. Возможно, удлинение оперона наблюдается и на примере регулятора mcbR (см. ниже).Intraperon gene permutations are also characteristic of the cg0735-cg0737 operon encoding the ABC carrier of an unknown substrate (Fig. 4, position B). In the genomes of the genus Corynebacterium (except C. diphtheriae), as in the genomes of Nocardia farcinica and Leifsonia xyli, the structure of the operon is preserved, while in the genome of Streptomyces coelicolor it is changed to cg0737-cg0735-cg0736. In the genome of C. diphtheriae, the operon is elongated due to the appearance of the paralog of protein cg0737 before the operon. It is possible that the lengthening of the operon is also observed using the mcbR regulator as an example (see below).

В уже упоминавшемся выше опероне утилизации сульфата с геноме Streptomyces coelicolor в центре оперона cysIXHCDN возникает новый член, cysC, потенциально кодирующий аденилилсульфат-киназу (фиг.4, позиция А). Происхождение этого белка не очевидно, поскольку его ортологи присутствуют только в геномах рода Streptomyces. В гомологичном опероне cysIXHDNYZB C.efficiens, помимо алкансульфонат-монооксигеназы (см. выше), появляется еще один новый потенциальный член регулона (фиг.4, позиция А), кодирующий метилтиоаденозин-нуклеозидазу (см. ниже). Ортологи этого белка среди рассматриваемых геномов находятся также в C.glutamicum и C.diphtheriae, где образуют моноцистронные опероны.In the sulfate recycling operon already mentioned above with the Streptomyces coelicolor genome, a new member appears in the center of the cysIXHCDN operon, cysC, potentially encoding adenylyl sulfate kinase (Fig. 4, position A). The origin of this protein is not obvious, since its orthologs are present only in the genomes of the genus Streptomyces. In the homologous operon cysIXHDNYZB C.efficiens, in addition to the alkanesulfonate monooxygenase (see above), another new potential termulon member appears (Fig. 4, position A) encoding methylthioadenosine nucleosidase (see below). Orthologs of this protein among the genomes under consideration are also in C. glutamicum and C. diphtheriae, where they form monocistronic operons.

Оперон cg2679 C.glutamicum, дивергентно расположенный к оперону cg2674-cg2678 [6], может включать в себя и ген cg2680 (кодирующий аминотрансферазу), поскольку межгенное расстояние составляет всего 52 пары нуклеотидов и потенциального Rho-независимого терминатора между этими генами не было предсказано [6]. Дивергон cg2574-cg2680 консервативен только в геноме C.efficiens и полностью утрачен во всех остальных геномах. Только для гена cg2680 присутствует ортолог в геноме C.jeikeium, где он входит в состав другого регулируемого оперона (фиг.4, позиция Б), также включающего в себя aecD (цистатионин-бегалиаза) и ywjA (АТФаза АВС-транспортера). В геномах C.glutamicum и C.efficiens ортологи гена ywjA формируют моноцистронные нерегулируемые опероны, а ортологи гена aecD входят в состав нерегулируемого оперона, также включающего в себя ген brnQ (переносчик аминокислот с разветвленной цепью) и алканал-монооксигеназу, кодируемую геном сg2538 (фиг.4, позиция Б). В геноме С.diphtheriae ортолог гена ywjA входит в состав нерегулируемого оперона aecD-brnQ-DIP1738 [DIP 1738 кодирует алканал-монооксигеназу). В геноме C.jeikeium ортологичные гены алканал-монооксигеназы и транспортера аминокислот с разветвленной цепью формируют нерегулируемые моноцистронные опероны (фиг.4, позиция Б).The operon cg2679 C.glutamicum divergent to the operon cg2674-cg2678 [6] may include the cg2680 gene (encoding aminotransferase), since the intergenic distance is only 52 pairs of nucleotides and a potential Rho-independent terminator between these genes was not predicted [ 6]. The divergon cg2574-cg2680 is conservative only in the C.efficiens genome and is completely lost in all other genomes. Only for the cg2680 gene is there an ortholog in the C.jeikeium genome, where it is part of another regulated operon (Fig. 4, position B), which also includes aecD (cystathionine-begaliasis) and ywjA (ATPase ABC transporter). In the genomes of C. glutamicum and C.efficiens, the orthologs of the ywjA gene form monocistronic unregulated operons, and the orthologs of the aecD gene form part of the unregulated operon, which also includes the brnQ gene (branched chain amino acid carrier) and the alkane-monooxygenase encoded by (Fig. 25) .4, position B). In the C. diphtheriae genome, the ortholog of the ywjA gene is part of the unregulated operon aecD-brnQ-DIP1738 [DIP 1738 encodes alkanal monooxygenase). In the C.jeikeium genome, orthologous genes of the alkanal monooxygenase and the branched chain amino acid transporter form unregulated monocistronic operons (Fig. 4, position B).

3. Паралоги и дупликации. Выше уже описана ситуация с появлением в С.diphtheriae паралога белка cg0737 в опероне, ортологичном cg0735-cg0737 C.glutamicum (фиг.4, позиция В). Кроме того, в геноме C.glufamicum произошла дупликация белка ssuD Nocardia farcinica, кодирующего алкансульфонат-монооксигеназу, с образованием паралогов ssuD1 и ssuD2, вероятно, выполняющих ту же функцию. Ген ssuDl входит в состав оперона ssuABC-D1, отвечающего за утилизацию сульфонатов. Ген ssuD2 включен в оперон утилизации сульфатных эфиров seuABC-ssuD1. Оба оперона полностью утрачены во всех исследованных геномах, кроме Nocardia farcinica, где, помимо белка ssuD, сохраняется и ортолог гена seuA, кодирующего фермент десульфуризации. Оба гена формируют оперон, в состав которого также, вероятно, входит fadE14, кодирующий потенциальную ацилКоА-дегидрогеназу.3. Paralogs and duplications. The situation with the appearance of the cg0737 protein paralog in C. diphtheriae in an operon orthologous to cgl0735-cg0737 C.glutamicum has already been described above (Fig. 4, position B). In addition, the ssuD protein of Nocardia farcinica encoding the alkanesulfonate monooxygenase duplicated in the C.glufamicum genome to form ssuD1 and ssuD2 paralogs, probably performing the same function. The ssuDl gene is part of the ssuABC-D1 operon, which is responsible for the disposal of sulfonates. The ssuD2 gene is included in the seuABC-ssuD1 sulfate ester utilization operon. Both operons are completely lost in all genomes studied, except Nocardia farcinica, where, in addition to the ssuD protein, the ortholog of the seuA gene encoding the desulfurization enzyme is also preserved. Both genes form an operon, which also probably contains fadE14, which encodes a potential acylCoA dehydrogenase.

Дивергентно к оперону утилизации сульфата (cysIXHDNYZ) расположен ген cysJ/fpr2 (сульфат-редуктаза), причем он консервативен во всех исследованных геномах, несмотря на то, что основной оперон может быть полностью утрачен (фиг.4, позиция А). Нужно отметить, что на эволюционном дереве (фиг.5) все ортологи расположены на одной ветке за исключением fpr белка Leifsonia xyli, который расположен ближе к Arthobacter и Brevibacterium. В каждом из исследованных геномов белок fpr представлен в виде одной копии, тогда как в геномах С.efficiens и C.glutamicum - в виде двух паралогов, fpr1 и frp2 (фиг.5). В каждом из двух геномов один из паралогов входит в состав дивергона утилизации сульфата, второй формирует моноцистронный нерегулируемый оперон.The cysJ / fpr2 gene (sulfate reductase) is located divergent to the sulfate utilization operon (cysIXHDNYZ), and it is conservative in all genomes studied, despite the fact that the main operon can be completely lost (Fig. 4, position A). It should be noted that on the evolutionary tree (Fig. 5), all orthologs are located on the same branch except for the fpr protein Leifsonia xyli, which is located closer to Arthobacter and Brevibacterium. In each of the studied genomes, the fpr protein is represented as a single copy, while in the genomes of C.efficiens and C.glutamicum, in the form of two paralogs, fpr1 and frp2 (Fig. 5). In each of the two genomes, one of the paralogs is part of the sulfate utilization divergon, and the second forms a monocistronic unregulated operon.

Для того же оперона утилизации сульфата (cysIHDNY) в разных частях генома Nocardia farcinica наблюдается наличие двух дополнительных пар генов, ортологичных генам cysDN, кодирующим АТФ-сульфурилазу, - cysD2-N2 и nfa33930-nfa33920. На эволюционных деревьях белков CysN (фиг.6) и CysD (фиг.7) видно, что ближайшими гомологами белков CysD2 и CysN2 у Nocardia farcinica являются белки бактерий рода Mycobacterium и, по всей видимости, пара генов cysD2-N2 в геноме Nocardia farcinica появилась вследствие горизонтального переноса от других бактерий порядка Actinomycetales (вероятнее всего, от бактерий рода Mycobacterium). Аналогично, для белков, кодируемых генами nfa33930-nfa33920, ближайшими гомологами являются белки протеобактерий (фиг.6 и 7) и, скорее всего, пара генов nfa33930-nfa33920 в геноме Nocardia farcinica также появилась в результате горизонтального переноса, но в данном случае от геномов протеобактерий. В обоих случаях (cysD2-N2 и nfa33930-nfa33920) гены предположительно формируют опероны (о регуляции см. ниже).For the same sulfate utilization operon (cysIHDNY) in different parts of the Nocardia farcinica genome, there are two additional pairs of genes orthologous to the cysDN genes encoding ATP sulfurylase, cysD2-N2 and nfa33930-nfa33920. On the evolutionary trees of the CysN proteins (Fig. 6) and CysD (Fig. 7), it is seen that the closest homologs of the CysD2 and CysN2 proteins in Nocardia farcinica are bacteria proteins of the genus Mycobacterium and, most likely, a pair of cysD2-N2 genes appeared in the Nocardia farcinica genome due to horizontal transfer from other bacteria of the Actinomycetales order (most likely, from bacteria of the genus Mycobacterium). Similarly, for the proteins encoded by the nfa33930-nfa33920 genes, the closest homologs are the proteins of the proteobacteria (Figs. 6 and 7) and, most likely, the pair of nfa33930-nfa33920 genes in the Nocardia farcinica genome also appeared as a result of horizontal transfer, but in this case from the genomes proteobacteria. In both cases (cysD2-N2 and nfa33930-nfa33920), genes presumably form operons (for regulation, see below).

4. Утрата ортологов. Полное отсутствие ортологов наблюдается в случае следующих генов C.glutamicum: ssuR (регулятор генов утилизации сульфонатов и сульфатных эфиров), cg3372 (белок с неизвестной функцией), ssul (флавин-редуктаза), seuBC и ssuABC (см. выше). Многие ортологи утрачены только в филогенетически более далеких геномах. Так, в геномах Nocardia farcinica, Leifsonia xyli и Streptomyces coelicolor отсутствуют ортологи генов cysK (ацетилсерин-лиаза), cysE (серин-ацетилтрансфераза), aecD (см. выше) и brnQ (см. выше) C.glutamicum и ортологи гена ywjA C.jeikeium. В далеких геномах также отсутствует ортолог гена cg1739 (см. ниже). Некоторые ортологи были утрачены не только в более далеких геномах, но также в геномах C.diphtheriae и C.jeikeium, - это почти все гены оперона, ортологичного оперону cg2674-2680 C.glutamicum (см. выше), и ортологи гена cg3132 с неизвестной функцией. В геномах всех далеких организмов и в C.jeikeium отсутствуют ортологи потенциального транскрипционного регулятора cg0156.4. The loss of orthologs. A complete absence of orthologs is observed in the case of the following C. glutamicum genes: ssuR (regulator of the utilization of sulfonate and sulfate ester genes), cg3372 (protein with unknown function), ssul (flavin reductase), seuBC and ssuABC (see above). Many orthologs are lost only in phylogenetically more distant genomes. Thus, in the genomes of Nocardia farcinica, Leifsonia xyli, and Streptomyces coelicolor, there are no orthologs of the cysK (acetylserine-lyase), cysE (serine-acetyltransferase), aecD (see above) and brnQ (see above) and brnQ orthologs of the gene ywj orthologs .jeikeium. The distant genomes also lack an ortholog of the cg1739 gene (see below). Some orthologs were lost not only in the more distant genomes, but also in the genomes of C. diphtheriae and C. jeikeium - these are almost all genes of the operon orthologous to the cg2674-2680 C. glutamicum operon (see above), and the orthologs of the cg3132 gene with unknown function. In the genomes of all distant organisms and in C.jeikeium there are no orthologs of the potential transcriptional regulator cg0156.

Среди более частных случаев можно выделить утрату ортологов генов seuA и ssuD (см. выше) во всех изученных геномах, кроме Nocardia farcinica. Также не найдены ортологи генов metX и metY в геноме Strepromyces coelicolor, гена metB (цистатионин-гамма-синтаза) в геноме C.diphtheriae, гена metH (гомоцистеин-метилтрансфераза) в геномах C.jeikeium и Leifsonia xyli, генов etfAB (флавопротеин) в геноме Leifsonia xyli.Among more specific cases, one can single out the loss of orthologs of the seuA and ssuD genes (see above) in all studied genomes except Nocardia farcinica. No metX and metY gene orthologs were found in the Strepromyces coelicolor genome, metB gene (cystathionine-gamma-synthase) in the C. diphtheriae genome, metH gene (homocysteine methyltransferase) in the C.jeikeium and Leifsonia xyli genomes, etfAB genes (etfAB the genome of Leifsonia xyli.

Ортологи гена metE (гомоцистеин-метилтрансфераза) и оперон утилизации сульфата cysIXHDNYZ (фиг.4, позиция А) полностью утрачены в геномах C.diphtheriae и Leifsonia xyli. В состав оперона cysIXHDNYZ C.glutamicum входит короткий белок cysX (потенциально участвует в переносе электронов), ортологи которого сохраняются в геномах C.efficiens, C.jeikeium и Streptomyces coelicolor (фиг.4, позиция А). Среди геномов, сохранивших оперон утилизации сульфата, в геноме Streptomyces coelicolor отсутствуют ортологи генов cysYZ (cys Y принимает участие в биосинтезе кофактора, cysZ - потенциальная сульфат-пермеаза), а в геноме Nocardia farcinica отсутствуют ортологи белков cysX и cysZ.Orthologs of the metE gene (homocysteine methyltransferase) and cysIXHDNYZ sulfate utilization operon (Fig. 4, position A) are completely lost in the genomes of C. diphtheriae and Leifsonia xyli. The cysIXHDNYZ C. glutamicum operon contains the short cysX protein (potentially involved in electron transfer), whose orthologs are preserved in the genomes of C.efficiens, C.jeikeium and Streptomyces coelicolor (Fig. 4, position A). Among the genomes that preserved the sulfate utilization operon, the genome of Streptomyces coelicolor lacks the orthologs of the cysYZ genes (cys Y takes part in the cofactor biosynthesis, cysZ is the potential sulfate permease), and the orthologs of the cysX and cysZ proteins are absent in the Nocardia farcinica genome.

5. Полная консервативность в структуре оперона во всех изученных геномах наблюдается только в случае гена metK (аденозилметионин-синтаза) и, возможно, гена mcbR (см. ниже).5. Complete conservatism in the structure of the operon in all studied genomes is observed only in the case of the metK gene (adenosylmethionine synthase) and, possibly, the mcbR gene (see below).

В работе [6] были предсказаны регуляторные мотивы перед практически всеми членами регулона McbR в C.glutamicum и некоторые их них были подтверждены экспериментально. Был также представлен консенсус палиндромного сайта связывания регулятора вида TAGAC-N6-GTCTA. При осуществлении предлагаемого способа поиск по консенсусу подтвердил предсказание регуляторных сигналов перед ферментами, участвующими в биосинтезе метионина, и на основании предсказанных и подтвержденных экспериментально сигналов была составлена исходная обучающая выборка и построена матрица для поиска сайтов связывания McbR.In [6], regulatory motifs were predicted for almost all members of the McbR regulon in C. glutamicum, and some of them were confirmed experimentally. A consensus palindromic binding site of a regulator of the species TAGAC-N6-GTCTA was also presented. In the implementation of the proposed method, a consensus search confirmed the prediction of regulatory signals before the enzymes involved in methionine biosynthesis, and based on the predicted and experimentally confirmed signals, an initial training sample was compiled and a matrix was constructed to search for McbR binding sites.

В геномах рода Corynebacterium проводился поиск сайтов с весом выше порогового значения 4,1. Все найденные потенциальные сайты связывания McbR представлены на фиг.3.In the genomes of the genus Corynebacterium, sites with a weight above the threshold value of 4.1 were searched. All potential McbR binding sites found are shown in FIG.

В геноме C.glutamicum, помимо уже предсказанных [6] сигналов, был обнаружен новый потенциальный сайт связывания McbR - перед геном cg1739, кодирующим белок с консервативным доменом глутамин-амидотрансферазы. Ортологи данного белка представлены во всех геномах рода Corynebacterium и отсутствуют в более филогенетически далеких организмах. Перед всеми ортологами этого белка был предсказан сайт связывания с весом выше заданного порогового значения (фиг.3), таким образом, согласно методу процедуры проверки соответствия ген cg1739 является новым потенциальным членом регулона McbR. Косвенным экспериментальным подтверждением этого предсказания является активация экспрессии этого гена в делеционном mcbR-мутанте C.glutamicum [6].In addition to the signals already predicted [6], a new potential McbR binding site was discovered in the C. glutamicum genome - in front of the cg1739 gene, which encodes a protein with a conserved glutamine amidotransferase domain. Orthologs of this protein are present in all genomes of the genus Corynebacterium and are absent in more phylogenetically distant organisms. Before all orthologs of this protein, a binding site with a weight higher than a predetermined threshold value was predicted (Fig. 3), thus, according to the method of checking the correspondence, the cg1739 gene is a new potential member of the McbR regulon. An indirect experimental confirmation of this prediction is the activation of the expression of this gene in the deletion mcbR mutant C.glutamicum [6].

Перед основной частью регулируемых ортологов генов C.glutamicum в других геномах рода Corynebacterium также предсказаны потенциальные сайты связывания регулятора McbR (фиг.3). Так, сигнал сохраняется перед всеми найденными в этих геномах ортологами генов metK, metH, metE, metB, cysK и cg3132 и перед генами дивергона cg2674-cg2680.Before the main part of the regulated orthologs of the C. glutamicum genes in other genomes of the genus Corynebacterium, potential binding sites of the McbR regulator are also predicted (Fig. 3). So, the signal is saved before all the orthologs of the metK, metH, metE, metB, cysK and cg3132 genes found in these genomes and before the cg2674-cg2680 divergon genes.

Однако иногда даже в близких геномах рода Corynebacterium регуляторные сигналы отсутствуют перед ортологичными генами. Так, оперон hom-thrB, регулируемый в C.glutamicum, содержит потенциальные сигналы перед гомологичными оперонами только в геномах С.efficiens и C.jeikeium, но не в C.diphtheriae (фиг.4, позиция Д). Для гена cg0156 ситуация обратная: ортолог данного гена в C.diphtheriae сохраняет сайт связывания регулятора, тогда как ортолог в C.efficiens - нет (фиг.3). В случае оперона etfAB регуляция сохраняется только перед ортологичным опероном в геноме C.efficiens.However, sometimes even in close genomes of the genus Corynebacterium, regulatory signals are absent before orthologous genes. So, the hom-thrB operon regulated in C. glutamicum contains potential signals for homologous operons only in the genomes of C. efficiens and C. jeikeium, and not in C. diphtheriae (Fig. 4, position D). For the cg0156 gene, the situation is the opposite: the ortholog of this gene in C. diphtheriae maintains the binding site of the regulator, while the ortholog in C.efficiens does not (Fig. 3). In the case of the etfAB operon, regulation is preserved only before the orthologous operon in the C.efficiens genome.

К более частным случаям относится регуляция генов гомосерин-ацетилтрансферазы (metX) и ацетилгомосерин-лиазы (metY). Гены metX и metY в геноме C.glutamicum расположены тандемно, но разделены потенциальным Rho-независимым терминатором [6] и перед каждым из генов находится сайт связывания McbR. В геноме C.diphtheriae эти гены формируют моноцистронные опероны, разнесенные по геному, перед каждым из генов сохраняется регуляторный сигнал (фиг.3). В геномах C.efficiens и C.jeikeium присутствует уже единый регулируемый бицистронный оперон metYX, сайт связывания McbR находится перед первым геном оперона metY (фиг.4, позиция Г).More specific cases include the regulation of homoserine acetyltransferase (metX) and acetyl homoserine lyase (metY) genes. The metX and metY genes in the C. glutamicum genome are located in tandem, but separated by a potential Rho-independent terminator [6] and there is a McbR binding site in front of each of the genes. In the genome of C. diphtheriae, these genes form monocistronic operons spaced across the genome, a regulatory signal is stored in front of each of the genes (Fig. 3). In the genomes of C.efficiens and C.jeikeium there is already a single regulated bicistronic operon metYX, the McbR binding site is located in front of the first gene of the operon metY (Fig. 4, position D).

В геноме C.diphtheriae перед опероном DIP0608-DIP0610, гомологичным оперону cg0735-cg0737 C.glitamicum, появляется паралог гена DIP0610-DIP0611, который образует независимый моноцистронный оперон. Сайты связывания регулятора расположены перед всеми ортологами гена cg0737 в геномах рода Corynebacterium, a также перед геном DJP0611 (фиг.4, позиция В, фиг.3).In the C.diphtheriae genome, before the operon DIP0608-DIP0610, homologous to the operon cg0735-cg0737 C.glitamicum, the paralogue of the DIP0610-DIP0611 gene appears, which forms an independent monocistronic operon. Regulator binding sites are located in front of all orthologs of the cg0737 gene in the genomes of the genus Corynebacterium, as well as in front of the DJP0611 gene (Fig. 4, position B, Fig. 3).

Для транскрипционного регулятора MbR была предсказана и экспериментально подтверждена авторегуляция. Среди ортологов регулятора в геномах рода Corynebacterium авторегуляция сохраняется в геноме C.diphtheriae и утрачивается в геноме C.jeikeium. Для генома C.efficiens перед геном mcbR предсказана тандемная, перекрывающаяся с ним на 28 пар нуклеотидов, короткая открытая рамка считывания, кодирующая гипотетический белок из 57 аминокислотных остатков. Потенциальный сайт связывания mcbR при этом расположен в регуляторной области этого гипотетического гена. Однако для этого гипотетического белка не существует ни одного ортолога среди всех белков базы данных GenBank и, возможно, он является результатом перепредсказания при картировании генома С.efficiens. Если это верно, оперон mcbR полностью консервативен во всех исследованных геномах и сайт связывания регулятора в геноме C.efficiens расположен на расстоянии - 143 пар нуклеотидов от точки старта трансляции гена mcbR.For the transcriptional regulator MbR, autoregulation was predicted and experimentally confirmed. Among regulator orthologs in the genomes of the genus Corynebacterium, autoregulation is preserved in the genome of C. diphtheriae and is lost in the genome of C.jeikeium. For the C.efficiens genome, a tandem is predicted in front of the mcbR gene, overlapping with it by 28 pairs of nucleotides, a short open reading frame encoding a hypothetical protein of 57 amino acid residues. A potential mcbR binding site is located in the regulatory region of this hypothetical gene. However, for this hypothetical protein, there is not a single ortholog among all the proteins of the GenBank database and, possibly, it is the result of re-prediction during mapping of the C.efficiens genome. If this is true, the mcbR operon is completely conserved in all studied genomes, and the regulatory binding site in the C.efficiens genome is located at a distance of 143 nucleotides from the translation start point of the mcbR gene.

Выше были описаны оперонные перестройки ортологов, в которых участвуют ортологи генов aecD, brnQ и монооксигеназы C.glutamicum и ортологи гена ywjA C.jeikeium (фиг.4, позиция Б). В геномах C.glutamicum, C.diphtheriae и C.efficiens все эти гены (и их ортологи) не регулируются McbR. В геноме C.jeikeium гены, кодирующие монооксигеназу и белок brnQ, формируют два нерегулируемых моноцистронных оперона, тогда как гены aecD, ywjA и ортолог гена cg2680 C.glutamicum находятся в едином, потенциально регулирующемся опероне - перед геном aecD находится предсказанный сайт связывания McbR (фиг.4, позиция Б, фиг.3).The operon rearrangements of orthologs were described above, in which the orthologs of the aecD, brnQ genes and C. glutamicum monooxygenase and the orthologs of the C. jeikeium ywjA gene are involved (Fig. 4, position B). In the genomes of C. glutamicum, C. diphtheriae and C.efficiens, all of these genes (and their orthologs) are not regulated by McbR. In the C.jeikeium genome, genes encoding monooxygenase and brnQ protein form two unregulated monocistronic operons, while the aecD, ywjA genes and the ortholog of the cg2680 C.glutamicum gene are in a single, potentially regulated operon - the predicted McE binding site is in front of the aecD gene (Mcb .4, position B, Fig. 3).

Дивергоны, гомологичные дивергону утилизации сульфата cysJIXHDNZY C.glutamicum, сохраняют регуляцию со стороны McbR в геномах C.efficiens и C.jeikeium, в которых этот дивергон сохранился (фиг.4, позиция А). Структура оперона консервативна во всех трех геномах, однако межгенные расстояния отличаются. В геномах C.glutamicum и C.efficiens расстояние между генами cysXvi cysH составляет - 3 пары нуклеотидов, тогда как в геноме C.jeikeium - 247 пар нуклеотидов. То, что гены cysHDNYZ образуют самостоятельный оперон, подтверждается наличием перед геном cysH потенциального сайта связывания McbR (фиг.4, позиция А, фиг.3). Тем самым гены утилизации сульфата в C.jeikeium образуют дивергон cysJIX и оперон cysHDNYZ.Divergons homologous to the cysJIXHDNZY C.glutamicum sulfate utilization divergon retain McbR regulation in the C.efficiens and C.jeikeium genomes in which this divergon has survived (Fig. 4, position A). The structure of the operon is conservative in all three genomes, but the intergenic distances are different. In the C. glutamicum and C.efficiens genomes, the distance between the cysXvi cysH genes is 3 nucleotide pairs, while in the C.jeikeium genome there are 247 nucleotide pairs. The fact that the cysHDNYZ genes form an independent operon is confirmed by the presence of a potential McbR binding site in front of the cysH gene (Fig. 4, position A, Fig. 3). Thus, the sulfate utilization genes in C.jeikeium form the cysJIX divergon and the cysHDNYZ operon.

Как уже упоминалось, в геноме C.efficiens оперон cysIXHDNZY включает два дополнительных члена, кодирующих алкансульфонат-монооксигеназу (СЕ2637) и метилтиоаденозин-нуклеозидазу (СЕ2636). Ген СЕ2637 не имеет ортологов ни в одном из рассматриваемых геномов (см. выше). Ортологи гена СЕ2636 присутствуют в геномах C.glutamicum и C.diphtheriae в виде моноцистронных оперонов, причем перед ортологом в геноме C.diphtheriae находится сайт связывания McbR (фиг.4, позиция А, фиг.3). Регуляторная область перед ортологичным геном в геноме C.glutamicum также содержит потенциальный сайт связывания, но вес данного сигнала ниже заданного порогового значения и составляет 3,79. Таким образом, принадлежность гена СЕ2636 регулону McbR является сильно гипотетической, хотя и заслуживающей экспериментальной проверки.As already mentioned, in the C.efficiens genome, the cysIXHDNZY operon includes two additional members encoding an alkanesulfonate monooxygenase (CE2637) and methylthioadenosine nucleosidase (CE2636). The CE2637 gene has no orthologs in any of the genomes under consideration (see above). Orthologs of the CE2636 gene are present in the genomes of C. glutamicum and C. diphtheriae in the form of monocistronic operons, with the McbR binding site located in front of the ortholog in the C. diphtheriae genome (Fig. 4, position A, Fig. 3). The regulatory region in front of the orthologous gene in the C. glutamicum genome also contains a potential binding site, but the weight of this signal is below a predetermined threshold value and is 3.79. Thus, the fact that the CE2636 gene belongs to the McbR regulon is highly hypothetical, although it deserves experimental verification.

Матрица позиционных весов, созданная на основе сайтов связывания McbR в геноме C.glutamicum, позволяла проводить поиск регуляторных сайтов в геномах рода Corynebacterium. Однако при поиске сигналов в более филогенетически далеких геномах эта матрица находила только один сильный сайт связывания регулятора (вес сайта 5,02) перед генами исследуемого метаболического пути, - сайт авторегуляции mcbR в геноме Nocardia farcinica (фиг.3). Все остальные гены пути биосинтеза метионина в этих геномах имеют сигналы со слишком слабым весом (меньше 3,0). Возможное объяснение этому наблюдению может состоять в том, что у регулятора мог измениться ДНК-связывающий домен и, соответственно, распознаваемый им сигнал. Для поиска сигнала, специфичного для более далеких геномов, в каждом геноме проверялись следующие предположения:A positional weight matrix based on McbR binding sites in the C. glutamicum genome made it possible to search for regulatory sites in the genomes of the genus Corynebacterium. However, when searching for signals in more phylogenetically distant genomes, this matrix found only one strong binding site for the regulator (site weight 5.02) in front of the genes of the metabolic pathway under study - the mcbR autoregulation site in the Nocardia farcinica genome (Fig. 3). All other genes of the methionine biosynthesis pathway in these genomes have signals with too low a weight (less than 3.0). A possible explanation for this observation may be that the regulator could change the DNA-binding domain and, accordingly, the signal it recognizes. To search for a signal specific for more distant genomes, the following assumptions were checked in each genome:

- возможность небольшого изменения сигнала. Была сделана попытка построить новую матрицу на основании выборки тех слабых сайтов, которые распознавала исходная матрица;- the possibility of a slight change in the signal. An attempt was made to construct a new matrix based on a sample of those weak sites that the original matrix recognized;

- возможность значительного изменения сигнала. Учитывая принадлежность McbR к TetR-семейству транскрипционных регуляторов, можно было предположить, что структура сигнала осталась палиндромной. Был проведен поиск более или менее строгого палиндромного сигнала разной четности и длины в 5'-областях основных и, отдельно, "вторичных" генов метаболического пути.- the possibility of a significant change in the signal. Given the McbR affiliation with the TetR family of transcriptional regulators, it could be assumed that the signal structure remained palindromic. A search was made for a more or less strict palindromic signal of different parity and length in the 5'-regions of the main and, separately, "secondary" genes of the metabolic pathway.

Ни один из подходов к созданию новой матрицы не дал результатов. Возможным объяснением этому является крайне высокий GC состав всех трех далеких геномов: средний уровень GC-пар по геному составляет в среднем 70% (для C.glutamicum - 54%), что значительно затрудняет поиск специфичного сигнала.None of the approaches to creating a new matrix yielded results. A possible explanation for this is the extremely high GC composition of all three distant genomes: the average level of GC pairs in the genome is on average 70% (for C. glutamicum - 54%), which greatly complicates the search for a specific signal.

В итоге проанализирована структура и потенциальная регуляция регулона McbR во всех семи геномах актинобактерий, в которых сохраняются близкие ортологи данного регулятора.As a result, we analyzed the structure and potential regulation of the McbR regulon in all seven actinobacteria genomes in which close orthologs of this regulator are preserved.

Несмотря на невозможность изучения регуляции в филогенетически более далеких геномах вследствие значительно повышенного GC-состава этих геномов, исследование потенциальных сигналов в четырех геномах рода Corynebacterium позволяет заключить, что большинство генов регулона McbR сохраняет регуляцию со стороны этого репрессора. В большей части случаев потенциальный сигнал сохраняется перед исследуемым ортологичным геном, однако в некоторых ситуациях вследствие различного относительного расположения генов потенциальный сайт связывания может находиться в регуляторной области другого гена. Например, гены metX и metY могут формировать независимо регулирующиеся моноцистронные локусы или же единый оперон с сигналом перед геном metY (фиг.4, позиция Г), а дивергон утилизации сульфата cysJIHDNZY C.glutamicum в геноме C.jeikeium разрывается на независимо регулирующиеся дивергон cysJIX и оперон cysHDNYZ (фиг.4, позиция А).Despite the impossibility of studying regulation in phylogenetically more distant genomes due to the significantly increased GC composition of these genomes, the study of potential signals in the four genomes of the genus Corynebacterium suggests that the majority of McbR regulon genes maintain regulation on the part of this repressor. In most cases, the potential signal is stored before the studied orthologous gene, however, in some situations, due to the different relative locations of the genes, the potential binding site may be located in the regulatory region of another gene. For example, the metX and metY genes can form independently regulated monocistronic loci or a single operon with a signal in front of the metY gene (Fig. 4, position D), and the divergon of cysJIHDNZY sulphate utilization C.glutamicum in the C.jeikeium genome breaks into independently regulated cysJIX divergon and operon cysHDNYZ (Fig. 4, position A).

Позиционное сравнение и исследование регуляции ортологичных регулонов позволили прогнозировать наличие нового потенциального члена регулона McbR в геномах рода Corynebacterium, - ген cg1739 C.glutamicum. Поиск консервативных доменов в GenBank выявляет сходство кодируемого белка с доменом глутамин-амидотрансферазы guaA Bacillus subtilis [1312531] и отдаленную гомологию белка с гомосерин-сукцинилтрансферазным доменом. Гомосерин-сукцинилтрансфераза выполняет функцию, аналогичную функции гомосерин-ацетилтрансферазы в геномах некоторых бактерий, таких как Escherichia coli и Pseudomonas aeruginosa [Lee H.S., Hwang B.J. 2003. Methionine biosynthesis and its regulation in Corynebacterium glutamicum: parallel pathways oftranssulfuration and direct sulfhydrylation. Appl. Microbiol. Biotechnol. 62, 459-467]. Одновременное наличие этих двух ферментов еще не было показано и, более того, было экспериментально показано, что единственным ферментом утилизации гомосерина в геноме C.glutamicum является гомосерин-ацетилтрансфераза [Park S.D., Lee J.Y., Kim Y., Kim J.H., Lee H.S. 1998. Isolation and analysis of metA, a methionine biosynthetic gene encoding homoserine acetyltransferase in Corynebacterium glutamicum. Mol. Cells. 8, 286-294.]. Возможная роль белка, гомологичного белку guaA B.subtilis, в биосинтезе метионина также не очевидна. Функция этого фермента состоит в гидролизе иона аммония (NH4+) от молекулы глутамина с образованием молекулы глутамата и последующем присоединении иона аммония к акцепторной молекуле. Объяснением роли данной ферментативной активности в биосинтезе метионина/цистеина могла бы явиться возможная регуляция биосинтеза на стадии образования аспартата из глутамата и оксалоцетата. Но такая интерпретация представляется маловероятной в силу того, что глутамат вовлечен в большую часть процессов биосинтеза и регуляция его уровня в клетке со стороны специфичного регулятора биосинтеза метионина не целесообразна.A positional comparison and study of the regulation of orthologous regulons made it possible to predict the presence of a new potential member of the McbR regulon in the genomes of the genus Corynebacterium, the cgl1739 gene C.glutamicum. A search for conserved domains in GenBank reveals the similarity of the encoded protein with the guaA glutamine amidotransferase domain of Bacillus subtilis [1312531] and the distant protein homology with the homoserine succinyltransferase domain. Homoserin-succinyltransferase performs a function similar to that of homoserin-acetyltransferase in the genomes of some bacteria, such as Escherichia coli and Pseudomonas aeruginosa [Lee HS, Hwang BJ 2003. Methionine biosynthesis and its regulation in Corynebacterium glutamictrum sulfrum parallel. Appl. Microbiol. Biotechnol. 62, 459-467]. The simultaneous presence of these two enzymes has not yet been shown and, moreover, it has been experimentally shown that the only homoserine utilization enzyme in the C. glutamicum genome is homoserine acetyltransferase [Park SD, Lee JY, Kim Y., Kim JH, Lee HS 1998. Isolation and analysis of metA, a methionine biosynthetic gene encoding homoserine acetyltransferase in Corynebacterium glutamicum. Mol. Cells 8, 286-294.]. The possible role of a protein homologous to B.subtilis guaA protein in methionine biosynthesis is also not obvious. The function of this enzyme is to hydrolyze an ammonium ion (NH4 + ) from a glutamine molecule to form a glutamate molecule and then attach the ammonium ion to the acceptor molecule. An explanation of the role of this enzymatic activity in methionine / cysteine biosynthesis could be the possible regulation of biosynthesis at the stage of formation of aspartate from glutamate and oxaloacetate. But such an interpretation seems unlikely due to the fact that glutamate is involved in most of the biosynthesis processes and the regulation of its level in the cell by a specific regulator of methionine biosynthesis is not advisable.

Кроме того, полученные результаты свидетельствуют о том, что белок СЕ2636р C.efficiens и его ортологи в C.glutamicum и C.diphtheriae также могут входить в регулон McbR. Этот белок имеет значительную степень сходства с представителями семейства нуклеозид-фосфорилаз, которое включает в себя 5'-метилтиоаденозин-нуклеозидазы (МТА-нуклеозидазы). В процессе биосинтеза полиаминов одним из побочных продуктов является МТА. Процесс восстановления метионина из МТА состоит из нескольких реакций, первой и лимитирующей из которых является расщепление МТА на аденин и 5'-метилтиорибозу, катализируемое МТА-нуклеозидазами. Таким образом, увеличение пула метионина за счет МТА потенциально также находится под регуляцией со стороны McbR, по крайней мере, в геномах C.diphtheriae и C.efficiens.In addition, the results indicate that C.efficiens CE2636p protein and its orthologs in C.glutamicum and C. diphtheriae can also be included in the McbR regulon. This protein has a significant degree of similarity with members of the nucleoside phosphorylase family, which includes 5'-methylthioadenosine nucleosidases (MTA nucleosidases). In the biosynthesis of polyamines, one of the by-products is MTA. The recovery of methionine from MTA consists of several reactions, the first and the limiting of which is the cleavage of MTA into adenine and 5'-methylthioribose catalyzed by MTA nucleosidases. Thus, an increase in the methionine pool due to MTA is also potentially regulated by McbR, at least in the genomes of C. diphtheriae and C. efficiencyiens.

Несмотря на общую высокую стабильность геномов коринебактерий [Nakamura Y., Nishio Y,, Ikeo K,, Gojobori Т. 2003. The genome stability in Corynebacterium species due to lack of the recombinational repair system. Gene. 317, 149-155], во многих случаях фиксировалась утрата ортологичных генов как в далеких, так и в близкородственных геномах. Большая часть таких ситуаций связана с особенностями паразитического образа жизни, характерного для четырех микроорганизмов из описываемых семи, - C.diphtheriae, C.jeikeium, Nocardia farcinica и Leifsonia xyli. По-видимому, эти микроорганизмы способны получать серосодержащие органические вещества из организмов хозяев, в силу чего отсутствует острая необходимость в ферментах пути биосинтеза метионина, и, как следствие, путь биосинтеза метионина в этих микроорганизмах редуцирован. Так, к примеру, в геноме C.diphtheriae полностью утрачен оперон утилизации сульфата и оба оперона утилизации алкансульфонатов, что только частично возмещается появлением новой алкансульфонат-монооксигеназы в результате неортологичного замещения. Кроме того, утрачен ген metB (цистатионин гамма-синтаза), кодирующий первый фермент пути транс-сульфурилирования, и единственно возможным способом синтеза гомоцистеина остается путь прямого сульфгидрилирования с участием белка MetY (ацетилгомосерин-лиаза). Утрачен ген metE, кодирующий высокоэффективную метионин-синтазу. Тем не менее, путь биосинтеза метионина остается функциональным благодаря наличию метионин-синтазы MetH, эффективность которой ниже.Despite the general high stability of the genomes of corynebacteria [Nakamura Y., Nishio Y ,, Ikeo K ,, Gojobori T. 2003. The genome stability in Corynebacterium species due to lack of the recombinational repair system. Gene. 317, 149-155], in many cases, the loss of orthologous genes was recorded in both distant and closely related genomes. Most of these situations are associated with the characteristics of the parasitic lifestyle characteristic of four of the seven microorganisms described - C. diphtheriae, C.jeikeium, Nocardia farcinica and Leifsonia xyli. Apparently, these microorganisms are able to obtain sulfur-containing organic substances from the host organisms, due to which there is no acute need for enzymes in the methionine biosynthesis pathway, and, as a result, the methionine biosynthesis pathway in these microorganisms is reduced. So, for example, in the genome of C. diphtheriae, the sulfate utilization operon and both alkanesulfonate utilization operons are completely lost, which is only partially offset by the appearance of a new alkanesulfonate monooxygenase as a result of non-orthologous substitution. In addition, the metB gene (cystathionine gamma synthase), which encodes the first enzyme of the trans-sulfurylation pathway, has been lost, and the direct sulfhydrylation pathway involving MetY protein (acetyl homoserine lyase) remains the only possible way to synthesize homocysteine. The metE gene encoding highly efficient methionine synthase has been lost. However, the methionine biosynthesis pathway remains functional due to the presence of MetH methionine synthase, the effectiveness of which is lower.

Позиционное сравнение генов биосинтеза аминокислот в геномах C.glutamicum, C.efficiens и C.diphtheriae выявило отсутствие в геноме C.diphtheriae большого количества ортологов, что привело к заметно меньшему размеру генома этой бактерии. Среди изученных микроорганизмов для ведущих паразитический образ жизни также характерен заметно уменьшенный размер генома (за исключением генома Nocardia farcinica), что может свидетельствовать об аналогичной массовой утрате ортологов и, возможно, косвенно свидетельствовать об использовании необходимых соединений организма хозяина.A positional comparison of amino acid biosynthesis genes in the genomes of C. glutamicum, C.efficiens, and C. diphtheriae revealed the absence of a large number of orthologs in the C. diphtheriae genome, which led to a noticeably smaller genome of this bacterium. Among the microorganisms studied, leading a parasitic lifestyle is also characterized by a markedly reduced genome size (with the exception of the Nocardia farcinica genome), which may indicate a similar mass loss of orthologs and, possibly, indirectly indicate the use of the necessary compounds of the host organism.

В некоторых случаях отсутствие ортологов возмещается наличием гомологичных, но не ортологичных белков, как это было описано для функций треонин-синтазы и алкансульфонат-монооксигеназы. Так, геномы C.glutamicum, C.efficiens и C.diphtheriae несут треонин-синтазу, не характерную для большинства актиномицет, полученную, по всей видимости, общим предком этих трех бактерий за счет горизонтального переноса. Более частным аналогичным случаем горизонтального переноса генов является появление в геноме C.efficiens алкансульфонат-монооксигеназы, характерной для протеобактерий.In some cases, the absence of orthologs is compensated for by the presence of homologous but not orthologous proteins, as has been described for the functions of threonine synthase and alkanesulfonate monooxygenase. Thus, the genomes of C. glutamicum, C.efficiens, and C. diphtheriae carry a threonine synthase, which is not characteristic of most actinomycetes, obtained, apparently, by the common ancestor of these three bacteria due to horizontal transfer. A more particular analogous case of horizontal gene transfer is the appearance in the genome of C.efficiens of an alkanesulfonate monooxygenase characteristic of proteobacteria.

Применение предлагаемого способа к регулону mcbR продемонстрировало многочисленные и разнообразные оперонные перестройки, несмотря на показанную ранее геномную стабильность, и, кроме того, позволило прогнозировать и предъявить несколько новых потенциальных членов данного регулона на основании позиционного сравнения геномов и исследования сайтов связывания регулятора mcbR. Большинству новых потенциальных членов регулона ранее были приписаны ферментативные активности, которые позволили предсказать роли кодируемых белков в пути биосинтеза метионина в геномах порядка Actinomycetales.The application of the proposed method to the mcbR regulon demonstrated numerous and diverse operon rearrangements, despite the previously shown genomic stability, and, in addition, allowed to predict and present several new potential members of this regulon based on positional comparison of the genomes and study of the binding sites of the mcbR regulator. Enzymatic activities were previously attributed to most of the new potential members of the regulon, which made it possible to predict the roles of encoded proteins in the methionine biosynthesis pathway in Actinomycetales genomes.

Таким образом, предлагаемое изобретение позволяет решить задачу расширения функциональных возможностей способа прогнозирования, увеличения его оперативности, а также, в перспективе, уменьшения затрат на промышленное производство метионина.Thus, the present invention allows to solve the problem of expanding the functionality of the forecasting method, increasing its efficiency, as well as, in the future, reducing the cost of industrial production of methionine.

Источники информацииInformation sources

1. Nishio Y., Nakamura Y., Usuda Y., Sugimoto S., Matsui K., Kawarabayasi Y., Kikuchi H., Gojobori Т., Ikeo K. 2004. Evolutionary process of amino acid biosynthesis in Corynebacterium at the whole genome level. Mol. Biol. Evol. 21, 1683-1691.1. Nishio Y., Nakamura Y., Usuda Y., Sugimoto S., Matsui K., Kawarabayasi Y., Kikuchi H., Gojobori T., Ikeo K. 2004. Evolutionary process of amino acid biosynthesis in Corynebacterium at the whole genome level. Mol. Biol. Evol. 21, 1683-1691.

2. Lee H.S., Hwang B.J. 2003. Methionine biosynthesis and its regulation in Corynebacterium glutamicum: parallel pathways oftranssulfuration and direct sulfhydrylation. Appl. Microbiol. Biotechnol. 62, 459-467.2. Lee H.S., Hwang B.J. 2003. Methionine biosynthesis and its regulation in Corynebacterium glutamicum: parallel pathways of transsulfuration and direct sulfhydrylation. Appl. Microbiol. Biotechnol. 62, 459-467.

3. Hwang B.J., Yeom H.J., Kim Y., Lee H.S. 2002. Corynebacterium glutamicum utilizes both transsulfuration and direct sulfhydrylation pathways for methionine biosynthesis. J. Bacteriol. 184, 1277-1286.3. Hwang B.J., Yeom H.J., Kim Y., Lee H.S. 2002. Corynebacterium glutamicum utilizes both transsulfuration and direct sulfhydrylation pathways for methionine biosynthesis. J. Bacteriol. 184, 1277-1286.

4. Mampel J., Schroder H., Haefner S., Sauer U. 2005. Single-gene knockout of a novel regulatory element confers ethionine resistance and elevates methionine production in Corynebacterium glutamicum. Appl. Microbiol. Biotechnol. 68, 228-236.4. Mampel J., Schroder H., Haefner S., Sauer U. 2005. Single-gene knockout of a novel regulatory element confers ethionine resistance and elevates methionine production in Corynebacterium glutamicum. Appl. Microbiol. Biotechnol. 68, 228-236.

5. Rey D.A., Puhler A., Kalinowski J. 2003. The putative transcriptional represser McbR, member of the TetR-family, is involved in the regulation of the metabolic network directing the synthesis of sulfur containing amino acids in Corynebacterium glutamicum. J. Biotechnol. 103, 51-65.5. Rey D.A., Puhler A., Kalinowski J. 2003. The putative transcriptional represser McbR, member of the TetR-family, is involved in the regulation of the metabolic network directing the synthesis of sulfur containing amino acids in Corynebacterium glutamicum. J. Biotechnol. 103, 51-65.

6. Rey D.A., Nentwich S.S., Koch D.J., Ruckert C., Puhler A., Tauch A., Kalinowski J. 2005. The McbR repressor modulated by the effector substance S-adenosylhomocysteine controls directly the transcription of a regulon involved in sulphur metabolism of Corynebacterium glutamicum ATCC 13032. Mol. Microbiol. 56, 871-887.6. Rey DA, Nentwich SS, Koch DJ, Ruckert C., Puhler A., Tauch A., Kalinowski J. 2005. The McbR repressor modulated by the effector substance S-adenosylhomocysteine controls directly the transcription of a regulon involved in sulphur metabolism of Corynebacterium glutamicum ATCC 13032. Mol. Microbiol. 56, 871-887.

Claims (4)

1. Способ прогнозирования пути биосинтеза метионина в родственных геномах коринебактерий на основе поиска потенциальных сайтов связывания регулятора McbR, включающий1. A method for predicting the pathway of methionine biosynthesis in related genomes of corynebacteria based on the search for potential binding sites of the McbR regulator, including а) составление исходной обучающей выборки, для чего формируют полные последовательности геномов коринебактерий на основе базы данных Gen Bank и предсказанных ранее и подтвержденных экспериментально регуляторных областей перед генами ферментов, участвующих в биосинтезе метионина, и записывают ее на информационный носитель;a) compiling an initial training sample, for which complete sequences of corynebacterial genomes are formed on the basis of the Gen Bank database and previously predicted and experimentally confirmed regulatory regions in front of the enzyme genes involved in methionine biosynthesis, and recorded on an information carrier; б) введение в компьютер записанной на информационный носитель исходной обучающей выборки и обработка ее заранее записанной в память компьютера программой SignalX для построения матриц позиционных весов нуклеотидов;b) introducing into the computer the initial training sample recorded on the information carrier and processing it in advance with the SignalX program written in the computer memory to construct the matrix of positional nucleotide weights; в) поиск потенциальных сайтов связывания регулятора McbR и предсказание состава оперонов, если оперонная структура неизвестна, путем обработки исходной обучающей выборки заранее записанными в память компьютера алгоритмами из пакета программ Genome Explorer, причем область поиска потенциальных сайтов связывания ограничивают диапазоном -400...+100 пар нуклеотидов относительно старта трансляции гена, а гены считают принадлежащими оперону в случае одинакового направления считывания и расстояния между ними не более 100 пар нуклеотидов;c) searching for potential binding sites of the McbR regulator and predicting the composition of operons, if the operon structure is unknown, by processing the initial training set with algorithms from the Genome Explorer software package pre-stored in the computer’s memory, and the search for potential binding sites is limited to the range of -400 ... + 100 nucleotide pairs relative to the start of gene translation, and genes are considered to belong to the operon in the case of the same reading direction and the distance between them is not more than 100 nucleotide pairs; г) записывание результатов, полученных на стадии по п/п (в) в память компьютера;d) recording the results obtained at the stage by sub-item (c) in the computer memory; д) поиск ортологов белков пути биосинтеза метионина во всех родственных геномах с использованием пакета программ GenomeExplorer, представление результатов этого поиска и стадии по п/п (в) в двух выходных текстовых файлах, первый из которых выводят на информационный носитель в виде таблицы соответствия генов пути биосинтеза метионина потенциальным сайтам связывания регулона McbR и родственным геномам коринебактерий, а второй - в виде диаграммы структуры оперонов регулона McbR;e) the search for orthologs of the proteins of the methionine biosynthesis pathway in all related genomes using the GenomeExplorer software package, presenting the results of this search and the steps in p (c) in two output text files, the first of which is displayed on an information medium in the form of a table of path gene matching methionine biosynthesis to potential binding sites of the McbR regulon and related genomes of corynebacteria, and the second - in the form of a diagram of the structure of McbR regulon operons; д) прогнозирование участников и направления пути биосинтеза метионина в родственных геномах коринебактерий на основе позиционного сравнения содержания обоих выходных текстовых файлов с учетом результатов поиска регуляторных сайтов связывания в более филогенетически отдаленных геномах, для первого выходного текстового файла, и с учетом характерных эволюционных событий формирования структуры оперонов, для второго выходного текстового файла.e) predicting the participants and the direction of the methionine biosynthesis pathway in related genomes of corynebacteria based on positional comparison of the contents of both output text files, taking into account the search results for regulatory binding sites in more phylogenetically distant genomes, for the first output text file, and taking into account the characteristic evolutionary events of the formation of the structure of operons , for the second output text file. 2. Способ по п.1, отличающийся тем, что в качестве эволюционных событий фиксируют неортологичные замещения, оперонные перестройки, паралоги, утрату ортологов или полную консервативность в структуре оперона.2. The method according to claim 1, characterized in that non-orthologic substitutions, operon rearrangements, paralogs, loss of orthologs, or complete conservatism in the structure of the operon are recorded as evolutionary events. 3. Способ по п.2, отличающийся тем, что при фиксировании наличия паралогов используют эволюционные деревья, построение которых производят по методу максимального правдоподобия (maximum likelyhood) с помощью программы из программного пакета PHYLIP 3.63.3. The method according to claim 2, characterized in that when fixing the presence of paralogs, evolutionary trees are used, the construction of which is carried out by the maximum likelihood method using the program from the PHYLIP 3.63 software package. 4. Способ по п.1, отличающийся тем, что при поиске ортологов белков пути биосинтеза метионина в родственных геномах коринебактерий, поиск гомологичных последовательностей в базе данных производят с помощью программы BLAST, а построение множественных выравниваний аминокислотных и нуклеотидных последовательностей осуществляют посредством алгоритмов программы ClustalX.4. The method according to claim 1, characterized in that when searching for protein orthologs of the methionine biosynthesis pathway in the related genomes of corynebacteria, the search for homologous sequences in the database is performed using the BLAST program, and the construction of multiple alignments of amino acid and nucleotide sequences is carried out using the algorithms of the ClustalX program.
RU2006127265/13A 2006-07-27 2006-07-27 Method for investigation and prognosis of methyonin biosynthesis rout in related corynebacteria genomes RU2307169C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2006127265/13A RU2307169C1 (en) 2006-07-27 2006-07-27 Method for investigation and prognosis of methyonin biosynthesis rout in related corynebacteria genomes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2006127265/13A RU2307169C1 (en) 2006-07-27 2006-07-27 Method for investigation and prognosis of methyonin biosynthesis rout in related corynebacteria genomes

Publications (1)

Publication Number Publication Date
RU2307169C1 true RU2307169C1 (en) 2007-09-27

Family

ID=38954170

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006127265/13A RU2307169C1 (en) 2006-07-27 2006-07-27 Method for investigation and prognosis of methyonin biosynthesis rout in related corynebacteria genomes

Country Status (1)

Country Link
RU (1) RU2307169C1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2691581C2 (en) * 2014-04-10 2019-06-14 СиДжей ЧЕЙЛЖЕДАНГ КОРП. O-succinylhomoserine producing microorganism and method for producing o-succinylhomoserine using same
RU2814546C2 (en) * 2019-06-28 2024-03-01 СиДжей ЧеилДжеданг Корпорейшн Method of producing sulphur-containing amino acid or derivative thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
J. Biotechnol. 2003 Jun 12; 103(1):51-65. Mol Microbiol. 2005 May; 56(4):871-87. Appl Microbiol Biotechnol. 2003 Oct; 62(5-6):459-67. Mol Biol Evol. 2004 Sep; 21(9):1683-91. *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2691581C2 (en) * 2014-04-10 2019-06-14 СиДжей ЧЕЙЛЖЕДАНГ КОРП. O-succinylhomoserine producing microorganism and method for producing o-succinylhomoserine using same
US10570429B2 (en) 2014-04-10 2020-02-25 Cj Cheiljedang Corporation O-succinylhomoserine producing microorganism and method for producing O-succinylhomoserine using same
RU2814546C2 (en) * 2019-06-28 2024-03-01 СиДжей ЧеилДжеданг Корпорейшн Method of producing sulphur-containing amino acid or derivative thereof

Similar Documents

Publication Publication Date Title
Unthan et al. Chassis organism from Corynebacterium glutamicum–a top‐down approach to identify and delete irrelevant gene clusters
Schwientek et al. The complete genome sequence of the acarbose producer Actinoplanes sp. SE50/110
Molina‐Henares et al. Identification of conditionally essential genes for growth of Pseudomonas putida KT2440 on minimal medium through the screening of a genome‐wide mutant library
Kocan et al. Two-component systems of Corynebacterium glutamicum: deletion analysis and involvement of the PhoS-PhoR system in the phosphate starvation response
Felux et al. Entner–Doudoroff pathway for sulfoquinovose degradation in Pseudomonas putida SQ1
Resendis-Antonio et al. Systems biology of bacterial nitrogen fixation: high-throughput technology and its integrative description with constraint-based modeling
Wheatley et al. Role of O2 in the growth of Rhizobium leguminosarum bv. viciae 3841 on glucose and succinate
Peano et al. Comparative genomics revealed key molecular targets to rapidly convert a reference rifamycin-producing bacterial strain into an overproducer by genetic engineering
Petri et al. A novel type of N-acetylglutamate synthase is involved in the first step of arginine biosynthesis in Corynebacterium glutamicum
Terfehr et al. Transcriptome analysis of the two unrelated fungal β-lactam producers Acremonium chrysogenum and Penicillium chrysogenum: Velvet-regulated genes are major targets during conventional strain improvement programs
US20240067997A1 (en) Genomic engineering of biosynthetic pathways leading to increased nadph
Smolke The metabolic pathway engineering handbook: fundamentals
Geiser et al. Evolutionary freedom in the regulation of the conserved itaconate cluster by Ria1 in related Ustilaginaceae
Ikeda et al. Development of biotin-prototrophic and-hyperauxotrophic Corynebacterium glutamicum strains
Nærdal et al. L-lysine production by Bacillus methanolicus: genome-based mutational analysis and L-lysine secretion engineering
Seibold et al. Glycogen formation in Corynebacterium glutamicum and role of ADP-glucose pyrophosphorylase
Shang et al. Characterization and molecular mechanism of AroP as an aromatic amino acid and histidine transporter in Corynebacterium glutamicum
Tisch et al. Omics analyses of Trichoderma reesei CBS999. 97 and QM6a indicate the relevance of female fertility to carbohydrate-active enzyme and transporter levels
Sharma et al. Global gene expression analysis of the Myxococcus xanthus developmental time course
CN109415418A (en) The method for generating interested molecule by the inclusion of the microbial fermentation of the gene of coding sugar phosphotransferase system (PTS)
Wolf et al. Genome improvement of the acarbose producer Actinoplanes sp. SE50/110 and annotation refinement based on RNA-seq analysis
Mormann et al. Random mutagenesis in Corynebacterium glutamicum ATCC 13032 using an IS 6100-based transposon vector identified the last unknown gene in the histidine biosynthesis pathway
Lu et al. Genome-wide transcriptomic analysis of n-caproic acid production in Ruminococcaceae bacterium CPB6 with lactate supplementation
Schwientek et al. Improving the genome annotation of the acarbose producer Actinoplanes sp. SE50/110 by sequencing enriched 5′-ends of primary transcripts
RU2307169C1 (en) Method for investigation and prognosis of methyonin biosynthesis rout in related corynebacteria genomes

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20090728

NF4A Reinstatement of patent

Effective date: 20100620

PC4A Invention patent assignment

Effective date: 20100810

PD4A Correction of name of patent owner
QB4A Licence on use of patent

Free format text: LICENCE

Effective date: 20120605