RU2265054C2 - Recombinant cell-host (variants) and bac clone - Google Patents

Recombinant cell-host (variants) and bac clone Download PDF

Info

Publication number
RU2265054C2
RU2265054C2 RU2003130458/13A RU2003130458A RU2265054C2 RU 2265054 C2 RU2265054 C2 RU 2265054C2 RU 2003130458/13 A RU2003130458/13 A RU 2003130458/13A RU 2003130458 A RU2003130458 A RU 2003130458A RU 2265054 C2 RU2265054 C2 RU 2265054C2
Authority
RU
Russia
Prior art keywords
seq
nucleotides
amino acids
epothilone
pepo15
Prior art date
Application number
RU2003130458/13A
Other languages
Russian (ru)
Other versions
RU2003130458A (en
Inventor
Томас ШУПП (CH)
Томас ШУПП
Джеймс Мадисон ЛИГОН (US)
Джеймс Мадисон ЛИГОН
Иштван МОЛЬНАР (US)
Иштван МОЛЬНАР
Росс ЗИРКЛЕ (US)
Росс ЗИРКЛЕ
Йёрн ГЁРЛАХ (US)
Йёрн ГЁРЛАХ
Девон СИР (US)
Девон СИР
Original Assignee
Новартис Аг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Новартис Аг filed Critical Новартис Аг
Publication of RU2003130458A publication Critical patent/RU2003130458A/en
Application granted granted Critical
Publication of RU2265054C2 publication Critical patent/RU2265054C2/en

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

FIELD: biotechnology.
SUBSTANCE: invention describes recombinant host-cells comprising a chimerical gene involving the heterologous promoter sequence associated functionally with nucleic acid that encodes at least one polypeptide implicated in biosynthesis of epotilons, or polypeptide expressed by recombinant way and implicated in biosynthesis of epotilons, and Bac clones also. Using the invention provides to realize a method for preparing epotilons with high degree of effectiveness.
EFFECT: valuable properties of host-cell.
9 cl, 6 tbl, 15 ex

Description

Область техники, к которой относится изобретениеFIELD OF THE INVENTION

Настоящее изобретение в целом относится к поликетидам и генам, участвующим в их синтезе. В частности настоящее изобретение относится к выделению и получению характеристик новой поликетид-синтазы и нерибосомных генов кислота-аминокислота-лигаз из Sorangium cellulosum, которые необходимы для биосинтеза эпотилонов А и В.The present invention generally relates to polyketides and genes involved in their synthesis. In particular, the present invention relates to the isolation and characterization of a new polyketide synthase and non-ribosomal acid-amino acid-ligase genes from Sorangium cellulosum, which are necessary for the biosynthesis of epothilones A and B.

Предпосылки создания изобретенияBACKGROUND OF THE INVENTION

Поликетиды представляют собой соединения, которые синтезируются из элементарных звеньев, содержащих два атома углерода, в которых β-углерод всегда несет кетогрупу, поэтому их называют поликетиды. К этим соединениям относятся многочисленные важные антибиотики, иммунодепрессанты, противораковые химиотерапевтические агенты и другие соединения, обладающие широким спектром биологических активностей. Чрезвычайно большое структурное разнообразие обусловлено различием длин поликетидных цепей, различием встроенных боковых цепей (либо в начале процесса синтеза в виде части элементарных звеньев, содержащих два атома углерода, либо после формирования каркаса поликетона) и стереохимическим строением таких групп. Кетогруппы также могут быть восстановлены до гидроксилов, еноилов или полностью удалены. Каждый цикл добавления двух атомов углерода осуществляется с помощью комплекса ферментов, называемых поликетид-синтазой (PKS), с помощью процесса, аналогичного биосинтезу жирных кислот.Polyketides are compounds that are synthesized from elementary units containing two carbon atoms, in which β-carbon always carries a ketogroup, therefore they are called polyketides. These compounds include numerous important antibiotics, immunosuppressants, anti-cancer chemotherapeutic agents, and other compounds with a wide range of biological activities. The extremely large structural diversity is due to the difference in the lengths of the polyketide chains, the difference in the built-in side chains (either at the beginning of the synthesis process as a part of elementary units containing two carbon atoms, or after the formation of the polyketone framework) and the stereochemical structure of such groups. Keto groups can also be reduced to hydroxyls, enoyls or completely removed. Each cycle of adding two carbon atoms is carried out using a complex of enzymes called polyketide synthase (PKS), using a process similar to the biosynthesis of fatty acids.

Гены биосинтеза, обеспечивающие увеличение количества поликетидов, были выделены и секвенированы. Например, см. патенты US 5639949, 5693774 и 5716849, все они включены в настоящее описание в виде ссылки, в которых описаны гены биосинтеза сорафена. См., также публикацию Schupp и др., FEMS Microbiology Letters 159: 201-207 (1998) и WO 98/07868, где описаны гены биосинтеза рифамицина, и патент US 5876991, в котором описаны гены биосинтеза тилактона, все они включены в настоящее описание в виде ссылки. Кодируемые протеины обычно подразделяют на два типа: тип I и тип II. Протеины типа I являются полифункциональными с несколькими каталитическими доменами, осуществляющими различные ферментативные стадии, которые ковалентно связаны друг с другом (например, PKS эритромицина, сорафена, рифамицина и авермектина (MacNeil и др., в: Industrial Microorganisms: Basic and Applied Molecular Genetics, (ред. Baltz и др.), American Society for Microbiology, Washington D.С., стр.245-256 (1993)); в то время как протеины типа II являются монофункциональными (Hutchinson и др., в: Industrial Microorganisms: Basic and Applied Molecular Genetics, (ред. Baltz и др.), American Society for Microbiology, Washington D.С., стр.203-216 (1993)).Genes for biosynthesis, providing an increase in the number of polyketides, were isolated and sequenced. For example, see patents US 5639949, 5693774 and 5716849, all of which are incorporated into this description by reference, in which the genes of sorafen biosynthesis are described. See also the publication by Schupp et al. FEMS Microbiology Letters 159: 201-207 (1998) and WO 98/07868 for rifamycin biosynthesis genes and US Pat. description by reference. Coded proteins are usually divided into two types: type I and type II. Type I proteins are multifunctional with several catalytic domains that carry out various enzymatic steps that are covalently linked to each other (e.g., PKS of erythromycin, sorafen, rifamycin and avermectin (MacNeil et al., In: Industrial Microorganisms: Basic and Applied Molecular Genetics, ( ed. Baltz et al.), American Society for Microbiology, Washington D.C., pp. 245-256 (1993)); while type II proteins are monofunctional (Hutchinson et al., in: Industrial Microorganisms: Basic and Applied Molecular Genetics, (ed. Baltz et al.), American Society for Microbiology, Washington D.C., pp. 203-216 (1993)).

Для простых поликетидов, таких как актинородин (который продуцируется Streptomyces coelicolor), осуществляют несколько циклов добавлений двух атомов углерода с повторным использованием PKS-ферментов, кодируемых одним набором PKS-генов. В противоположность этому синтез более сложных соединений, таких как эритромицин и сорафен, включает PKS-ферменты, которые организованы в модули, причем каждый модуль осуществляет одни цикл добавления двух атомов углерода (обзор литературных данных см. у Hopwood и др., в: Industrial Microorganisms: Basic and Applied Molecular Genetics, (ред. Baltz и др.), American Society for Microbiology, Washington D. С., с.267-275 (1993)).For simple polyketides, such as actinorodine (which is produced by Streptomyces coelicolor), several cycles of addition of two carbon atoms are carried out using PKS enzymes encoded by one set of PKS genes. In contrast, the synthesis of more complex compounds, such as erythromycin and sorafen, includes PKS enzymes that are organized into modules, each module carrying out one cycle of adding two carbon atoms (for a review of the literature see Hopwood et al., In: Industrial Microorganisms : Basic and Applied Molecular Genetics, (ed. Baltz et al.), American Society for Microbiology, Washington D. C., pp. 267-275 (1993)).

Сложные поликетиды и вторичные метаболиты обычно могут содержать подструктуры, происходящие из аминокислот, а не из простых карбоновых кислот. Включение этих элементарных звеньев осуществляют с помощью нерибосомных кислота-аминокислота-лигаз (NRPSs). NRPSs представляют собой полиферменты, организованные в модули. Каждый модуль ответствен за добавление (и при необходимости за дополнительное процессирование) одного элементарного аминокислотного звена. NRPSs активируют аминокислоты путем образования аминоациладенилатов и захвата ацилированных аминокислот по тиольным группам фосфопантетеинильных простатических групп доменов пептидильного протеина-носителя. Кроме того, NRPSs модифицируют аминокислоты с помощью эпимеризации, N-метилирования или при необходимости циклизации и катализируют образование пептидных связей между связанными с ферментом аминокислотами. NRPSs ответственны за биосинтез пептидных вторичных метаболитов, таких как циклоспорин, за образование терминирующих звеньев поликетидной цепи, например, в рапамицине, или могут формировать смешанные системы типа PKS, например, в пути биосинтеза йерсиниабактина.Complex polyketides and secondary metabolites can usually contain substructures derived from amino acids rather than simple carboxylic acids. The inclusion of these elementary units is carried out using non-ribosomal acid-amino acid-ligase (NRPSs). NRPSs are polyenzymes organized into modules. Each module is responsible for adding (and, if necessary, additional processing) one elementary amino acid link. NRPSs activate amino acids by forming aminoacyl adenylates and capturing acylated amino acids at the thiol groups of the phosphopantheteinyl prostatic groups of the domains of the peptidyl carrier protein. In addition, NRPSs modify amino acids by epimerization, N-methylation, or optionally cyclization, and catalyze the formation of peptide bonds between enzyme-linked amino acids. NRPSs are responsible for the biosynthesis of peptide secondary metabolites, such as cyclosporine, for the formation of terminating units of the polyketide chain, for example, in rapamycin, or can form mixed systems such as PKS, for example, in the pathway of yersiniabactin biosynthesis.

Эпотилоны А и В представляют собой 16-членные макроциклические поликетиды с являющимся производным ацилцистеина стартовым звеном, которые продуцируются штаммом бактерии Sorangium cellulosum So ce90 (Gerth и др., J. Antibiotics 49: 560-563 (1996), публикация включена в настоящее описание в виде ссылки). Строение эпотилона А и В, где R обозначает водород (эпотилон А) или метил (эпотилон В), представлено формулойEpothilones A and B are 16-membered macrocyclic polyketides with an acylcysteine derivative starting unit that are produced by the bacterial strain Sorangium cellulosum So ce90 (Gerth et al., J. Antibiotics 49: 560-563 (1996), the publication is incorporated into this description by as a link). The structure of epothilone A and B, where R is hydrogen (epothilone A) or methyl (epothilone B), is represented by the formula

Figure 00000001
Figure 00000001

Эпотилоны имеют узкий спектр противогрибковой активности, и их основной особенностью является высокая цитотоксичность в отношении культур клеток животных (см., Höfle и др., DE 4138042 (1993), включен в настоящее описание в виде ссылки). Чрезвычайно важно, что эпотилоны имитируют биологическую активность таксола, как in vivo, так и в культуре клеток (Bollag и др., Cancer Research 55: 2325-2333 (1995), публикация включена в настоящее описание в виде ссылки). Таксол и таксотер, которые стабилизируют клеточные микротрубки, представляют собой противораковые химиотерапевтические агенты, обладающие высокой активностью в отношении различных твердых опухолей человека (Rowinsky и др., J. Natl. Cancer Inst. 83: 1778-1781 (1991)). Конкурентные исследования позволили установить, что эпотилоны действуют в качестве конкурентных ингибиторов связывания таксола с микротрубками, что согласуется с представлением о том, что они обладают таким же сайтом связывания микротрубок и таким же сродством к микротрубкам, что и таксол. Однако эпотилоны имеют значительное преимущество по сравнению с таксолом, состоящее в том, что эпотилоны существенно в меньшей степени, чем таксол, теряют эффективность в отношении линии клеток, обладающей множественной устойчивостью к лекарствам (Bollag и др. (1995)). Кроме того, эпотилоны в существенно меньшей степени по сравнению с таксолом экспортируются из клеток с Р-гликопротеином (Gerth и др. (1996)). Более того, было синтезировано несколько аналогов эпотилона, которые обладают более высокой цитотоксичностью по сравнению с эпотилоном А или эпотилоном В, что доказано по их более высокой способности индуцировать полимеризацию и стабилизацию микротрубок (WO 98/25929, документ включен в настоящее описание в виде ссылки).Epothilones have a narrow spectrum of antifungal activity, and their main feature is high cytotoxicity against animal cell cultures (see, Höfle et al., DE 4138042 (1993), incorporated herein by reference). It is extremely important that epothilones mimic the biological activity of taxol, both in vivo and in cell culture (Bollag et al., Cancer Research 55: 2325-2333 (1995), the publication is incorporated herein by reference). Taxol and Taxotere, which stabilize cell microtubes, are anti-cancer chemotherapeutic agents with high activity against various solid human tumors (Rowinsky et al., J. Natl. Cancer Inst. 83: 1778-1781 (1991)). Competitive studies have established that epothilones act as competitive inhibitors of the binding of taxol to microtubes, which is consistent with the idea that they have the same microtubule binding site and the same affinity for microtubes as taxol. However, epothilones have a significant advantage over taxol, in that epothilones are significantly less effective than taxol in relation to a cell line with multiple drug resistance (Bollag et al. (1995)). In addition, epothilones are exported to a significantly lesser extent than taxol from cells with P-glycoprotein (Gerth et al. (1996)). Moreover, several epothilone analogues have been synthesized that have higher cytotoxicity compared to epothilone A or epothilone B, which is proved by their higher ability to induce polymerization and stabilization of microtubes (WO 98/25929, the document is incorporated into this description by reference) .

Несмотря на доказанную перспективность эпотилонов в качестве противораковых агентов, их коммерческую доступность ограничивают существующие в настоящее время проблемы, связанные с получением этих соединений. Соединения являются слишком сложными для промышленного химического синтеза, и поэтому их необходимо получать с помощью ферментации. Методы генетической манипуляции с миксобактериями, такими как Sorangium cellulosum, описаны в патенте US 5686295, включенном в настоящее описание в виде ссылки. Однако Sorangium cellulosum, как известно, обладает слабой способностью к ферментации и в результате продуцирует низкие уровни эпотилонов. Рекомбинантное получение эпотилонов в гетерологичных хозяевах, которые обладают более высокой способностью к ферментации, может решить существующие в настоящее время проблемы, связанные с производством эпотилонов. Однако гены, которые кодируют полипептиды, ответственные за биосинтез эпотилона, к настоящему времени не выявлены. Кроме того, штамм, который продуцирует эпотилоны, т.е. So ce90, также продуцирует по меньшей мере один дополнительный поликетид, спирангиен, который, как ожидается, сильно затрудняет выделение генов, непосредственно участвующих в биосинтезе эпотилонов.Despite the proven promise of epothilones as anticancer agents, their current commercial availability is limited by the problems associated with the preparation of these compounds. The compounds are too complex for industrial chemical synthesis, and therefore they must be obtained by fermentation. Methods of genetic manipulation with myxobacteria, such as Sorangium cellulosum, are described in US Pat. No. 5,686,295, incorporated herein by reference. However, Sorangium cellulosum is known to have poor fermentation ability and, as a result, produces low levels of epothilones. Recombinant production of epothilones in heterologous hosts that have a higher fermentation ability can solve the current problems associated with the production of epothilones. However, genes that encode the polypeptides responsible for epothilone biosynthesis have not yet been identified. In addition, a strain that produces epothilones, i.e. So ce90 also produces at least one additional polyketide, spirangien, which is expected to greatly complicate the isolation of genes directly involved in epothilone biosynthesis.

Таким образом, в свете вышеизложенного одним из объектов настоящего изобретения является выделение генов, которые участвуют в синтезе эпотилонов, прежде всего генов, которые участвуют в синтезе эпотилонов А и В в миксобактериях группы Sorangium/Polyangium, т.е. в штамме Sorangium cellulosum So ce90. Еще одним объектом изобретения является способ рекомбинантного получения эпотилонов с целью их применения в противораковых композициях.Thus, in light of the foregoing, one of the objects of the present invention is the isolation of genes that participate in the synthesis of epothilones, especially genes that participate in the synthesis of epothilones A and B in Myxobacteria of the Sorangium / Polyangium group, i.e. in the strain Sorangium cellulosum So ce90. Another object of the invention is a method for the recombinant production of epothilones for the purpose of their use in anticancer compositions.

Краткое изложение сущности изобретенияSummary of the invention

Для осуществления вышеуказанных и других объектов изобретения при создании изобретения неожиданно удалось преодолеть указанные выше трудности и впервые получить молекулу нуклеиновой кислоты, включающую нуклеотидную последовательность, которая кодирует по меньшей мере один полипептид, участвующий в биосинтезе эпотилона. Согласно предпочтительному варианту осуществления нуклеотидную последовательность выделяют из видов, принадлежащих к Myxobacteria, наиболее предпочтительно Sorangium cellulosum.To implement the above and other objects of the invention, when creating the invention, it was unexpectedly possible to overcome the above difficulties and to obtain for the first time a nucleic acid molecule comprising a nucleotide sequence that encodes at least one polypeptide involved in the epothilone biosynthesis. According to a preferred embodiment, the nucleotide sequence is isolated from species belonging to Myxobacteria, most preferably Sorangium cellulosum.

Согласно другому предпочтительному варианту осуществления настоящее изобретение относится к выделенной молекуле нуклеиновой кислоты, которая включает нуклеотидную последовательность, кодирующую по меньшей мере один полипептид, участвующий в биосинтезе эпотилона, где этот полипептид содержит аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: SEQ ID NO:2, аминокислоты 11-437 SEQ ID NO:2, аминокислоты 543-864 SEQ ID NO:2, аминокислоты 974-1273 SEQ ID NO:2, аминокислоты 1314-1385 SEQ ID NO:2, SEQ ID NO:3, аминокислоты 72-81 SEQ ID NO:3, аминокислоты 118-125 SEQ ID NO:3, аминокислоты 199-212 SEQ ID NO:3, аминокислоты 353-363 SEQ ID NO:3, аминокислоты 549-565 SEQ ID NO:3, аминокислоты 588-603 SEQ ID NO:3, аминокислоты 669-684 SEQ ID NO:3, аминокислоты 815-821 SEQ ID NO:3, аминокислоты 868-892 SEQ ID NO:3, аминокислоты 903-912 SEQ ID NO:3, аминокислоты 918-940 SEQ ID NO:3, аминокислоты 1268-1274 SEQ ID NO:3, аминокислоты 1285-1297 SEQ ID NO:3, аминокислоты 973-1256 SEQ ID NO:3, аминокислоты 1344-1351 SEQ ID NO:3, SEQ ID NO:4, аминокислоты 7-432 SEQ ID NO:4, аминокислоты 539-859 SEQ ID NO:4, аминокислоты 869-1037 SEQ ID NO:4, аминокислоты 1439-1684 SEQ ID NO:4, аминокислоты 1722-1792 SEQ ID NO:4, SEQ ID NO:5, аминокислоты 39-457 SEQ ID NO:5, аминокислоты 563-884 SEQ ID NO:5, аминокислоты 1147-1399 SEQ ID NO:5, аминокислоты 1434-1506 SEQ ID NO:5, аминокислоты 1524-1950 SEQ ID NO:5, аминокислоты 2056-2377 SEQ ID NO:5, аминокислоты 2645-2895 SEQ ID NO:5, аминокислоты 2932-3005 SEQ ID NO:5, аминокислоты 3024-3449 SEQ ID NO:5, аминокислоты 3555-3876 SEQ ID NO:5, аминокислоты 3886-4048 SEQ ID NO:5, аминокислоты 4433-4719 SEQ ID NO:5, аминокислоты 4729-4974 SEQ ID NO:5, аминокислоты 5010-5082 SEQ ID NO:5, аминокислоты 5103-5525 SEQ ID NO:5, аминокислоты 5631-5951 SEQ ID NO:5, аминокислоты 5964-6132 SEQ ID NO:5, аминокислоты 6542-6837 SEQ ID NO:5, аминокислоты 6857-7101 SEQ ID NO:5, аминокислоты 7140-7211 SEQ ID NO:5, SEQ ID NO:6, аминокислоты 35-454 SEQ ID NO:6, аминокислоты 561-881 SEQ ID NO:6, аминокислоты 1143-1393 SEQ ID NO:6, аминокислоты 1430-1503 SEQ ID NO:6, аминокислоты 1522-1946 SEQ ID NO: 6, аминокислоты 2053-2373 SEQ ID NO:6, аминокислоты 2383-2551 SEQ ID NO:6, аминокислоты 2671-3045 SEQ ID NO:6, аминокислоты 3392-3636 SEQ ID NO:6, аминокислоты 3673-3745 SEQ ID NO:6, SEQ ID NO:7, аминокислоты 32-450 SEQ ID NO:7, аминокислоты 556-877 SEQ ID NO:7, аминокислоты 887-1051 SEQ ID NO:7, аминокислоты 1478-1790 SEQ ID NO:7, аминокислоты 1810-2055 SEQ ID NO:7, аминокислоты 2093-2164 SEQ ID NO:7, аминокислоты 2165-2439 SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:11 и SEQ ID NO:22.According to another preferred embodiment, the present invention relates to an isolated nucleic acid molecule that comprises a nucleotide sequence encoding at least one polypeptide involved in the epothilone biosynthesis, where the polypeptide contains an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: SEQ ID NO: 2, amino acids 11-437 SEQ ID NO: 2, amino acids 543-864 SEQ ID NO: 2, amino acids 974-1273 SEQ ID NO: 2, amino acids 1314-1385 SEQ ID NO: 2, SEQ ID NO: 3 , amino acids 72-81 SEQ ID NO: 3, amino acids 118-125 SEQ ID NO: 3, amino acids 199-212 SEQ ID NO: 3, amino acids 353-363 SEQ ID NO: 3, amino acids 549-565 SEQ ID NO: 3, amino acids 588-603 SEQ ID NO: 3, amino acids 669-684 SEQ ID NO: 3, amino acids 815-821 SEQ ID NO: 3, amino acids 868-892 SEQ ID NO: 3, amino acids 903-912 SEQ ID NO: 3, amino acids 918-940 SEQ ID NO: 3, amino acids 1268-1274 SEQ ID NO: 3, amino acids 1285-1297 SEQ ID NO: 3, amino acids 973-1256 SEQ ID NO: 3, amino acids 1344-1351 SEQ ID NO: 3, SEQ ID NO: 4, amino acids 7-432 SEQ ID NO: 4, amino acids 539-859 SEQ ID NO: 4, amino acids 869-1037 SEQ ID NO: 4, amino acids 1439-1684 SEQ ID NO: 4, amino acids 1722-1792 SEQ ID NO: 4, SEQ ID NO: 5, amino acids 39-457 SEQ ID NO: 5, and amino acids 563-884 SEQ ID NO: 5, amino acids 1147-1399 SEQ ID NO: 5, amino acids 1434-1506 SEQ ID NO: 5, amino acids 1524-1950 SEQ ID NO: 5, amino acids 2056-2377 SEQ ID NO: 5, amino acids 2645-2895 SEQ ID NO: 5, amino acids 2932-3005 SEQ ID NO: 5, amino acids 3024-3449 SEQ ID NO: 5, amino acids 3555-3876 SEQ ID NO: 5, amino acids 3886-4048 SEQ ID NO: 5, amino acids 4433-4719 SEQ ID NO: 5, amino acids 4729-4974 SEQ ID NO: 5, amino acids 5010-5082 SEQ ID NO: 5, amino acids 5103-5525 SEQ ID NO: 5, amino acids 5631-5951 SEQ ID NO: 5, amino acids 5964-6132 SEQ ID NO: 5, amino acids 6542-6837 SEQ ID NO: 5, amino acids 6857-7101 SEQ ID NO: 5, amino acids 7140-7211 SEQ ID NO: 5, SEQ ID NO: 6, amino acids 35-454 SEQ ID NO: 6, amino acids 561-881 S EQ ID NO: 6, amino acids 1143-1393 SEQ ID NO: 6, amino acids 1430-1503 SEQ ID NO: 6, amino acids 1522-1946 SEQ ID NO: 6, amino acids 2053-2373 SEQ ID NO: 6, amino acids 2383-2551 SEQ ID NO: 6, amino acids 2671-3045 SEQ ID NO: 6, amino acids 3392-3636 SEQ ID NO: 6, amino acids 3673-3745 SEQ ID NO: 6, SEQ ID NO: 7, amino acids 32-450 SEQ ID NO: 7, amino acids 556-877 SEQ ID NO: 7, amino acids 887-1051 SEQ ID NO: 7, amino acids 1478-1790 SEQ ID NO: 7, amino acids 1810-2055 SEQ ID NO: 7, amino acids 2093-2164 SEQ ID NO: 7, amino acids 2165-2439 SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11 and SEQ ID NO: 22.

Согласно наиболее предпочтительному варианту осуществления настоящее изобретение относится к выделенной молекуле нуклеиновой кислоты, которая включает нуклеотидную последовательность, кодирующую по меньшей мере один полипептид, участвующий в биосинтезе эпотилона, где этот полипептид содержит аминокислотную последовательность, выбранную из ряда, включающего: SEQ ID NO:2, аминокислоты 11-437 SEQ ID NO:2, аминокислоты 543-864 SEQ ID NO:2, аминокислоты 974-1273 SEQ ID NO:2, аминокислоты 1314-1385 SEQ ID NO:2, SEQ ID NO:3, аминокислоты 72-81 SEQ ID NO:3, аминокислоты 118-125 SEQ ID NO:3, аминокислоты 199-212 SEQ ID NO:3, аминокислоты 353-363 SEQ ID NO:3, аминокислоты 549-565 SEQ ID NO:3, аминокислоты 588-603 SEQ ID NO:3, аминокислоты 669-684 SEQ ID NO:3, аминокислоты 815-821 SEQ ID NO:3, аминокислоты 868-892 SEQ ID NO:3, аминокислоты 903-912 SEQ ID NO:3, аминокислоты 918-940 SEQ ID NO:3, аминокислоты 1268-1274 SEQ ID NO:3, аминокислоты 1285-1297 SEQ ID NO:3, аминокислоты 973-1256 SEQ ID NO:3, аминокислоты 1344-1351 SEQ ID NO:3, SEQ ID NO:4, аминокислоты 7-432 SEQ ID NO:4, аминокислоты 539-859 SEQ ID NO:4, аминокислоты 869-1037 SEQ ID NO:4, аминокислоты 1439-1684 SEQ ID NO:4, аминокислоты 1722-1792 SEQ ID NO:4, SEQ ID NO:5, аминокислоты 39-457 SEQ ID NO:5, аминокислоты 563-884 SEQ ID NO:5, аминокислоты 1147-1399 SEQ ID NO:5, аминокислоты 1434-1506 SEQ ID NO:5, аминокислоты 1524-1950 SEQ ID NO:5, аминокислоты 2056-2377 SEQ ID NO:5, аминокислоты 2645-2895 SEQ ID NO:5, аминокислоты 2932-3005 SEQ ID NO:5, аминокислоты 3024-3449 SEQ ID NO:5, аминокислоты 3555-3876 SEQ ID NO:5, аминокислоты 3886-4048 SEQ ID NO:5, аминокислоты 4433-4719 SEQ ID NO:5, аминокислоты 4729-4974 SEQ ID NO:5, аминокислоты 5010-5082 SEQ ID NO:5, аминокислоты 5103-5525 SEQ ID NO:5, аминокислоты 5631-5951 SEQ ID NO:5, аминокислоты 5964-6132 SEQ ID NO:5, аминокислоты 6542-6837 SEQ ID NO:5, аминокислоты 6857-7101 SEQ ID NO:5, аминокислоты 7140-7211 SEQ ID NO:5, SEQ ID NO:6, аминокислоты 35-454 SEQ ID NO:6, аминокислоты 561-881 SEQ ID NO:6, аминокислоты 1143-1393 SEQ ID NO:6, аминокислоты 1430-1503 SEQ ID NO:6, аминокислоты 1522-1946 SEQ ID NO: 6, аминокислоты 2053-2373 SEQ ID NO:6, аминокислоты 2383-2551 SEQ ID NO:6, аминокислоты 2671-3045 SEQ ID NO:6, аминокислоты 3392-3636 SEQ ID NO:6, аминокислоты 3673-3745 SEQ ID NO:6, SEQ ID NO:7, аминокислоты 32-450 SEQ ID NO:7, аминокислоты 556-877 SEQ ID NO:7, аминокислоты 887-1051 SEQ ID NO:7, аминокислоты 1478-1790 SEQ ID NO:7, аминокислоты 1810-2055 SEQ ID NO:7, аминокислоты 2093-2164 SEQ ID NO:7, аминокислоты 2165-2439 SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:11 и SEQ ID NO:22.According to a most preferred embodiment, the present invention relates to an isolated nucleic acid molecule that comprises a nucleotide sequence encoding at least one polypeptide involved in the epothilone biosynthesis, where the polypeptide contains an amino acid sequence selected from the series including: SEQ ID NO: 2, amino acids 11-437 SEQ ID NO: 2, amino acids 543-864 SEQ ID NO: 2, amino acids 974-1273 SEQ ID NO: 2, amino acids 1314-1385 SEQ ID NO: 2, SEQ ID NO: 3, amino acids 72-81 SEQ ID NO: 3, amino acids 118-125 SEQ ID NO: 3, amino acids s 199-212 SEQ ID NO: 3, amino acids 353-363 SEQ ID NO: 3, amino acids 549-565 SEQ ID NO: 3, amino acids 588-603 SEQ ID NO: 3, amino acids 669-684 SEQ ID NO: 3, amino acids 815-821 SEQ ID NO: 3, amino acids 868-892 SEQ ID NO: 3, amino acids 903-912 SEQ ID NO: 3, amino acids 918-940 SEQ ID NO: 3, amino acids 1268-1274 SEQ ID NO: 3, amino acids 1285-1297 SEQ ID NO: 3, amino acids 973-1256 SEQ ID NO: 3, amino acids 1344-1351 SEQ ID NO: 3, SEQ ID NO: 4, amino acids 7-432 SEQ ID NO: 4, amino acids 539-859 SEQ ID NO: 4, amino acids 869-1037 SEQ ID NO: 4, amino acids 1439-1684 SEQ ID NO: 4, amino acids 1722-1792 SEQ ID NO: 4, SEQ ID NO: 5, amino acids 39-457 SEQ ID NO: 5, amino acids 563-884 SEQ ID NO: 5, amino acids 1147-1399 SEQ ID NO: 5, amino acids you are 1434-1506 SEQ ID NO: 5, amino acids 1524-1950 SEQ ID NO: 5, amino acids 2056-2377 SEQ ID NO: 5, amino acids 2645-2895 SEQ ID NO: 5, amino acids 2932-3005 SEQ ID NO: 5, amino acids 3024-3449 SEQ ID NO: 5, amino acids 3555-3876 SEQ ID NO: 5, amino acids 3886-4048 SEQ ID NO: 5, amino acids 4433-4719 SEQ ID NO: 5, amino acids 4729-4974 SEQ ID NO: 5, amino acids 5010-5082 SEQ ID NO: 5, amino acids 5103-5525 SEQ ID NO: 5, amino acids 5631-5951 SEQ ID NO: 5, amino acids 5964-6132 SEQ ID NO: 5, amino acids 6542-6837 SEQ ID NO: 5, amino acids 6857-7101 SEQ ID NO: 5, amino acids 7140-7211 SEQ ID NO: 5, SEQ ID NO: 6, amino acids 35-454 SEQ ID NO: 6, amino acids 561-881 SEQ ID NO: 6, amino acids 1143-1393 SEQ ID NO: 6, amino acids 1430-1503 SEQ ID NO: 6, and amino acids 1522-1946 SEQ ID NO: 6, amino acids 2053-2373 SEQ ID NO: 6, amino acids 2383-2551 SEQ ID NO: 6, amino acids 2671-3045 SEQ ID NO: 6, amino acids 3392-3636 SEQ ID NO: 6, amino acids 3673-3745 SEQ ID NO: 6, SEQ ID NO: 7, amino acids 32-450 SEQ ID NO: 7, amino acids 556-877 SEQ ID NO: 7, amino acids 887-1051 SEQ ID NO: 7, amino acids 1478-1790 SEQ ID NO: 7, amino acids 1810-2055 SEQ ID NO: 7, amino acids 2093-2164 SEQ ID NO: 7, amino acids 2165-2439 SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11 and SEQ ID NO: 22.

Согласно еще одному предпочтительному варианту осуществления настоящее изобретение относится к выделенной молекуле нуклеиновой кислоты, которая включает нуклеотидную последовательность, кодирующую по меньшей мере один полипептид, участвующий в биосинтезе эпотилона, где эта нуклеотидная последовательность практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: комплемент нуклеотидов 1900-3171 SEQ ID NO:1, нуклеотидов 3415-5556 SEQ ID NO:1, нуклеотидов 7610-11875 SEQ ID NO:1, нуклеотидов 7643-8920 SEQ ID NO:1, нуклеотидов 9236-10201 SEQ ID NO:1, нуклеотидов 10529-11428 SEQ ID NO:1, нуклеотидов 11549-11764 SEQ ID NO:1, нуклеотидов 11872-16104 SEQ ID NO:1, нуклеотидов 12085-12114 SEQ ID NO:1, нуклеотидов 12223-12246 SEQ ID NO:1, нуклеотидов 12466-12507 SEQ ID NO:1, нуклеотидов 12928-12960 SEQ ID NO:1, нуклеотидов 13516-13566 SEQ ID NO:1, нуклеотидов 13633-13680 SEQ ID NO:1, нуклеотидов 13876-13923 SEQ ID NO:1, нуклеотидов 14313-14334 SEQ ID NO:1, нуклеотидов 14473-14547 SEQ ID NO:1, нуклеотидов 14578-14607 SEQ ID NO:1, нуклеотидов 14623-14692 SEQ ID NO:1, нуклеотидов 15673-15693 SEQ ID NO:1, нуклеотидов 15724-15762 SEQ ID NO:1, нуклеотидов 14788-15639 SEQ ID NO:1, нуклеотидов 15901-15924 SEQ ID NO:1, нуклеотидов 16251-21749 SEQ ID NO:1, нуклеотидов 16269-17546 SEQ ID NO:1, нуклеотидов 17865-18827 SEQ ID NO:1, нуклеотидов 18855-19361 SEQ ID NO:1, нуклеотидов 20565-21302 SEQ ID NO:1, нуклеотидов 21414-21626 SEQ ID NO:1, нуклеотидов 21746-43519 SEQ ID NO:1, нуклеотидов 21860-23116 SEQ ID NO:1, нуклеотидов 23431-24397 SEQ ID NO:1, нуклеотидов 25184-25942 SEQ ID NO:1, нуклеотидов 26045-26263 SEQ ID NO:1, нуклеотидов 26318-27595 SEQ ID NO:1, нуклеотидов 27911-28876 SEQ ID NO:1, нуклеотидов 29678-30429 SEQ ID NO:1, нуклеотидов 30539-30759 SEQ ID NO:1, нуклеотидов 30815-32092 SEQ ID NO:1, нуклеотидов 32408-33373 SEQ ID NO:1, нуклеотидов 33401-33889 SEQ ID NO:1, нуклеотидов 35042-35902 SEQ ID NO:1, нуклеотидов 35930-36667 SEQ ID NO:1, нуклеотидов 36773-36991 SEQ ID NO:1, нуклеотидов 37052-38320 SEQ ID NO:1, нуклеотидов 38636-39598 SEQ ID NO:1, нуклеотидов 39635-40141 SEQ ID NO:1, нуклеотидов 41369-42256 SEQ ID NO:1, нуклеотидов 42314-43048 SEQ ID NO:1, нуклеотидов 43163-43378 SEQ ID NO:1, нуклеотидов 43524-54920 SEQ ID NO:1, нуклеотидов 43626-44885 SEQ ID NO:1, нуклеотидов 45204-46166 SEQ ID NO:1, нуклеотидов 46950-47702 SEQ ID NO:1, нуклеотидов 47811-48032 SEQ ID NO:1, нуклеотидов 48087-49361 SEQ ID NO:1, нуклеотидов 49680-50642 SEQ ID NO:1, нуклеотидов 50670-51176 SEQ ID NO:1, нуклеотидов 51534-52657 SEQ ID NO:1, нуклеотидов 53697-54431 SEQ ID NO:1, нуклеотидов 54540-54758 SEQ ID NO:1, нуклеотидов 54935-62254 SEQ ID NO:1, нуклеотидов 55028-56284 SEQ ID NO:1, нуклеотидов 56600-57565 SEQ ID NO:1, нуклеотидов 57593-58087 SEQ ID NO:1, нуклеотидов 59366-60304 SEQ ID NO:1, нуклеотидов 60362-61099 SEQ ID NO:1, нуклеотидов 61211-61426 SEQ ID NO:1, нуклеотидов 61427-62254 SEQ ID NO:1, нуклеотидов 62369-63628 SEQ ID NO:1, нуклеотидов 67334-68251 SEQ ID NO:1 и нуклеотидов 1-68750 SEQ ID NO:1.According to another preferred embodiment, the present invention relates to an isolated nucleic acid molecule that comprises a nucleotide sequence encoding at least one polypeptide involved in the biosynthesis of epothilone, where this nucleotide sequence is almost the same as a nucleotide sequence selected from the series including: complement of nucleotides 1900 -3171 SEQ ID NO: 1, nucleotides 3415-5556 SEQ ID NO: 1, nucleotides 7610-11875 SEQ ID NO: 1, nucleotides 7643-8920 SEQ ID NO: 1, nucleotides 9236-10201 SEQ ID NO: 1, nucle leotides 10529-11428 SEQ ID NO: 1, nucleotides 11549-11764 SEQ ID NO: 1, nucleotides 11872-16104 SEQ ID NO: 1, nucleotides 12085-12114 SEQ ID NO: 1, nucleotides 12223-12246 SEQ ID NO: 1, nucleotides 12466-12507 SEQ ID NO: 1, nucleotides 12928-12960 SEQ ID NO: 1, nucleotides 13516-13566 SEQ ID NO: 1, nucleotides 13633-13680 SEQ ID NO: 1, nucleotides 13876-13923 SEQ ID NO: 1, nucleotides 14313-14334 SEQ ID NO: 1, nucleotides 14473-14547 SEQ ID NO: 1, nucleotides 14578-14607 SEQ ID NO: 1, nucleotides 14623-14692 SEQ ID NO: 1, nucleotides 15673-15693 SEQ ID NO: 1, nucleotides 15724-15762 SEQ ID NO: 1, nucleotides 14788-15639 SEQ ID NO: 1, nucleotides 15901-15924 SEQ ID NO: 1, nucleotides 16251-21749 SEQ ID NO: 1, nucleotides 16269-17546 SEQ ID NO: 1, nucleotides 17865-18827 SEQ ID NO: 1 , nucleotides 18855-19361 SEQ ID NO: 1, nucleotides 20565-21302 SEQ ID NO: 1, nucleotides 21414-21626 SEQ ID NO: 1, nucleotides 21746-43519 SEQ ID NO: 1, nucleotides 21860-23116 SEQ ID NO: 1 , nucleotides 23431-24397 SEQ ID NO: 1, nucleotides 25184-25942 SEQ ID NO: 1, nucleotides 26045-26263 SEQ ID NO: 1, nucleotides 26318-27595 SEQ ID NO: 1, nucleotides 27911-28876 SEQ ID NO: 1 , nucleotides 29678-30429 SEQ ID NO: 1, nucleotides 30539-30759 SEQ ID NO: 1, nucleotides 30815-32092 SEQ ID NO: 1, nucleotides 32408-33373 SEQ ID NO: 1, nucleotides 33401-33889 SEQ ID NO: 1 , nucleotides 35042-35902 SEQ ID NO: 1, nucleotides 35930-36667 SEQ ID NO: 1, nucleotides 36773-36991 SEQ ID NO: 1, nucleotides 37052-38320 SEQ ID NO: 1, nucleotides 38636-39598 SEQ ID NO: 1 nucleotides 39635-40141 SEQ ID NO: 1, nucleotides 41369-42256 SEQ ID NO: 1, nucleotides 42314-43048 SEQ ID NO: 1, nucleotides 43163-43378 SEQ ID NO: 1, nucleotides 43524-54920 SEQ ID NO: 1, nucleotides 43626-44885 SEQ ID NO: 1, nucleotides 45204-46166 SEQ ID NO: 1, nucleotides 46950-47702 SEQ ID NO: 1, nucleotides 47811-48032 SEQ ID NO: 1, nucleotides 48087-49361 SEQ ID NO: 1, nucleotides 49680-50642 SEQ ID NO: 1, nucleotides 50670-51176 SEQ ID NO: 1, nucleotides 51534-52657 SEQ ID NO: 1, nucleotides 53697-54431 SEQ ID NO: 1, nucleotides 54540-54758 SEQ ID NO: 1, nucleotides 54935-62254 SEQ ID NO: 1, nucleotides 55028-56284 SEQ ID NO: 1, nucleotides 56600-57565 SEQ ID NO: 1, nucleotides 57593-58087 SEQ ID NO: 1, nucleotides 59366-60304 SEQ ID NO: 1, nucleotides 60362-61099 SEQ ID NO: 1, nucleotides 61211-6 1426 SEQ ID NO: 1, nucleotides 61427-62254 SEQ ID NO: 1, nucleotides 62369-63628 SEQ ID NO: 1, nucleotides 67334-68251 SEQ ID NO: 1 and nucleotides 1-68750 SEQ ID NO: 1.

Согласно особенно предпочтительному варианту осуществления настоящее изобретение относится к молекуле нуклеиновой кислоты, которая включает нуклеотидную последовательность, кодирующую по меньшей мере один полипептид, участвующий в биосинтезе эпотилона, где нуклеотидную последовательность выбирают из ряда, включающего: комплемент нуклеотидов 1900-3171 SEQ ID NO:1, нуклеотидов 3415-5556 SEQ ID NO:1, нуклеотидов 7610-11875 SEQ ID NO:1, нуклеотидов 7643-8920 SEQ ID NO:1, нуклеотидов 9236-10201 SEQ ID NO:1, нуклеотидов 10529-11428 SEQ ID NO:1, нуклеотидов 11549-11764 SEQ ID NO:1, нуклеотидов 11872-16104 SEQ ID NO:1, нуклеотидов 12085-12114 SEQ ID NO:1, нуклеотидов 12223-12246 SEQ ID NO:1, нуклеотидов 12466-12507 SEQ ID NO:1, нуклеотидов 12928-12960 SEQ ID NO:1, нуклеотидов 13516-13566 SEQ ID NO:1, нуклеотидов 13633-13680 SEQ ID NO:1, нуклеотидов 13876-13923 SEQ ID NO:1, нуклеотидов 14313-14334 SEQ ID NO:1, нуклеотидов 14473-14547 SEQ ID NO:1, нуклеотидов 14578-14607 SEQ ID NO:1, нуклеотидов 14623-14692 SEQ ID NO:1, нуклеотидов 15673-15693 SEQ ID NO:1, нуклеотидов 15724-15762 SEQ ID NO:1, нуклеотидов 14788-15639 SEQ ID NO:1, нуклеотидов 15901-15924 SEQ ID NO:1, нуклеотидов 16251-21749 SEQ ID NO:1, нуклеотидов 16269-17546 SEQ ID NO:1, нуклеотидов 17865-18827 SEQ ID NO:1, нуклеотидов 18855-19361 SEQ ID NO:1, нуклеотидов 20565-21302 SEQ ID NO:1, нуклеотидов 21414-21626 SEQ ID NO:1, нуклеотидов 21746-43519 SEQ ID NO:1, нуклеотидов 21860-23116 of SEQ ID NO:1, нуклеотидов 23431-24397 SEQ ID NO:1, нуклеотидов 25184-25942 SEQ ID NO:1, нуклеотидов 26045-26263 SEQ ID NO:1, нуклеотидов 26318-27595 SEQ ID NO:1, нуклеотидов 27911-28876 SEQ ID NO:1, нуклеотидов 29678-30429 SEQ ID NO:1, нуклеотидов 30539-30759 SEQ ID NO:1, нуклеотидов 30815-32092 SEQ ID NO:1, нуклеотидов 32408-33373 SEQ ID NO:1, нуклеотидов 33401-33889 SEQ ID NO:1, нуклеотидов 35042-35902 SEQ ID NO:1, нуклеотидов 35930-36667 SEQ ID NO:1, нуклеотидов 36773-36991 SEQ ID NO:1, нуклеотидов 37052-38320 SEQ ID NO:1, нуклеотидов 38636-39598 SEQ ID NO:1, нуклеотидов 39635-40141 SEQ ID NO:1, нуклеотидов 41369-42256 SEQ ID NO:1, нуклеотидов 42314-43048 SEQ ID NO:1, нуклеотидов 43163-43378 SEQ ID NO:1, нуклеотидов 43524-54920 SEQ ID NO:1, нуклеотидов 43626-44885 SEQ ID NO:1, нуклеотидов 45204-46166 SEQ ID NO:1, нуклеотидов 46950-47702 SEQ ID NO:1, нуклеотидов 47811-48032 SEQ ID NO:1, нуклеотидов 48087-49361 SEQ ID NO:1, нуклеотидов 49680-50642 SEQ ID NO:1, нуклеотидов 50670-51176 SEQ ID NO:1, нуклеотидов 51534-52657 SEQ ID NO:1, нуклеотидов 53697-54431 SEQ ID NO:1, нуклеотидов 54540-54758 SEQ ID NO:1, нуклеотидов 54935-62254 SEQ ID NO:1, нуклеотидов 55028-56284 SEQ ID NO:1, нуклеотидов 56600-57565 SEQ ID NO:1, нуклеотидов 57593-58087 SEQ ID NO:1, нуклеотидов 59366-60304 SEQ ID NO:1, нуклеотидов 60362-61099 SEQ ID NO:1, нуклеотидов 61211-61426 SEQ ID NO:1, нуклеотидов 61427-62254 SEQ ID NO:1, нуклеотидов 62369-63628 SEQ ID NO:1, нуклеотидов 67334-68251 SEQ ID NO:1 и нуклеотидов 1-68750 SEQ ID NO:1.According to a particularly preferred embodiment, the present invention relates to a nucleic acid molecule that comprises a nucleotide sequence encoding at least one polypeptide involved in the epothilone biosynthesis, where the nucleotide sequence is selected from the series including: nucleotide complement 1900-3171 SEQ ID NO: 1, nucleotides 3415-5556 SEQ ID NO: 1, nucleotides 7610-11875 SEQ ID NO: 1, nucleotides 7643-8920 SEQ ID NO: 1, nucleotides 9236-10201 SEQ ID NO: 1, nucleotides 10529-11428 SEQ ID NO: 1, nucleotides 11549-11764 SEQ ID NO: 1, nucleotides 11872-16104 SEQ ID NO: 1, n nucleotides 12085-12114 SEQ ID NO: 1, nucleotides 12223-12246 SEQ ID NO: 1, nucleotides 12466-12507 SEQ ID NO: 1, nucleotides 12928-12960 SEQ ID NO: 1, nucleotides 13516-13566 SEQ ID NO: 1, nucleotides 13633-13680 SEQ ID NO: 1, nucleotides 13876-13923 SEQ ID NO: 1, nucleotides 14313-14334 SEQ ID NO: 1, nucleotides 14473-14547 SEQ ID NO: 1, nucleotides 14578-14607 SEQ ID NO: 1, nucleotides 14623-14692 SEQ ID NO: 1, nucleotides 15673-15693 SEQ ID NO: 1, nucleotides 15724-15762 SEQ ID NO: 1, nucleotides 14788-15639 SEQ ID NO: 1, nucleotides 15901-15924 SEQ ID NO: 1, nucleotides 16251-21749 SEQ ID NO: 1, nucleotides 16269-17546 SEQ ID NO: 1, nucleotides 17865-18827 SEQ ID NO: 1, nucleotides 18855-19361 SEQ ID NO: 1, nucleotides 20565-21302 SEQ ID NO: 1, Nucleotides 21414-21626 SEQ ID NO: 1, nucleotides 21746-43519 SEQ ID NO: 1, nucleotides 21860-23116 of SEQ ID NO: 1, nucleotides 23431-24397 SEQ ID NO: 1, nucleotides 25184-25942 SEQ ID NO: 1, nucleotides 26045-26263 SEQ ID NO: 1, nucleotides 26318-27595 SEQ ID NO: 1, nucleotides 27911-28876 SEQ ID NO: 1, nucleotides 29678-30429 SEQ ID NO: 1, nucleotides 30539-30759 SEQ ID NO: 1, nucleotides 30815-32092 SEQ ID NO: 1, nucleotides 32408-33373 SEQ ID NO: 1, nucleotides 33401-33889 SEQ ID NO: 1, nucleotides 35042-35902 SEQ ID NO: 1, nucleotides 35930-36667 SEQ ID NO: 1, nucleotides 36773-36991 SEQ ID NO: 1, nucleotides 37052-38320 SEQ ID NO: 1, nucleotides 38636-39598 SEQ ID NO: 1, nucleotides 39635-40141 SEQ ID NO: 1, nucleotides 41369-42256 SEQ ID NO: 1, nucleotides 42314-43048 SEQ ID NO: 1, nucleotides 43163-43 378 SEQ ID NO: 1, nucleotides 43524-54920 SEQ ID NO: 1, nucleotides 43626-44885 SEQ ID NO: 1, nucleotides 45204-46166 SEQ ID NO: 1, nucleotides 46950-47702 SEQ ID NO: 1, nucleotides 47811- 48032 SEQ ID NO: 1, nucleotides 48087-49361 SEQ ID NO: 1, nucleotides 49680-50642 SEQ ID NO: 1, nucleotides 50670-51176 SEQ ID NO: 1, nucleotides 51534-52657 SEQ ID NO: 1, nucleotides 53697- 54431 SEQ ID NO: 1, nucleotides 54540-54758 SEQ ID NO: 1, nucleotides 54935-62254 SEQ ID NO: 1, nucleotides 55028-56284 SEQ ID NO: 1, nucleotides 56600-57565 SEQ ID NO: 1, nucleotides 57593- 58087 SEQ ID NO: 1, nucleotides 59366-60304 SEQ ID NO: 1, nucleotides 60362-61099 SEQ ID NO: 1, nucleotides 61211-61426 SEQ ID NO: 1, nucleotides 61427-62254 SEQ ID NO: 1, nucleotides 62369- 63628 SEQ ID NO: 1, nucleotides 67334-68251 SEQ ID NO: 1 and nucleotides 1-68750 SEQ ID NO: 1.

Согласно еще одному предпочтительному варианту осуществления настоящее изобретение относится к выделенной молекуле нуклеиновой кислоты, которая включает нуклеотидную последовательность, кодирующую по меньшей мере один полипептид, участвующий в биосинтезе эпотилона, где эта нуклеотидная последовательность включает область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: комплемент нуклеотидов 1900-3171 SEQ ID NO:1, нуклеотидов 3415-5556 SEQ ID NO:1, нуклеотидов 7610-11875 SEQ ID NO:1, нуклеотидов 7643-8920 SEQ ID NO:1, нуклеотидов 9236-10201 SEQ ID NO:1, нуклеотидов 10529-11428 SEQ ID NO:1, нуклеотидов 11549-11764 SEQ ID NO:1, нуклеотидов 11872-16104 SEQ ID NO:1, нуклеотидов 12085-12114 SEQ ID NO:1, нуклеотидов 12223-12246 SEQ ID NO:1, нуклеотидов 12466-12507 SEQ ID NO:1, нуклеотидов 12928-12960 SEQ ID NO:1, нуклеотидов 13516-13566 SEQ ID NO:1, нуклеотидов 13633-13680 SEQ ID NO:1, нуклеотидов 13876-13923 SEQ ID NO:1, нуклеотидов 14313-14334 SEQ ID NO:1, нуклеотидов 14473-14547 SEQ ID NO:1, нуклеотидов 14578-14607 SEQ ID NO:1, нуклеотидов 14623-14692 SEQ ID NO:1, нуклеотидов 15673-15693 SEQ ID NO:1, нуклеотидов 15724-15762 SEQ ID NO:1, нуклеотидов 14788-15639 SEQ ID NO:1, нуклеотидов 15901-15924 SEQ ID NO:1, нуклеотидов 16251-21749 SEQ ID NO:1, нуклеотидов 16269-17546 SEQ ID NO:1, нуклеотидов 17865-18827 SEQ ID NO:1, нуклеотидов 18855-19361 SEQ ID NO:1, нуклеотидов 20565-21302 SEQ ID NO:1, нуклеотидов 21414-21626 SEQ ID NO:1, нуклеотидов 21746-43519 SEQ ID NO:1, нуклеотидов 21860-23116 SEQ ID NO:1, нуклеотидов 23431-24397 SEQ ID NO:1, нуклеотидов 25184-25942 SEQ ID NO:1, нуклеотидов 26045-26263 of SEQ ID NO:1, нуклеотидов 26318-27595 SEQ ID NO:1, нуклеотидов 27911-28876 SEQ ID NO:1, нуклеотидов 29678-30429 SEQ ID NO:1, нуклеотидов 30539-30759 SEQ ID NO:1, нуклеотидов 30815-32092 SEQ ID NO:1, нуклеотидов 32408-33373 SEQ ID NO:1, нуклеотидов 33401-33889 SEQ ID NO:1, нуклеотидов 35042-35902 SEQ ID NO:1, нуклеотидов 35930-36667 SEQ ID NO:1, нуклеотидов 36773-36991 SEQ ID NO:1, нуклеотидов 37052-38320 SEQ ID NO:1, нуклеотидов 38636-39598 SEQ ID NO:1, нуклеотидов 39635-40141 SEQ ID NO:1, нуклеотидов 41369-42256 SEQ ID NO:1, нуклеотидов 42314-43048 SEQ ID NO:1, нуклеотидов 43163-43378 SEQ ID NO:1, нуклеотидов 43524-54920 SEQ ID NO:1, нуклеотидов 43626-44885 SEQ ID NO:1, нуклеотидов 45204-46166 SEQ ID NO:1, нуклеотидов 46950-47702 SEQ ID NO:1, нуклеотидов 47811-48032 SEQ ID NO:1, нуклеотидов 48087-49361 SEQ ID NO:1, нуклеотидов 49680-50642 SEQ ID NO:1, нуклеотидов 50670-51176 SEQ ID NO:1, нуклеотидов 51534-52657 SEQ ID NO:1, нуклеотидов 53697-54431 SEQ ID NO:1, нуклеотидов 54540-54758 SEQ ID NO:1, нуклеотидов 54935-62254 SEQ ID NO:1, нуклеотидов 55028-56284 SEQ ID NO:1, нуклеотидов 56600-57565 SEQ ID NO:1, нуклеотидов 57593-58087 SEQ ID NO:1, нуклеотидов 59366-60304 SEQ ID NO:1, нуклеотидов 60362-61099 SEQ ID NO:1, нуклеотидов 61211-61426 SEQ ID NO:1, нуклеотидов 61427-62254 SEQ ID NO:1, нуклеотидов 62369-63628 SEQ ID NO:1, нуклеотидов 67334-68251 SEQ ID NO:1 и нуклеотидов 1-68750 SEQ ID NO:1.According to another preferred embodiment, the present invention relates to an isolated nucleic acid molecule that comprises a nucleotide sequence encoding at least one polypeptide involved in epothilone biosynthesis, where this nucleotide sequence comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35 , 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of the nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferred 20) consecutive base pairs of a nucleotide sequence selected from the series including: complement of nucleotides 1900-3171 SEQ ID NO: 1, nucleotides 3415-5556 SEQ ID NO: 1, nucleotides 7610-11875 SEQ ID NO: 1, nucleotides 7643-8920 SEQ ID NO: 1, nucleotides 9236-10201 SEQ ID NO: 1, nucleotides 10529-11428 SEQ ID NO: 1, nucleotides 11549-11764 SEQ ID NO: 1, nucleotides 11872-16104 SEQ ID NO: 1, nucleotides 12085-12114 SEQ ID NO: 1, nucleotides 12223-12246 SEQ ID NO: 1, nucleotides 12466-12507 SEQ ID NO: 1, nucleotides 12928-12960 SEQ ID NO: 1, nucleotides 13516-13566 SEQ ID NO: 1, nucleotides 13633-13680 SEQ ID NO: 1, nucleotides 13876-13923 SEQ ID NO: 1, nucleotides 14313-14334 SEQ ID NO: 1, nucleotides 14473-14547 SEQ ID NO: 1, nucleotides 14578-14607 SEQ ID NO: 1, nucleotides 14623-14692 SEQ ID NO: 1, nucleotides 15673-15693 SEQ ID NO: 1, nucleotides 15724-15762 SEQ ID NO: 1, nucleotides 14788-15639 SEQ ID NO: 1, nucleotides 15901-15924 SEQ ID NO: 1, nucleotides 16251-21749 SEQ ID NO: 1, nucleotides 16269-17546 SEQ ID NO: 1, nucleotides 17865-18827 SEQ ID NO: 1, nucleotides 18855-19361 SEQ ID NO: 1, nucleotides 20565-21302 SEQ ID NO: 1, nucleotides 21414-21626 SEQ ID NO: 1, nucleotides 21746-43519 SEQ ID NO: 1, nucleotides 21860-23116 SEQ ID NO: 1, nucleotides 23431-24397 SEQ ID NO: 1, nucleotides 25184-25942 SEQ ID NO: 1, nucleotides 26045-26263 of SEQ ID NO: 1, nucleotides 26318-27595 SEQ ID NO: 1, nucleotides 27911-28876 SEQ ID NO: 1, nucleotides 29678-30429 SEQ ID NO: 1, nucleo tides 30539-30759 SEQ ID NO: 1, nucleotides 30815-32092 SEQ ID NO: 1, nucleotides 32408-33373 SEQ ID NO: 1, nucleotides 33401-33889 SEQ ID NO: 1, nucleotides 35042-35902 SEQ ID NO: 1, nucleotides 35930-36667 SEQ ID NO: 1, nucleotides 36773-36991 SEQ ID NO: 1, nucleotides 37052-38320 SEQ ID NO: 1, nucleotides 38636-39598 SEQ ID NO: 1, nucleotides 39635-40141 SEQ ID NO: 1, nucleotides 41369-42256 SEQ ID NO: 1, nucleotides 42314-43048 SEQ ID NO: 1, nucleotides 43163-43378 SEQ ID NO: 1, nucleotides 43524-54920 SEQ ID NO: 1, nucleotides 43626-44885 SEQ ID NO: 1, nucleotides 45204-46166 SEQ ID NO: 1, nucleotides 46950-47702 SEQ ID NO: 1, nucleotides 47811-48032 SEQ ID NO: 1, nucleotides 48087-49361 SEQ ID NO: 1, nucleotides 49680-50642 SEQ ID NO: 1, nucleotides 50670-51176 SEQ ID NO: 1, well Kleotides 51534-52657 SEQ ID NO: 1, nucleotides 53697-54431 SEQ ID NO: 1, nucleotides 54540-54758 SEQ ID NO: 1, nucleotides 54935-62254 SEQ ID NO: 1, nucleotides 55028-56284 SEQ ID NO: 1, nucleotides 56600-57565 SEQ ID NO: 1, nucleotides 57593-58087 SEQ ID NO: 1, nucleotides 59366-60304 SEQ ID NO: 1, nucleotides 60362-61099 SEQ ID NO: 1, nucleotides 61211-61426 SEQ ID NO: 1, nucleotides 61427-62254 SEQ ID NO: 1, nucleotides 62369-63628 SEQ ID NO: 1, nucleotides 67334-68251 SEQ ID NO: 1 and nucleotides 1-68750 SEQ ID NO: 1.

Настоящее изобретение также относится к химерному гену, включающему гетерологичную промоторную последовательность, функционально связанную с молекулой нуклеиновой кислоты по изобретению. Кроме того, настоящее изобретение относится к рекомбинантному вектору, включающему такой химерный ген, где вектор обладает способностью стабильно трансформировать клетку-хозяина. Настоящее изобретение также относится к рекомбинантной клетке-хозяину, включающей такой химерный ген, где клетка-хозяин обладает способностью экспрессировать нуклеотидную последовательность, которая кодирует по меньшей мере один полипептид, необходимый для биосинтеза эпотилона. Согласно предпочтительному варианту рекомбинантная клетка-хозяин представляет собой бактерию, принадлежащую к отряду Actinomycetales, и согласно более предпочтительному варианту рекомбинантная клетка-хозяин представляет собой штамм Streptomyces. Согласно другому предпочтительному варианту рекомбинантная клетка-хозяин представляет собой любую другую бактерию, способную к ферментации, такую как псевдомонада или Е.coli. Кроме того, настоящее изобретение относится к клону Вас (бактериальная искусственная хромосома), включающему молекулу нуклеиновой кислоты по изобретению, предпочтительно к Вас-клону рЕРO15.The present invention also relates to a chimeric gene comprising a heterologous promoter sequence operably linked to a nucleic acid molecule of the invention. In addition, the present invention relates to a recombinant vector comprising such a chimeric gene, where the vector has the ability to stably transform the host cell. The present invention also relates to a recombinant host cell comprising such a chimeric gene, wherein the host cell has the ability to express a nucleotide sequence that encodes at least one polypeptide necessary for epothilone biosynthesis. In a preferred embodiment, the recombinant host cell is a bacterium belonging to the Actinomycetales order, and in a more preferred embodiment, the recombinant host cell is a Streptomyces strain. In another preferred embodiment, the recombinant host cell is any other bacterium capable of fermentation, such as pseudomonad or E. coli. In addition, the present invention relates to a clone of you (bacterial artificial chromosome) comprising a nucleic acid molecule of the invention, preferably to you clone of pEPO15.

Другим объектом настоящего изобретения является выделенная молекула нуклеиновой кислоты, включающая нуклеотидную последовательность, которая кодирует домен эпотилон-синтазы.Another object of the present invention is an isolated nucleic acid molecule comprising a nucleotide sequence that encodes an epothilone synthase domain.

Согласно одному из вариантов осуществления домен эпотилон-синтазы представляет собой домен β-кетоацилсинтазы (KS), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 11-437 SEQ ID NO:2, аминокислоты 7-432 SEQ ID NO:4, аминокислоты 39-457 SEQ ID NO:5, аминокислоты 1524-1950 SEQ ID NO:5, аминокислоты 3024-3449 SEQ ID NO:5, аминокислоты 5103-5525 SEQ ID NO:5, аминокислоты 35-454 SEQ ID NO:6, аминокислоты 1522-1946 SEQ ID NO: 6 и аминокислоты 32-450 SEQ ID NO:7. Согласно этому варианту осуществления KS-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 11-437 SEQ ID NO:2, аминокислоты 7-432 SEQ ID NO:4, аминокислоты 39-457 SEQ ID NO:5, аминокислоты 1524-1950 SEQ ID NO:5, аминокислоты 3024-3449 SEQ ID NO:5, аминокислоты 5103-5525 SEQ ID NO:5, аминокислоты 35-454 SEQ ID NO:6, аминокислоты 1522-1946 SEQ ID NO: 6 и аминокислоты 32-450 SEQ ID NO:7. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность предпочтительно практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 7643-8920 SEQ ID NO:1, нуклеотиды 16269-17546 SEQ ID NO:1, нуклеотиды 21860-23116 SEQ ID NO:1, нуклеотиды 26318-27595 SEQ ID NO:1, нуклеотиды 30815-32092 SEQ ID NO:1, нуклеотиды 37052-38320 SEQ ID NO:1, нуклеотиды 43626-44885 SEQ ID NO:1, нуклеотиды 48087-49361 SEQ ID NO:1 и нуклеотиды 55028-56284 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 7643-8920 SEQ ID NO:1, нуклеотиды 16269-17546 SEQ ID NO:1, нуклеотиды 21860-23116 SEQ ID NO:1, нуклеотиды 26318-27595 SEQ ID NO:1, нуклеотиды 30815-32092 SEQ ID NO:1, нуклеотиды 37052-38320 SEQ ID NO:1, нуклеотиды 43626-44885 SEQ ID NO:1, нуклеотиды 48087-49361 SEQ ID NO:1 и нуклеотиды 55028-56284 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эту нуклеотидную последовательность наиболее предпочтительно выбирают из ряда, включающего: нуклеотиды 7643-8920 SEQ ID NO:1, нуклеотиды 16269-17546 SEQ ID NO:1, нуклеотиды 21860-23116 SEQ ID NO:1, нуклеотиды 26318-27595 SEQ ID NO:1, нуклеотиды 30815-32092 SEQ ID NO:1, нуклеотиды 37052-38320 SEQ ID NO:1, нуклеотиды 43626-44885 SEQ ID NO:1, нуклеотиды 48087-49361 SEQ ID NO:1 и нуклеотиды 55028-56284 SEQ ID NO:1.In one embodiment, the epothilone synthase domain is a β-ketoacyl synthase (KS) domain containing an amino acid sequence substantially similar to that selected from amino acids 11-437 of SEQ ID NO: 2, amino acids 7-432 of SEQ ID NO: 4, amino acids 39-457 SEQ ID NO: 5, amino acids 1524-1950 SEQ ID NO: 5, amino acids 3024-3449 SEQ ID NO: 5, amino acids 5103-5525 SEQ ID NO: 5, amino acids 35-454 SEQ ID Amino acids NO: 6, amino acids 1522-1946 of SEQ ID NO: 6 and amino acids 32-450 of SEQ ID NO: 7. According to this embodiment, the KS domain preferably contains an amino acid sequence selected from the series comprising: amino acids 11-437 of SEQ ID NO: 2, amino acids 7-432 of SEQ ID NO: 4, amino acids 39-457 of SEQ ID NO: 5, amino acids 1524 -1950 SEQ ID NO: 5, amino acids 3024-3449 SEQ ID NO: 5, amino acids 5103-5525 SEQ ID NO: 5, amino acids 35-454 SEQ ID NO: 6, amino acids 1522-1946 SEQ ID NO: 6 and amino acids 32 -450 SEQ ID NO: 7. In addition, according to this embodiment, said nucleotide sequence is preferably substantially the same as a nucleotide sequence selected from the series consisting of: nucleotides 7643-8920 SEQ ID NO: 1, nucleotides 16269-17546 SEQ ID NO: 1, nucleotides 21860-23116 SEQ ID NO: 1, nucleotides 26318-27595 SEQ ID NO: 1, nucleotides 30815-32092 SEQ ID NO: 1, nucleotides 37052-38320 SEQ ID NO: 1, nucleotides 43626-44885 SEQ ID NO: 1, nucleotides 48087-49361 SEQ ID NO: 1 and nucleotides 55028-56284 of SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of a nucleotide sequence selected from the series including: nucleotides 7643-8920 SEQ ID NO: 1, nucleotides 16269-17546 SEQ ID NO: 1, nucleotides 21860-23116 SEQ ID NO : 1, nucleotides 26318-27595 SEQ ID NO: 1, nucleot rows 30815-32092 SEQ ID NO: 1, nucleotides 37052-38320 SEQ ID NO: 1, nucleotides 43626-44885 SEQ ID NO: 1, nucleotides 48087-49361 SEQ ID NO: 1 and nucleotides 55028-56284 SEQ ID NO: 1. In addition, according to this embodiment, this nucleotide sequence is most preferably selected from the series including: nucleotides 7643-8920 SEQ ID NO: 1, nucleotides 16269-17546 SEQ ID NO: 1, nucleotides 21860-23116 SEQ ID NO: 1, nucleotides 26318 -27595 SEQ ID NO: 1, nucleotides 30815-32092 SEQ ID NO: 1, nucleotides 37052-38320 SEQ ID NO: 1, nucleotides 43626-44885 SEQ ID NO: 1, nucleotides 48087-49361 SEQ ID NO: 1 and nucleotides 55028 -56284 SEQ ID NO: 1.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен ацилтрансферазы (AT), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего; аминокислоты 543-864 SEQ ID NO:2, аминокислоты 539-859 SEQ ID NO:4, аминокислоты 563-884 SEQ ID NO:5, аминокислоты 2056-2377 SEQ ID NO:5, аминокислоты 3555-3876 SEQ ID NO:5, аминокислоты 5631-5951 SEQ ID NO:5, аминокислоты 561-881 SEQ ID NO:6, аминокислоты 2053-2373 SEQ ID NO:6 и аминокислоты 556-877 SEQ ID NO:7. Согласно этому варианту осуществления этот АТ-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 543-864 SEQ ID NO:2, аминокислоты 539-859 SEQ ID NO:4, аминокислоты 563-884 SEQ ID NO:5, аминокислоты 2056-2377 SEQ ID NO:5, аминокислоты 3555-3876 SEQ ID NO:5, аминокислоты 5631-5951 SEQ ID NO:5, аминокислоты 561-881 SEQ ID NO:6, аминокислоты 2053-2373 SEQ ID NO:6 и аминокислоты 556-877 SEQ ID NO:7. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 9236-10201 SEQ ID NO:1, нуклеотиды 17865-18827 SEQ ID NO:1, нуклеотиды 23431-24397 SEQ ID NO:1, нуклеотиды 27911-28876 SEQ ID NO:1, нуклеотиды 32408-33373 SEQ ID NO:1, нуклеотиды 38636-39598 SEQ ID NO:1, нуклеотиды 45204-46166 SEQ ID NO:1, нуклеотиды 49680-50642 SEQ ID NO:1 и нуклеотиды 56600-57565 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 9236-10201 SEQ ID NO:1, нуклеотиды 17865-18827 SEQ ID NO:1, нуклеотиды 23431-24397 SEQ ID NO:1, нуклеотиды 27911-28876 SEQ ID NO:1, нуклеотиды 32408-33373 SEQ ID NO:1, нуклеотиды 38636-39598 SEQ ID NO:1, нуклеотиды 45204-46166 SEQ ID NO:1, нуклеотиды 49680-50642 SEQ ID NO:1 и нуклеотиды 56600-57565 SEQ ID NO:1.In yet another embodiment, the epothilone synthase domain is an acyltransferase (AT) domain comprising an amino acid sequence substantially similar to an amino acid sequence selected from a series including; amino acids 543-864 SEQ ID NO: 2, amino acids 539-859 SEQ ID NO: 4, amino acids 563-884 SEQ ID NO: 5, amino acids 2056-2377 SEQ ID NO: 5, amino acids 3555-3876 SEQ ID NO: 5, amino acids 5631-5951 SEQ ID NO: 5, amino acids 561-881 SEQ ID NO: 6, amino acids 2053-2373 SEQ ID NO: 6 and amino acids 556-877 SEQ ID NO: 7. According to this embodiment, this AT domain preferably contains an amino acid sequence selected from the series comprising: amino acids 543-864 SEQ ID NO: 2, amino acids 539-859 SEQ ID NO: 4, amino acids 563-884 SEQ ID NO: 5, amino acids 2056-2377 SEQ ID NO: 5, amino acids 3555-3876 SEQ ID NO: 5, amino acids 5631-5951 SEQ ID NO: 5, amino acids 561-881 SEQ ID NO: 6, amino acids 2053-2373 SEQ ID NO: 6 and amino acids 556-877 SEQ ID NO: 7. In addition, according to this embodiment, said nucleotide sequence is substantially the same as a nucleotide sequence selected from the series consisting of: nucleotides 9236-10201 SEQ ID NO: 1, nucleotides 17865-18827 SEQ ID NO: 1, nucleotides 23431-24397 SEQ ID NO: 1 , nucleotides 27911-28876 SEQ ID NO: 1, nucleotides 32408-33373 SEQ ID NO: 1, nucleotides 38636-39598 SEQ ID NO: 1, nucleotides 45204-46166 SEQ ID NO: 1, nucleotides 49680-50642 SEQ ID NO: 1 and nucleotides 56600-57565 SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of a nucleotide sequence selected from the series including: nucleotides 9236-10201 SEQ ID NO: 1, nucleotides 17865-18827 SEQ ID NO: 1, nucleotides 23431-24397 SEQ ID NO : 1, nucleotides 27911-28876 SEQ ID NO: 1, nucle CHIDA 32408-33373 SEQ ID NO: 1, nucleotides 38636-39598 SEQ ID NO: 1, nucleotides 45204-46166 SEQ ID NO: 1, nucleotides 49680-50642 SEQ ID NO: 1 and nucleotides 56600-57565 SEQ ID NO: 1.

Кроме того, согласно этому варианту осуществления эту нуклеотидную последовательность наиболее предпочтительно выбирают из ряда, включающего: нуклеотиды 9236-10201 SEQ ID NO:1, нуклеотиды 17865-18827 SEQ ID NO:1, нуклеотиды 23431-24397 SEQ ID NO:1, нуклеотиды 27911-28876 SEQ ID NO:1, нуклеотиды 32408-33373 SEQ ID NO:1, нуклеотиды 38636-39598 SEQ ID NO:1, нуклеотиды 45204-46166 SEQ ID NO:1, нуклеотиды 49680-50642 SEQ ID NO:1 и нуклеотиды 56600-57565 SEQ ID NO:1.In addition, according to this embodiment, this nucleotide sequence is most preferably selected from the series including: nucleotides 9236-10201 SEQ ID NO: 1, nucleotides 17865-18827 SEQ ID NO: 1, nucleotides 23431-24397 SEQ ID NO: 1, nucleotides 27911 -28876 SEQ ID NO: 1, nucleotides 32408-33373 SEQ ID NO: 1, nucleotides 38636-39598 SEQ ID NO: 1, nucleotides 45204-46166 SEQ ID NO: 1, nucleotides 49680-50642 SEQ ID NO: 1 and nucleotides 56600 -57565 SEQ ID NO: 1.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен еноилредуктазы (ER), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 974-1273 SEQ ID NO:2, аминокислоты 4433-4719 SEQ ID NO:5, аминокислоты 6542-6837 SEQ ID NO:5 и аминокислоты 1478-1790 SEQ ID NO:7. Согласно этому варианту осуществления этот ER-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 974-1273 SEQ ID NO:2, аминокислоты 4433-4719 SEQ ID NO:5, аминокислоты 6542-6837 SEQ ID NO:5 и аминокислоты 1478-1790 SEQ ID NO:7. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность предпочтительно практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 10529-11428 SEQ ID NO:1, нуклеотиды 35042-35902 SEQ ID NO:1, нуклеотиды 41369-42256 SEQ ID NO:1 и нуклеотиды 59366-60304 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 10529-11428 SEQ ID NO:1, нуклеотиды 35042-35902 SEQ ID NO:1, нуклеотиды 41369-42256 SEQ ID NO:1 и нуклеотиды 59366-60304 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эту нуклеотидную последовательность наиболее предпочтительно выбирают из ряда, включающего: нуклеотиды 10529-11428 SEQ ID NO:1, нуклеотиды 35042-35902 SEQ ID NO:1, нуклеотиды 41369-42256 SEQ ID NO:1 и нуклеотиды 59366-60304 SEQ ID NO:1.According to yet another embodiment, the epothilone synthase domain is an enoyl reductase (ER) domain comprising an amino acid sequence substantially similar to that selected from amino acids 974-1273 of SEQ ID NO: 2, amino acids 4433-4719 of SEQ ID NO: 5, amino acids 6542-6837 of SEQ ID NO: 5 and amino acids 1478-1790 of SEQ ID NO: 7. According to this embodiment, this ER domain preferably contains an amino acid sequence selected from the series comprising: amino acids 974-1273 of SEQ ID NO: 2, amino acids 4433-4719 of SEQ ID NO: 5, amino acids 6542-6837 of SEQ ID NO: 5, and amino acids 1478-1790 SEQ ID NO: 7. In addition, according to this embodiment, said nucleotide sequence is preferably substantially similar to a nucleotide sequence selected from the series consisting of: nucleotides 10529-11428 SEQ ID NO: 1, nucleotides 35042-35902 SEQ ID NO: 1, nucleotides 41369-42256 SEQ ID NO: 1 and nucleotides 59366-60304 of SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of a nucleotide sequence selected from the series including: nucleotides 10529-11428 SEQ ID NO: 1, nucleotides 35042-35902 SEQ ID NO: 1, nucleotides 41369-42256 SEQ ID NO : 1 and nucleotides 59366-60304 SEQ ID NO: 1. In addition, according to this embodiment, this nucleotide sequence is most preferably selected from the series including: nucleotides 10529-11428 SEQ ID NO: 1, nucleotides 35042-35902 SEQ ID NO: 1, nucleotides 41369-42256 SEQ ID NO: 1 and nucleotides 59366 -60304 SEQ ID NO: 1.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен протеина-носителя ацила (АСР), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 1314-1385 SEQ ID NO:2, аминокислоты 1722-1792 SEQ ID NO:4, аминокислоты 1434-1506 SEQ ID NO:5, аминокислоты 2932-3005 SEQ ID NO:5, аминокислоты 5010-5082 SEQ ID NO:5, аминокислоты 7140-7211 SEQ ID NO:5, аминокислоты 1430-1503 SEQ ID NO:6. аминокислоты 3673-3745 SEQ ID NO:6 и аминокислоты 2093-2164 SEQ ID NO:7. Согласно этому варианту осуществления этот АСР-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 1314-1385 SEQ ID NO:2, аминокислоты 1722-1792 SEQ ID NO:4, аминокислоты 1434-1506 SEQ ID NO:5, аминокислоты 2932-3005 SEQ ID NO:5, аминокислоты 5010-5082 SEQ ID NO:5, аминокислоты 7140-7211 SEQ ID NO:5, аминокислоты 1430-1503 SEQ ID NO:6, аминокислоты 3673-3745 SEQ ID NO:6 и аминокислоты 2093-2164 SEQ ID NO:7. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 11549-11764 SEQ ID NO:1, нуклеотиды 21414- 21626 SEQ ID NO:1, нуклеотиды 26045-26263 SEQ ID NO:1, нуклеотиды 30539-30759 SEQ ID NO:1, нуклеотиды 36773-36991 SEQ ID NO:1, нуклеотиды 43163-43378 SEQ ID NO:1, нуклеотиды 47811-48032 SEQ ID NO:1, нуклеотиды 54540-54758 SEQ ID NO:1 и нуклеотиды 61211-61426 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 11549-11764 SEQ ID NO:1, нуклеотиды 21414-21626 SEQ ID NO:1, нуклеотиды 26045-26263 SEQ ID NO:1, нуклеотиды 30539-30759 SEQ ID NO:1, нуклеотиды 36773-36991 SEQ ID NO:1, нуклеотиды 43163-43378 SEQ ID NO:1, нуклеотиды 47811-48032 SEQ ID NO:1, нуклеотиды 54540-54758 SEQ ID NO:1 и нуклеотиды 61211-61426 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эту нуклеотидную последовательность наиболее предпочтительно выбирают из ряда, включающего: нуклеотиды 11549-11764 SEQ ID NO:1, нуклеотиды 21414-21626 SEQ ID NO:1, нуклеотиды 26045-26263 SEQ ID NO:1, нуклеотиды 30539-30759 SEQ ID NO:1, нуклеотиды 36773-36991 SEQ ID NO:1, нуклеотиды 43163-43378 SEQ ID NO:1, нуклеотиды 47811-48032 SEQ ID NO:1, нуклеотиды 54540-54758 SEQ ID NO:1, нуклеотиды 61211-61426 SEQ ID NO:1.According to another embodiment, the epothilone synthase domain is an acyl carrier protein domain (ACP) comprising an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 1314-1385 SEQ ID NO: 2, amino acids 1722-1792 SEQ ID NO: 4, amino acids 1434-1506 SEQ ID NO: 5, amino acids 2932-3005 SEQ ID NO: 5, amino acids 5010-5082 SEQ ID NO: 5, amino acids 7140-7211 SEQ ID NO: 5, amino acids 1430-1503 SEQ ID NO: 6. amino acids 3673-3745 of SEQ ID NO: 6; and amino acids 2093-2164 of SEQ ID NO: 7. According to this embodiment, this ACP domain preferably contains an amino acid sequence selected from the series including: amino acids 1314-1385 SEQ ID NO: 2, amino acids 1722-1792 SEQ ID NO: 4, amino acids 1434-1506 SEQ ID NO: 5, amino acids 2932-3005 SEQ ID NO: 5, amino acids 5010-5082 SEQ ID NO: 5, amino acids 7140-7211 SEQ ID NO: 5, amino acids 1430-1503 SEQ ID NO: 6, amino acids 3673-3745 SEQ ID NO: 6 and amino acids 2093-2164 SEQ ID NO: 7. In addition, according to this embodiment, said nucleotide sequence is substantially similar to a nucleotide sequence selected from the series including: nucleotides 11549-11764 SEQ ID NO: 1, nucleotides 21414-21626 SEQ ID NO: 1, nucleotides 26045-26263 SEQ ID NO: 1 , nucleotides 30539-30759 SEQ ID NO: 1, nucleotides 36773-36991 SEQ ID NO: 1, nucleotides 43163-43378 SEQ ID NO: 1, nucleotides 47811-48032 SEQ ID NO: 1, nucleotides 54540-54758 SEQ ID NO: 1 and nucleotides 61211-61426 of SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of a nucleotide sequence selected from the series including: nucleotides 11549-11764 SEQ ID NO: 1, nucleotides 21414-21626 SEQ ID NO: 1, nucleotides 26045-26263 SEQ ID NO : 1, nucleotides 30539-30759 SEQ ID NO: 1, nucleo ides 36773-36991 SEQ ID NO: 1, nucleotides 43163-43378 SEQ ID NO: 1, nucleotides 47811-48032 SEQ ID NO: 1, nucleotides 54540-54758 SEQ ID NO: 1 and nucleotides 61211-61426 SEQ ID NO: 1. In addition, according to this embodiment, this nucleotide sequence is most preferably selected from the series including: nucleotides 11549-11764 SEQ ID NO: 1, nucleotides 21414-21626 SEQ ID NO: 1, nucleotides 26045-26263 SEQ ID NO: 1, nucleotides 30539 -30759 SEQ ID NO: 1, nucleotides 36773-36991 SEQ ID NO: 1, nucleotides 43163-43378 SEQ ID NO: 1, nucleotides 47811-48032 SEQ ID NO: 1, nucleotides 54540-54758 SEQ ID NO: 1, nucleotides 61211 -61426 SEQ ID NO: 1.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен дегидратазы (DH), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 869-1037 SEQ ID NO:4, аминокислоты 3886-4048 SEQ ID NO:5, аминокислоты 5964-6132 SEQ ID NO:5, аминокислоты 2383-2551 SEQ ID NO:6 и аминокислоты 887-1051 SEQ ID NO:7. Согласно этому варианту осуществления этот DH-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 869-1037 SEQ ID NO:4, аминокислоты 3886-4048 SEQ ID NO:5, аминокислоты 5964-6132 SEQ ID NO:5, аминокислоты 2383-2551 SEQ ID NO:6 и аминокислоты 887-1051 SEQ ID NO:7. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность предпочтительно практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 18855-19361 SEQ ID NO:1, нуклеотиды 33401-33889 SEQ ID NO:1, нуклеотиды 39635-40141 SEQ ID NO:1, нуклеотиды 50670-51176 SEQ ID NO:1 и нуклеотиды 57593-58087 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 18855-19361 SEQ ID NO:1, нуклеотиды 33401-33889 SEQ ID NO:1, нуклеотиды 39635-40141 SEQ ID NO:1, нуклеотиды 50670-51176 SEQ ID NO:1 и нуклеотиды 57593-58087 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эту нуклеотидную последовательность наиболее предпочтительно выбирают из ряда, включающего: нуклеотиды 18855-19361 SEQ ID NO:1, нуклеотиды 33401-33889 SEQ ID NO:1, нуклеотиды 39635-40141 SEQ ID NO:1, нуклеотиды 50670-51176 SEQ ID NO:1 и нуклеотиды 57593-58087 SEQ ID NO:1.According to another embodiment, the epothilone synthase domain is a dehydratase (DH) domain comprising an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 869-1037 SEQ ID NO: 4, amino acids 3886-4048 SEQ ID NO: 5, amino acids 5964-6132 of SEQ ID NO: 5, amino acids 2383-2551 of SEQ ID NO: 6, and amino acids 887-1051 of SEQ ID NO: 7. According to this embodiment, this DH domain preferably contains an amino acid sequence selected from the series comprising: amino acids 869-1037 SEQ ID NO: 4, amino acids 3886-4048 SEQ ID NO: 5, amino acids 5964-6132 SEQ ID NO: 5, amino acids 2383-2551 SEQ ID NO: 6 and amino acids 887-1051 SEQ ID NO: 7. In addition, according to this embodiment, said nucleotide sequence is preferably substantially the same as a nucleotide sequence selected from the series consisting of: nucleotides 18855-19361 SEQ ID NO: 1, nucleotides 33401-33889 SEQ ID NO: 1, nucleotides 39635-40141 SEQ ID NO: 1, nucleotides 50670-51176 of SEQ ID NO: 1 and nucleotides 57593-58087 of SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of a nucleotide sequence selected from the series including: nucleotides 18855-19361 SEQ ID NO: 1, nucleotides 33401-33889 SEQ ID NO: 1, nucleotides 39635-40141 SEQ ID NO : 1, nucleotides 50670-51176 SEQ ID NO: 1 and nucle CHIDA 57593-58087 SEQ ID NO: 1. In addition, according to this embodiment, this nucleotide sequence is most preferably selected from the series including: nucleotides 18855-19361 SEQ ID NO: 1, nucleotides 33401-33889 SEQ ID NO: 1, nucleotides 39635-40141 SEQ ID NO: 1, nucleotides 50670 -51176 SEQ ID NO: 1 and nucleotides 57593-58087 SEQ ID NO: 1.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен β-кеторедуктазы (KR), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 1439-1684 SEQ ID NO:4, аминокислоты 1147-1399 SEQ ID NO:5, аминокислоты 2645-2895 SEQ ID NO:5, аминокислоты 4729-4974 SEQ ID NO:5, аминокислоты 6857-7101 SEQ ID NO:5, аминокислоты 1143-1393 SEQ ID NO:6, аминокислоты 3392-3636 SEQ ID NO:6 и аминокислоты 1810-2055 SEQ ID NO:7. Согласно этому варианту осуществления KR-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 1439-1684 SEQ ID NO:4, аминокислоты 1147-1399 SEQ ID NO:5, аминокислоты 2645-2895 SEQ ID NO:5, аминокислоты 4729-4974 SEQ ID NO:5, аминокислоты 6857-7101 SEQ ID NO:5, аминокислоты 1143-1393 SEQ ID NO:6, аминокислоты 3392-3636 SEQ ID NO:6 и аминокислоты 1810-2055 SEQ ID NO:7. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность предпочтительно практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 20565-21302 SEQ ID NO:1, нуклеотиды 25184-25942 SEQ ID NO:1, нуклеотиды 29678-30429 SEQ ID NO:1, нуклеотиды 35930-36667 SEQ ID NO:1, нуклеотиды 42314-43048 SEQ ID NO:1, нуклеотиды 46950-47702 SEQ ID NO:1, нуклеотиды 53697-54431 SEQ ID NO:1 и нуклеотиды 60362-61099 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 20565-21302 SEQ ID NO:1, нуклеотиды 25184-25942 SEQ ID NO:1, нуклеотиды 29678-30429 SEQ ID NO:1, нуклеотиды 35930-36667 SEQ ID NO:1, нуклеотиды 42314-43048 SEQ ID NO:1, нуклеотиды 46950-47702 SEQ ID NO:1, нуклеотиды 53697-54431 SEQ ID NO:1 и нуклеотиды 60362-61099 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эту нуклеотидную последовательность наиболее предпочтительно выбирают из ряда, включающего: нуклеотиды 20565-21302 SEQ ID NO:1, нуклеотиды 25184-25942 SEQ ID NO:1, нуклеотиды 29678-30429 SEQ ID NO:1, нуклеотиды 35930-36667 SEQ ID NO:1, нуклеотиды 42314-43048 SEQ ID NO:1, нуклеотиды 46950-47702 SEQ ID NO:1, нуклеотиды 53697-54431 SEQ ID NO:1 и нуклеотиды 60362-61099 SEQ ID NO:1.According to yet another embodiment, the epothilone synthase domain is a β-ketoreductase (KR) domain comprising an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 1439-1684 SEQ ID NO: 4, amino acids 1147-1399 SEQ ID NO: 5, amino acids 2645-2895 SEQ ID NO: 5, amino acids 4729-4974 SEQ ID NO: 5, amino acids 6857-7101 SEQ ID NO: 5, amino acids 1143-1393 SEQ ID NO: 6, amino acids 3392-3636 SEQ ID NO: 6 and amino acids 1810-2055 SEQ ID NO: 7. According to this embodiment, the KR domain preferably contains an amino acid sequence selected from the series comprising: amino acids 1439-1684 SEQ ID NO: 4, amino acids 1147-1399 SEQ ID NO: 5, amino acids 2645-2895 SEQ ID NO: 5, amino acids 4729 -4974 SEQ ID NO: 5, amino acids 6857-7101 SEQ ID NO: 5, amino acids 1143-1393 SEQ ID NO: 6, amino acids 3392-3636 SEQ ID NO: 6 and amino acids 1810-2055 SEQ ID NO: 7. In addition, according to this embodiment, said nucleotide sequence is preferably substantially the same as a nucleotide sequence selected from the series comprising: nucleotides 20565-21302 SEQ ID NO: 1, nucleotides 25184-25942 SEQ ID NO: 1, nucleotides 29678-30429 SEQ ID NO: 1, nucleotides 35930-36667 SEQ ID NO: 1, nucleotides 42314-43048 SEQ ID NO: 1, nucleotides 46950-47702 SEQ ID NO: 1, nucleotides 53697-54431 SEQ ID NO: 1 and nucleotides 60362-61099 SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of a nucleotide sequence selected from the series including: nucleotides 20565-21302 SEQ ID NO: 1, nucleotides 25184-25942 SEQ ID NO: 1, nucleotides 29678-30429 SEQ ID NO : 1, nucleotides 35930-36667 SEQ ID NO: 1, nucleo ides 42314-43048 SEQ ID NO: 1, nucleotides 46950-47702 SEQ ID NO: 1, nucleotides 53697-54431 SEQ ID NO: 1 and nucleotides 60362-61099 SEQ ID NO: 1. In addition, according to this embodiment, this nucleotide sequence is most preferably selected from the series including: nucleotides 20565-21302 SEQ ID NO: 1, nucleotides 25184-25942 SEQ ID NO: 1, nucleotides 29678-30429 SEQ ID NO: 1, nucleotides 35930 -36667 SEQ ID NO: 1, nucleotides 42314-43048 SEQ ID NO: 1, nucleotides 46950-47702 SEQ ID NO: 1, nucleotides 53697-54431 SEQ ID NO: 1 and nucleotides 60362-61099 SEQ ID NO: 1.

Согласно дополнительному варианту осуществления домен эпотилон-синтазы представляет собой домен метилтрансферазы (МТ), содержащий аминокислотную последовательность, практически аналогичную аминокислотам 2671-3045 SEQ ID NO:6. Согласно этому варианту осуществления МТ-домен предпочтительно содержит аминокислоты 2671-3045 SEQ ID NO:6. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность предпочтительно практически аналогична нуклеотидам 51534-52657 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, представленной нуклеотидами 51534-52657 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эта нуклеотидная последовательность наиболее предпочтительно представляет собой нуклеотиды 51534-52657 SEQ ID NO:1.According to a further embodiment, the epothilone synthase domain is a methyltransferase (MT) domain containing an amino acid sequence substantially similar to amino acids 2671-3045 of SEQ ID NO: 6. According to this embodiment, the MT domain preferably contains amino acids 2671-3045 of SEQ ID NO: 6. Furthermore, according to this embodiment, said nucleotide sequence is preferably substantially the same as nucleotides 51534-52657 of SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of the nucleotide sequence represented by nucleotides 51534-52657 SEQ ID NO: 1. Furthermore, according to this embodiment, this nucleotide sequence is most preferably nucleotides 51534-52657 of SEQ ID NO: 1.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен тиоэстеразы (ТЕ), содержащий аминокислотную последовательность, практически аналогичную аминокислотам 2165-2439 SEQ ID NO:7. Согласно этому варианту осуществления ТЕ-домен предпочтительно содержит аминокислоты 2165-2439 SEQ ID NO:7. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность предпочтительно практически аналогична нуклеотидам 61427-62254 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, представленной нуклеотидами 61427-62254 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эта нуклеотидная последовательность наиболее предпочтительно представляет собой нуклеотиды 61427-62254 SEQ ID NO:1.In yet another embodiment, the epothilone synthase domain is a thioesterase (TE) domain containing an amino acid sequence substantially similar to amino acids 2165-2439 of SEQ ID NO: 7. According to this embodiment, the TE domain preferably contains amino acids 2165-2439 of SEQ ID NO: 7. In addition, according to this embodiment, said nucleotide sequence is preferably substantially the same as nucleotides 61427-62254 of SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of the nucleotide sequence represented by nucleotides 61427-62254 of SEQ ID NO: 1. Furthermore, according to this embodiment, this nucleotide sequence is most preferably nucleotides 61427-62254 of SEQ ID NO: 1.

Согласно еще одному варианту осуществления настоящее изобретение относится к выделенной молекуле нуклеиновой кислоты, включающей нуклеотидную последовательность, которая кодирует нерибосомную кислота-аминокислота-лигазу, где аминокислотная последовательность этой нерибосомной кислота-аминокислота-лигазы содержит аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: SEQ ID NO:3, аминокислоты 72-81 SEQ ID NO:3, аминокислоты 118-125 SEQ ID NO:3, аминокислоты 199-212 SEQ ID NO:3, аминокислоты 353-363 SEQ ID NO:3, аминокислоты 549-565 SEQ ID NO:3, аминокислоты 588-603 SEQ ID NO:3, аминокислоты 669-684 SEQ ID NO:3, аминокислоты 815-821 SEQ ID NO:3, аминокислоты 868-892 SEQ ID NO:3, аминокислоты 903-912 SEQ ID NO:3, аминокислоты 918-940 SEQ ID NO:3, аминокислоты 1268-1274 SEQ ID NO:3, аминокислоты 1285-1297 SEQ ID NO:3, аминокислоты 973-1256 SEQ ID NO:3 и аминокислоты 1344-1351 SEQ ID NO:3. Согласно этому варианту осуществления нерибосомная кислота-аминокислота-лигаза предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: SEQ ID NO:3, аминокислоты 72-81 SEQ ID NO:3, аминокислоты 118-125 SEQ ID NO:3, аминокислоты 199-212 SEQ ID NO:3, аминокислоты 353-363 SEQ ID NO:3, аминокислоты 549-565 SEQ ID NO:3, аминокислоты 588-603 SEQ ID NO:3, аминокислоты 669-684 SEQ ID NO:3, аминокислоты 815-821 SEQ ID NO:3, аминокислоты 868-892 SEQ ID NO:3, аминокислоты 903-912 SEQ ID NO:3, аминокислоты 918-940 SEQ ID NO:3, аминокислоты 1268-1274 SEQ ID NO:3, аминокислоты 1285-1297 SEQ ID NO:3, аминокислоты 973-1256 SEQ ID NO:3 и аминокислоты 1344-1351 SEQ ID NO:3. Кроме того, согласно этому варианту осуществления указанная нуклеотидная последовательность предпочтительно практически аналогична нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 11872-16104 SEQ ID NO:1, нуклеотиды 12085-12114 SEQ ID NO:1, нуклеотиды 12223-12246 SEQ ID NO:1, нуклеотиды 12466-12507 SEQ ID NO:1, нуклеотиды 12928-12960 SEQ ID NO:1, нуклеотиды 13516-13566 SEQ ID NO:1, нуклеотиды 13633-13680 SEQ ID NO:1, нуклеотиды 13876-13923 SEQ ID NO:1, нуклеотиды 14313-14334 SEQ ID NO:1, нуклеотиды 14473-14547 SEQ ID NO:1, нуклеотиды 14578-14607 SEQ ID NO:1, нуклеотиды 14623-14692 SEQ ID NO:1, нуклеотиды 15673-15693 SEQ ID NO:1, нуклеотиды 15724-15762 SEQ ID NO:1, нуклеотиды 14788-15639 SEQ ID NO:1 и нуклеотиды 15901-15924 SEQ ID NO:1. Согласно этому варианту осуществления эта нуклеотидная последовательность более предпочтительно содержит область нуклеотидной последовательности, состоящую из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований, идентичную области нуклеотидной последовательности, состоящей из 20, 25, 30, 35, 40, 45 или 50 (предпочтительно 20) последовательных пар оснований нуклеотидной последовательности, выбранной из ряда, включающего: нуклеотиды 11872-16104 SEQ ID NO:1, нуклеотиды 12085-12114 SEQ ID NO:1, нуклеотиды 12223-12246 SEQ ID NO:1, нуклеотиды 12466-12507 SEQ ID NO:1, нуклеотиды 12928-12960 SEQ ID NO:1, нуклеотиды 13516-13566 SEQ ID NO:1, нуклеотиды 13633-13680 SEQ ID NO:1, нуклеотиды 13876-13923 SEQ ID NO:1, нуклеотиды 14313-14334 SEQ ID NO:1, нуклеотиды 14473-14547 SEQ ID NO:1, нуклеотиды 14578-14607 SEQ ID NO:1, нуклеотиды 14623-14692 SEQ ID NO:1, нуклеотиды 15673-15693 SEQ ID NO:1, нуклеотиды 15724-15762 SEQ ID NO:1, нуклеотиды 14788-15639 SEQ ID NO:1 и нуклеотиды 15901-15924 SEQ ID NO:1. Кроме того, согласно этому варианту осуществления эту нуклеотидную последовательность наиболее предпочтительно выбирают из ряда, включающего: нуклеотиды 11872-16104 SEQ ID NO:1, нуклеотиды 12085-12114 SEQ ID NO:1, нуклеотиды 12223-12246 SEQ ID NO:1, нуклеотиды 12466-12507 SEQ ID NO:1, нуклеотиды 12928-12960 SEQ ID NO:1, нуклеотиды 13516-13566 SEQ ID NO:1, нуклеотиды 13633-13680 SEQ ID NO:1, нуклеотиды 13876-13923 SEQ ID NO:1, нуклеотиды 14313-14334 SEQ ID NO:1, нуклеотиды 14473-14547 SEQ ID NO:1, нуклеотиды 14578-14607 SEQ ID NO:1, нуклеотиды 14623-14692 SEQ ID NO:1, нуклеотиды 15673-15693 SEQ ID NO:1, нуклеотиды 15724-15762 SEQ ID NO:1, нуклеотиды 14788-15639 SEQ ID NO:1 и нуклеотиды 15901-15924 SEQ ID NO:1.According to another embodiment, the present invention relates to an isolated nucleic acid molecule comprising a nucleotide sequence that encodes a non-ribosomal acid-amino acid-ligase, where the amino acid sequence of this non-ribosomal acid-amino acid-ligase contains an amino acid sequence substantially similar to an amino acid sequence selected from the series comprising: SEQ ID NO: 3, amino acids 72-81 SEQ ID NO: 3, amino acids 118-125 SEQ ID NO: 3, amino acids 199-212 SEQ ID NO: 3, amino acids you are 353-363 SEQ ID NO: 3, amino acids 549-565 SEQ ID NO: 3, amino acids 588-603 SEQ ID NO: 3, amino acids 669-684 SEQ ID NO: 3, amino acids 815-821 SEQ ID NO: 3, amino acids 868-892 SEQ ID NO: 3, amino acids 903-912 SEQ ID NO: 3, amino acids 918-940 SEQ ID NO: 3, amino acids 1268-1274 SEQ ID NO: 3, amino acids 1285-1297 SEQ ID NO: 3, amino acids 973-1256 of SEQ ID NO: 3; and amino acids 1344-1351 of SEQ ID NO: 3. According to this embodiment, the non-ribosomal acid-amino acid-ligase preferably contains an amino acid sequence selected from the series including: SEQ ID NO: 3, amino acids 72-81 SEQ ID NO: 3, amino acids 118-125 SEQ ID NO: 3, amino acids 199- 212 SEQ ID NO: 3, amino acids 353-363 SEQ ID NO: 3, amino acids 549-565 SEQ ID NO: 3, amino acids 588-603 SEQ ID NO: 3, amino acids 669-684 SEQ ID NO: 3, amino acids 815- 821 SEQ ID NO: 3, amino acids 868-892 SEQ ID NO: 3, amino acids 903-912 SEQ ID NO: 3, amino acids 918-940 SEQ ID NO: 3, amino acids 1268-1274 SEQ ID NO: 3, amino acids 1285- 1297 SEQ ID NO: 3, amino acids 973-1256 SEQ ID NO: 3 and amino acids lots 1344-1351 SEQ ID NO: 3. In addition, according to this embodiment, said nucleotide sequence is preferably substantially similar to a nucleotide sequence selected from the series consisting of: nucleotides 11872-16104 SEQ ID NO: 1, nucleotides 12085-12114 SEQ ID NO: 1, nucleotides 12223-12246 SEQ ID NO: 1, nucleotides 12466-12507 SEQ ID NO: 1, nucleotides 12928-12960 SEQ ID NO: 1, nucleotides 13516-13566 SEQ ID NO: 1, nucleotides 13633-13680 SEQ ID NO: 1, nucleotides 13876-13923 SEQ ID NO: 1, nucleotides 14313-14334 SEQ ID NO: 1, nucleotides 14473-14547 SEQ ID NO: 1, nucleotides 14578-14607 SEQ ID NO: 1, nucleotides 14623-14692 SEQ ID NO: 1, nucleotides 15673-15693 SEQ ID NO: 1, nucleotides 15724-15762 SEQ ID NO: 1, nucleotides 14788-15639 SEQ ID NO: 1 and nucleotides 15901-15924 SEQ ID NO: 1. According to this embodiment, this nucleotide sequence more preferably comprises a region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs identical to the region of a nucleotide sequence consisting of 20, 25, 30, 35, 40, 45 or 50 (preferably 20) consecutive base pairs of a nucleotide sequence selected from the series including: nucleotides 11872-16104 SEQ ID NO: 1, nucleotides 12085-12114 SEQ ID NO: 1, nucleotides 12223-12246 SEQ ID NO : 1, nucleotides 12466-12507 SEQ ID NO: 1, nucleo IDs 12928-12960 SEQ ID NO: 1, nucleotides 13516-13566 SEQ ID NO: 1, nucleotides 13633-13680 SEQ ID NO: 1, nucleotides 13876-13923 SEQ ID NO: 1, nucleotides 14313-14334 SEQ ID NO: 1, nucleotides 14473-14547 SEQ ID NO: 1, nucleotides 14578-14607 SEQ ID NO: 1, nucleotides 14623-14692 SEQ ID NO: 1, nucleotides 15673-15693 SEQ ID NO: 1, nucleotides 15724-15762 SEQ ID NO: 1, nucleotides 14788-15639 of SEQ ID NO: 1 and nucleotides 15901-15924 of SEQ ID NO: 1. In addition, according to this embodiment, this nucleotide sequence is most preferably selected from the series including: nucleotides 11872-16104 SEQ ID NO: 1, nucleotides 12085-12114 SEQ ID NO: 1, nucleotides 12223-12246 SEQ ID NO: 1, nucleotides 12466 -12507 SEQ ID NO: 1, nucleotides 12928-12960 SEQ ID NO: 1, nucleotides 13516-13566 SEQ ID NO: 1, nucleotides 13633-13680 SEQ ID NO: 1, nucleotides 13876-13923 SEQ ID NO: 1, nucleotides 14313 -14334 SEQ ID NO: 1, nucleotides 14473-14547 SEQ ID NO: 1, nucleotides 14578-14607 SEQ ID NO: 1, nucleotides 14623-14692 SEQ ID NO: 1, nucleotides 15673-15693 SEQ ID NO: 1, nucleotides 15724 -15762 SEQ ID NO: 1, nucleotides 14788-15639 SEQ ID NO: 1 and nucleotides 15901-15924 SEQ ID NO :1.

Настоящее изобретение также относится к выделенной молекуле нуклеиновой кислоты, включающей нуклеотидную последовательность, которая кодирует полипептид, содержащий аминокислотную последовательность, выбранную из ряда, включающего последовательности SEQ ID NO:2-23.The present invention also relates to an isolated nucleic acid molecule comprising a nucleotide sequence that encodes a polypeptide containing an amino acid sequence selected from the series comprising the sequences of SEQ ID NO: 2-23.

Еще одним объектом изобретения являются способы получения рекомбинантных поликетидов, таких как эпотилоны, в количествах, достаточно больших для того, чтобы можно было произвести их очистку и применять в фармацевтических композициях, например, предназначенных для лечения рака. Основным преимуществом этих способов получения является хиральность полученных молекул; получение в трансгенных организмах позволяет избежать образования популяций рацемический смесей, в которых некоторые энантиомеры могут иметь пониженную активность. В частности, настоящее изобретение относится к способу гетерологичной экспрессии эпотилона в гетерологичном хозяине, который предусматривает: (а) интродукцию в хозяина химерного гена, включающего гетерологичную промоторную последовательность, функционально связанную с молекулой нуклеиновой кислоты по изобретению, которая включает нуклеотидную последовательность, которая кодирует по меньшей мере один полипептид, участвующий в биосинтезе эпотилона, и (б) выращивание хозяина в условиях, которые позволяют осуществить биосинтез эпотилона в хозяине. Настоящее изобретение также относится к способу получения эпотилона, предусматривающему: (а) экспрессию эпотилона в рекомбинантном хозяине с помощью вышеописанного способа и (б) экстракцию эпотилона из рекомбинантного хозяина.Another object of the invention are methods for producing recombinant polyketides, such as epothilones, in quantities large enough so that they can be purified and used in pharmaceutical compositions, for example, for the treatment of cancer. The main advantage of these production methods is the chirality of the obtained molecules; production in transgenic organisms avoids the formation of racemic mixtures in populations in which some enantiomers may have reduced activity. In particular, the present invention relates to a method for heterologously expressing epothilone in a heterologous host, which comprises: (a) introducing into the host a chimeric gene comprising a heterologous promoter sequence operably linked to a nucleic acid molecule of the invention that comprises a nucleotide sequence that encodes at least at least one polypeptide involved in epothilone biosynthesis, and (b) growing a host under conditions that allow epothilo biosynthesis on in the host. The present invention also relates to a method for producing epothilone, comprising: (a) expressing epothilone in a recombinant host using the above method, and (b) extracting epothilone from a recombinant host.

Еще одним объектом изобретения является выделенный полипептид, включающий аминокислотную последовательность, которая содержит домен эпотилон-синтазы.Another object of the invention is an isolated polypeptide comprising an amino acid sequence that contains an epothilone synthase domain.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен β-кетоацилсинтазы (KS), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 11-437 SEQ ID NO:2, аминокислоты 7-432 SEQ ID NO:4, аминокислоты 39-457 SEQ ID NO:5, аминокислоты 1524-1950 SEQ ID NO:5, аминокислоты 3024-3449 SEQ ID NO:5, аминокислоты 5103-5525 SEQ ID NO:5, аминокислоты 35-454 SEQ ID NO:6, аминокислоты 1522-1946 SEQ ID NO: 6 и аминокислоты 32-450 SEQ ID NO:7. Согласно этому варианту осуществления KS-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 11-437 SEQ ID NO:2, аминокислоты 7-432 SEQ ID NO:4, аминокислоты 39-457 SEQ ID NO:5, аминокислоты 1524-1950 SEQ ID NO:5, аминокислоты 3024-3449 SEQ ID NO:5, аминокислоты 5103-5525 SEQ ID NO:5, аминокислоты 35-454 SEQ ID NO:6, аминокислоты 1522-1946 SEQ ID NO: 6 и аминокислоты 32-450 SEQ ID NO:7.According to another embodiment, the epothilone synthase domain is a β-ketoacyl synthase (KS) domain containing an amino acid sequence substantially similar to that selected from amino acids 11-437 of SEQ ID NO: 2, amino acids 7-432 of SEQ ID NO: 4, amino acids 39-457 SEQ ID NO: 5, amino acids 1524-1950 SEQ ID NO: 5, amino acids 3024-3449 SEQ ID NO: 5, amino acids 5103-5525 SEQ ID NO: 5, amino acids 35-454 SEQ ID Amino acids NO: 6, amino acids 1522-1946 of SEQ ID NO: 6 and amino acids 32-450 of SEQ ID NO: 7. According to this embodiment, the KS domain preferably contains an amino acid sequence selected from the series comprising: amino acids 11-437 of SEQ ID NO: 2, amino acids 7-432 of SEQ ID NO: 4, amino acids 39-457 of SEQ ID NO: 5, amino acids 1524 -1950 SEQ ID NO: 5, amino acids 3024-3449 SEQ ID NO: 5, amino acids 5103-5525 SEQ ID NO: 5, amino acids 35-454 SEQ ID NO: 6, amino acids 1522-1946 SEQ ID NO: 6 and amino acids 32 -450 SEQ ID NO: 7.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен ацилтрансферазы (AT), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 543-864 SEQ ID NO:2, аминокислоты 539-859 SEQ ID NO:4, аминокислоты 563-884 SEQ ID NO:5, аминокислоты 2056-2377 SEQ ID NO:5, аминокислоты 3555-3876 SEQ ID NO:5, аминокислоты 5631-5951 SEQ ID NO:5, аминокислоты 561-881 SEQ ID NO:6, аминокислоты 2053-2373 SEQ ID NO:6 и аминокислоты 556-877 SEQ ID NO:7. Согласно этому варианту осуществления АТ-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 543-864 SEQ ID NO:2, аминокислоты 539-859 SEQ ID NO:4, аминокислоты 563-884 SEQ ID NO:5, аминокислоты 2056-2377 SEQ ID NO:5, аминокислоты 3555-3876 SEQ ID NO:5, аминокислоты 5631-5951 SEQ ID NO:5, аминокислоты 561-881 SEQ ID NO:6, аминокислоты 2053-2373 SEQ ID NO:6 и аминокислоты 556-877 SEQ ID NO:7.According to yet another embodiment, the epothilone synthase domain is an acyltransferase (AT) domain comprising an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 543-864 SEQ ID NO: 2, amino acids 539-859 SEQ ID NO: 4, amino acids 563-884 SEQ ID NO: 5, amino acids 2056-2377 SEQ ID NO: 5, amino acids 3555-3876 SEQ ID NO: 5, amino acids 5631-5951 SEQ ID NO: 5, amino acids 561-881 SEQ ID NO: 6, amino acids 2053-2373 of SEQ ID NO: 6 and amino acids 556-877 of SEQ ID NO: 7. According to this embodiment, the AT domain preferably contains an amino acid sequence selected from the series including: amino acids 543-864 SEQ ID NO: 2, amino acids 539-859 SEQ ID NO: 4, amino acids 563-884 SEQ ID NO: 5, amino acids 2056 -2377 SEQ ID NO: 5, amino acids 3555-3876 SEQ ID NO: 5, amino acids 5631-5951 SEQ ID NO: 5, amino acids 561-881 SEQ ID NO: 6, amino acids 2053-2373 SEQ ID NO: 6 and amino acids 556 -877 SEQ ID NO: 7.

Согласно следующему варианту осуществления домен эпотилон-синтазы представляет собой домен еноилредуктазы (ER), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 974-1273 SEQ ID NO:2, аминокислоты 4433-4719 SEQ ID NO:5, аминокислоты 6542-6837 SEQ ID NO:5 и аминокислоты 1478-1790 SEQ ID NO:7. Согласно этому варианту осуществления ER-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 974-1273 SEQ ID NO:2, аминокислоты 4433-4719 SEQ ID NO:5, аминокислоты 6542-6837 SEQ ID NO:5 и аминокислоты 1478-1790 SEQ ID NO:7.According to a further embodiment, the epothilone synthase domain is an enoyl reductase (ER) domain containing an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 974-1273 SEQ ID NO: 2, amino acids 4433-4719 SEQ ID NO: 5 amino acids 6542-6837 of SEQ ID NO: 5; and amino acids 1478-1790 of SEQ ID NO: 7. According to this embodiment, the ER domain preferably contains an amino acid sequence selected from the series comprising: amino acids 974-1273 of SEQ ID NO: 2, amino acids 4433-4719 of SEQ ID NO: 5, amino acids 6542-6837 of SEQ ID NO: 5, and amino acids 1478 -1790 SEQ ID NO: 7.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен протеина-носителя ацила (АСР), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 1314-1385 SEQ ID NO:2, аминокислоты 1722-1792 SEQ ID NO:4, аминокислоты 1434-1506 SEQ ID NO:5, аминокислоты 2932-3005 SEQ ID NO:5, аминокислоты 5010-5082 SEQ ID NO:5, аминокислоты 7140-7211 SEQ ID NO:5, аминокислоты 1430-1503 SEQ ID NO:6, аминокислоты 3673-3745 SEQ ID NO:6 и аминокислоты 2093-2164 SEQ ID NO:7. Согласно этому варианту осуществления АСР-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 1314-1385 SEQ ID NO:2, аминокислоты 1722-1792 SEQ ID NO:4, аминокислоты 1434-1506 SEQ ID NO:5, аминокислоты 2932-3005 SEQ ID NO:5, аминокислоты 5010-5082 SEQ ID NO:5, аминокислоты 7140-7211 SEQ ID NO:5, аминокислоты 1430-1503 SEQ ID NO:6, аминокислоты 3673-3745 SEQ ID NO:6 и аминокислоты 2093-2164 SEQ ID NO:7.According to another embodiment, the epothilone synthase domain is an acyl carrier protein domain (ACP) comprising an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 1314-1385 SEQ ID NO: 2, amino acids 1722-1792 SEQ ID NO: 4, amino acids 1434-1506 SEQ ID NO: 5, amino acids 2932-3005 SEQ ID NO: 5, amino acids 5010-5082 SEQ ID NO: 5, amino acids 7140-7211 SEQ ID NO: 5, amino acids 1430-1503 SEQ Amino acids 3673-3745; SEQ ID NO: 6; and amino acids 2093-2164; SEQ ID NO: 7. According to this embodiment, the ACP domain preferably contains an amino acid sequence selected from the series including: amino acids 1314-1385 SEQ ID NO: 2, amino acids 1722-1792 SEQ ID NO: 4, amino acids 1434-1506 SEQ ID NO: 5, amino acids 2932 -3005 SEQ ID NO: 5, amino acids 5010-5082 SEQ ID NO: 5, amino acids 7140-7211 SEQ ID NO: 5, amino acids 1430-1503 SEQ ID NO: 6, amino acids 3673-3745 SEQ ID NO: 6 and amino acids 2093 -2164 SEQ ID NO: 7.

Согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен дегидратазы (DH), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 869-1037 SEQ ID NO:4, аминокислоты 3886-4048 SEQ ID NO:5, аминокислоты 5964-6132 SEQ ID NO:5, аминокислоты 2383-2551 SEQ ID NO:6 и аминокислоты 887-1051 SEQ ID NO:7. Согласно этому варианту осуществления DH-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 869-1037 SEQ ID NO:4, аминокислоты 3886-4048 SEQ ID NO:5, аминокислоты 5964-6132 SEQ ID NO:5, аминокислоты 2383-2551 SEQ ID NO:6 и аминокислоты 887-1051 SEQ ID NO:7.According to another embodiment, the epothilone synthase domain is a dehydratase (DH) domain comprising an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 869-1037 SEQ ID NO: 4, amino acids 3886-4048 SEQ ID NO: 5, amino acids 5964-6132 of SEQ ID NO: 5, amino acids 2383-2551 of SEQ ID NO: 6, and amino acids 887-1051 of SEQ ID NO: 7. According to this embodiment, the DH domain preferably contains an amino acid sequence selected from the series comprising: amino acids 869-1037 SEQ ID NO: 4, amino acids 3886-4048 SEQ ID NO: 5, amino acids 5964-6132 SEQ ID NO: 5, amino acids 2383 -2551 SEQ ID NO: 6 and amino acids 887-1051 SEQ ID NO: 7.

И согласно еще одному варианту осуществления домен эпотилон-синтазы представляет собой домен β-кеторедуктазы (KR), содержащий аминокислотную последовательность, практически аналогичную аминокислотной последовательности, выбранной из ряда, включающего: аминокислоты 1439-1684 SEQ ID NO:4, аминокислоты 1147-1399 SEQ ID NO:5, аминокислоты 2645-2895 SEQ ID NO:5, аминокислоты 4729-4974 SEQ ID NO:5, аминокислоты 6857-7101 SEQ ID NO:5, аминокислоты 1143-1393 SEQ ID NO:6, аминокислоты 3392-3636 SEQ ID NO:6 и аминокислоты 1810-2055 SEQ ID NO:7. Согласно этому варианту осуществления KR-домен предпочтительно содержит аминокислотную последовательность, выбранную из ряда, включающего: аминокислоты 1439-1684 SEQ ID NO:4, аминокислоты 1147-1399 SEQ ID NO:5, аминокислоты 2645-2895 SEQ ID NO:5, аминокислоты 4729-4974 SEQ ID NO:5, аминокислоты 6857-7101 SEQ ID NO:5, аминокислоты 1143-1393 SEQ ID NO:6, аминокислоты 3392-3636 SEQ ID NO:6 и аминокислоты 1810-2055 SEQ ID NO:7.And according to yet another embodiment, the epothilone synthase domain is a β-ketoreductase (KR) domain containing an amino acid sequence substantially similar to an amino acid sequence selected from the series consisting of: amino acids 1439-1684 SEQ ID NO: 4, amino acids 1147-1399 SEQ ID NO: 5, amino acids 2645-2895 SEQ ID NO: 5, amino acids 4729-4974 SEQ ID NO: 5, amino acids 6857-7101 SEQ ID NO: 5, amino acids 1143-1393 SEQ ID NO: 6, amino acids 3392-3636 SEQ ID NO: 6 and amino acids 1810-2055 SEQ ID NO: 7. According to this embodiment, the KR domain preferably contains an amino acid sequence selected from the series comprising: amino acids 1439-1684 SEQ ID NO: 4, amino acids 1147-1399 SEQ ID NO: 5, amino acids 2645-2895 SEQ ID NO: 5, amino acids 4729 -4974 SEQ ID NO: 5, amino acids 6857-7101 SEQ ID NO: 5, amino acids 1143-1393 SEQ ID NO: 6, amino acids 3392-3636 SEQ ID NO: 6 and amino acids 1810-2055 SEQ ID NO: 7.

Согласно дополнительному варианту осуществления домен эпотилон-синтазы представляет собой домен метилтрансферазы (МТ), содержащий аминокислотную последовательность, практически аналогичную аминокислотам 2671-3045 SEQ ID NO:6. Согласно этому варианту осуществления МТ-домен предпочтительно содержит аминокислоты 2671-3045 SEQ ID NO:6.According to a further embodiment, the epothilone synthase domain is a methyltransferase (MT) domain containing an amino acid sequence substantially similar to amino acids 2671-3045 of SEQ ID NO: 6. According to this embodiment, the MT domain preferably contains amino acids 2671-3045 of SEQ ID NO: 6.

Согласно другому варианту осуществления домен эпотилон-синтазы представляет собой домен тиоэстеразы (ТЕ), содержащий аминокислотную последовательность, практически аналогичную аминокислотам 2165-2439 SEQ ID NO:7. Согласно этому варианту осуществления ТЕ-домен предпочтительно содержит аминокислоты 2165-2439 SEQ ID NO:7.According to another embodiment, the epothilone synthase domain is a thioesterase (TE) domain containing an amino acid sequence substantially similar to amino acids 2165-2439 of SEQ ID NO: 7. According to this embodiment, the TE domain preferably contains amino acids 2165-2439 of SEQ ID NO: 7.

Другие объекты и преимущества настоящего изобретения станут очевидными специалистам в данной области после изучения следующего описания изобретения и не ограничивающих его объема примеров.Other objects and advantages of the present invention will become apparent to those skilled in the art after studying the following description of the invention and non-limiting examples.

ОпределенияDefinitions

В описании настоящего изобретения используются следующие понятия, которые имеют указанные ниже значения.In the description of the present invention, the following concepts are used, which have the following meanings.

"Функционально связанные/соединенные с": Относится к двум последовательностям ДНК, которые связаны физически или функционально. Например, говорят, что промотор или регуляторная последовательность ДНК "соединена с" последовательностью ДНК, которая кодирует РНК или протеин, если две последовательности функционально связаны или расположены так, что регуляторная последовательность ДНК может оказывать воздействие на уровень экспрессии кодирующей или структурной последовательности ДНК.“Functionally linked / linked to”: Refers to two DNA sequences that are physically or functionally linked. For example, it is said that a promoter or regulatory DNA sequence is “linked” to a DNA sequence that encodes an RNA or protein if the two sequences are functionally linked or arranged so that the regulatory DNA sequence can affect the expression level of the coding or structural DNA sequence.

"Химерный ген": Рекомбинантная последовательность ДНК, в которой промотор или регуляторная последовательность ДНК функционально связаны или соединены с последовательностью ДНК, которая кодирует мРНК или которая экспрессируется в виде протеина, так что регуляторная последовательность ДНК обладает способностью регулировать транскрипцию или экспрессию связанной последовательности ДНК. Регуляторная последовательность ДНК химерного гена функционально связана или соединена с последовательностью ДНК не так, как это имеет место в естественных условиях.Chimeric gene: A recombinant DNA sequence in which a promoter or regulatory DNA sequence is operably linked or connected to a DNA sequence that encodes mRNA or that is expressed as a protein, so that the regulatory DNA sequence has the ability to regulate the transcription or expression of a linked DNA sequence. The regulatory DNA sequence of a chimeric gene is not functionally linked or linked to the DNA sequence as it does in vivo.

Кодирующая последовательность ДНК: Последовательность ДНК, которая транслируется в организме с образованием протеина.DNA coding sequence: A DNA sequence that is translated into the body to form a protein.

Домен: Часть поликетид-синтазы, необходимая для проявления определенной активности. Примеры включают домены протеина-носителя ацила (АСР), β-кетосинтазы (KS), ациилтрансферазы (AT), β-кеторедуктазы (KR), дегидратазы (DH), еноилредуктазы (ER) и тиоэстеразы (ТЕ).Domain: Part of polyketide synthase necessary for the manifestation of a certain activity. Examples include the carrier protein domains of acyl (ACP), β-ketosynthase (KS), acyl transferase (AT), β-ketoreductase (KR), dehydratase (DH), enoyl reductase (ER) and thioesterase (TE).

Эпотилоны: 16-членные макроциклические поликетиды, которые в естественных условиях продуцируются штаммом бактерии Sorangium cellulosum So ce90, напоминающие по биологической активности таксол. В настоящем описании понятие "эпотилон" относится к классу поликетидов, который включает эпотилон А и эпотилон В, а также их аналоги, которые описаны в WO 98/25929.Epothilones: 16-membered macrocyclic polyketides, which are naturally produced by the strain of the bacterium Sorangium cellulosum So ce90, resembling taxol in biological activity. In the present description, the term “epothilone” refers to a class of polyketides that includes epothilone A and epothilone B, as well as their analogs, which are described in WO 98/25929.

Эпотилон-синтаза: Поликетид-синтаза, ответственная за биосинтез эпотилона.Epothilone synthase: Polyketide synthase responsible for epothilone biosynthesis.

Ген: Определенная область, которая локализована внутри генома и которая, помимо вышеуказанной кодирующей последовательности ДНК, включает другие, прежде всего регуляторные последовательности ДНК, ответственные за контроль экспрессии, т.е. за транскрипцию и трансляцию кодирующей области.Gene: A certain region that is localized within the genome and which, in addition to the above coding DNA sequence, includes other, primarily regulatory DNA sequences, responsible for controlling expression, i.e. for transcription and translation of the coding region.

Гетерологичная последовательность ДНК: Последовательность ДНК, не встречающаяся в естественных условиях в клетке-хозяине, в который ее интродуцируют, включая не встречающиеся в естественных условиях множественные копии встречающейся в естественных условиях последовательности ДНК.Heterologous DNA sequence: A DNA sequence that is not found naturally in the host cell into which it is introduced, including non-naturally occurring multiple copies of the naturally occurring DNA sequence.

Гомологичная нуклеотидная последовательность: Последовательность ДНК, встречающаяся в естественных условиях в клетке-хозяине, в который ее интродуцируют.Homologous nucleotide sequence: A DNA sequence that occurs naturally in the host cell into which it is introduced.

Гомологичная рекомбинация: Реципрокный обмен фрагментами ДНК между гомологичными молекулами ДНК.Homologous recombination: Reciprocal exchange of DNA fragments between homologous DNA molecules.

Выделенный: в контексте настоящего изобретения выделенная молекула нуклеиновой кислоты или выделенный фермент обозначает молекулу нуклеиновой кислоты или фермент, которые благодаря человеку существуют вне их естественного окружения и, следовательно, не являются природными продуктами. Выделенная молекула нуклеиновой кислоты или фермент могут существовать в очищенной форме или могут существовать в неестественном окружении, таком как, например, рекомбинантная клетка-хозяин.Isolated: in the context of the present invention, an isolated nucleic acid molecule or an isolated enzyme refers to a nucleic acid molecule or enzyme which, thanks to humans, exists outside their natural environment and, therefore, are not natural products. An isolated nucleic acid molecule or enzyme may exist in purified form or may exist in an unnatural environment, such as, for example, a recombinant host cell.

Модуль: Генетический элемент, кодирующий все различные виды активностей, необходимые для одного цикла биосинтеза поликетида, т.е. одной стадии конденсации и всех связанных с этим стадий процессинга β-карбонила. Каждый модуль кодирует активность АСР, KS и AT, которые необходимы для осуществления стадии конденсации пути биосинтеза и определенные активности, необходимые для осуществления следующих за конденсацией стадий процессинга β-карбонила.Module: A genetic element encoding all the different types of activities necessary for one cycle of polyketide biosynthesis, i.e. one stage of condensation and all related stages of processing β-carbonyl. Each module encodes the activity of ACP, KS, and AT, which are necessary for the implementation of the stage of condensation of the biosynthesis pathway and certain activities necessary for the implementation of the subsequent stages of β-carbonyl processing.

NRPS: Нерибосомная кислота-аминокислота-лигаза, которая представляет собой комплекс ферментативных активностей, ответственных за включение аминокислот во вторичные метаболиты, включая, например, домены аденилирования аминокислот, эпимеризации, N-метилирования, циклизации, протеина-носителя пептидила и конденсации. Функционально активная NRPS катализирует включение аминокислоты во вторичный метаболит.NRPS: A non-ribosomal acid-amino acid-ligase, which is a complex of enzymatic activities responsible for the incorporation of amino acids into secondary metabolites, including, for example, the domains of amino acid adenylation, epimerization, N-methylation, cyclization, peptidyl carrier protein and condensation. Functionally active NRPS catalyzes the incorporation of an amino acid into a secondary metabolite.

Ген NRPS: Один или несколько генов, кодирующих NRPS, что приводит к получению функционально активных вторичных метаболитов, например эпотилонов А и В, когда они находятся под контролем одного или нескольких совместимых контролирующих элементов.NRPS gene: One or more genes encoding NRPS, resulting in functionally active secondary metabolites, such as epothilones A and B, when they are under the control of one or more compatible control elements.

Молекула нуклеиновой кислоты: Линейный сегмент одно- или двухцепочечной ДНК или РНК, который может быть выделен из любого источника. В контексте настоящего изобретения молекула нуклеиновой кислоты предпочтительно представляет собой сегмент ДНК.Nucleic acid molecule: A linear segment of single or double stranded DNA or RNA that can be isolated from any source. In the context of the present invention, the nucleic acid molecule is preferably a DNA segment.

ORF: Открытая рамка считыванияORF: Open reading frame

PKS: Поликетид-синтаза, которая представляет собой комплекс ферментативных активностей (доменов), ответственных за биосинтез поликетидов, включая, например, кеторедуктазу, дегидратазу, протеин-носитель ацила, еноилредуктазу, кетоацил-АСР-синтазу и ацилтрансферазу. Функционально активная PKS представляет собой синтазу, которая катализирует синтез поликетида.PKS: Polyketide synthase, which is a complex of enzymatic activities (domains) responsible for the biosynthesis of polyketides, including, for example, ketoreductase, dehydratase, acyl carrier protein, enoyl reductase, ketoacyl ACP synthase and acyltransferase. The functionally active PKS is a synthase that catalyzes the synthesis of polyketide.

Гены PKS: Один или несколько генов, кодирующих различные полипептиды, необходимые для получения функционально активных поликетидов, например эпотилонов А и В, когда они находятся под контролем одного или нескольких совместимых контролирующих элементов.PKS genes: One or more genes encoding the various polypeptides necessary to produce functionally active polyketides, such as epothilones A and B, when they are under the control of one or more compatible control elements.

Практически аналогичная: в отношении нуклеиновых кислот относится к молекуле нуклеиновой кислоты, последовательность которой по меньшей мере на 60% идентична молекуле нуклеиновой кислоты, с которой проводится сравнение. В предпочтительном варианте осуществления практически аналогичная молекула ДНК по меньшей мере на 80% идентична молекуле ДНК, с которой проводится сравнение; в более предпочтительном варианте осуществления практически аналогичная молекула ДНК 90% идентична молекуле ДНК, с которой проводится сравнение; и в наиболее предпочтительном варианте осуществления практически аналогичная молекула ДНК по меньшей мере на 95% идентична молекуле ДНК, с которой проводится сравнение. Практически аналогичная последовательность ДНК предпочтительно кодирует протеин или пептид, имеющий практически такую же активность, что и протеин или пептид, кодируемый последовательностью ДНК, с которой проводится сравнение. Практически аналогичная нуклеотидная последовательность, как правило, гибридизуется с молекулой нуклеиновой кислоты, с которой проводится сравнение, или с ее фрагментом при следующих условиях: гибридизация в 7%-ном додецилсульфате натрия (ДСН), 0,5М NaPO4, pH 7,0, 1 мМ ЭДТК при 50°С; отмывка двукратным SSC (2xSSC), 1%-ным ДСН при 50°С. В отношении протеинов или пептидов практически аналогичная аминокислотная последовательность обозначает аминокислотную последовательность, которая по меньшей мере на 90% идентична аминокислотной последовательности протеина или пептида, с которым проводится сравнение, и обладает практически такой же активностью, что и активность протеина или пептида, с которым проводится сравнение.Almost the same: in relation to nucleic acids, it refers to a nucleic acid molecule, the sequence of which is at least 60% identical to the nucleic acid molecule with which the comparison is made. In a preferred embodiment, the substantially similar DNA molecule is at least 80% identical to the DNA molecule being compared; in a more preferred embodiment, the substantially similar DNA molecule is 90% identical to the DNA molecule being compared; and in a most preferred embodiment, the substantially similar DNA molecule is at least 95% identical to the DNA molecule being compared. A substantially similar DNA sequence preferably encodes a protein or peptide having substantially the same activity as the protein or peptide encoded by the DNA sequence to be compared. A practically similar nucleotide sequence, as a rule, hybridizes with the nucleic acid molecule to be compared, or with its fragment under the following conditions: hybridization in 7% sodium dodecyl sulfate (SDS), 0.5 M NaPO 4 , pH 7.0, 1 mM EDTA at 50 ° C; washing with double SSC (2xSSC), 1% SDS at 50 ° C. For proteins or peptides, a substantially similar amino acid sequence denotes an amino acid sequence that is at least 90% identical to the amino acid sequence of the protein or peptide being compared and has almost the same activity as the activity of the protein or peptide being compared .

Трансформация: Процесс интродукции гетерологичной нуклеиновой кислоты в клетку-хозяина или в организм.Transformation: The process of introducing a heterologous nucleic acid into a host cell or organism.

Трансформированный/трансгенный/рекомбинантный: Относится к организму хозяина, такому, как бактерия, в который интродуцирована гетерологичная молекула нуклеиновой кислоты. Молекула нуклеиновой кислоты может быть стабильно интегрирована в геном хозяина, или молекула нуклеиновой кислоты также может присутствовать в виде внехромосомной молекулы. Такая внехромосомная молекула может представлять собой самореплицирующуся молекулу. Подразумевается, что понятие трансформированные клетки, ткани или растения включает не только конечный продукт процесса трансформации, но также и их трансгенное потомство. Понятия "нетрансформированный", "нетрансгенный" или "нерекомбинантный" хозяин обозначает организм дикого типа, например бактерию, который не содержит гетерологичную молекулу нуклеиновой кислоты.Transformed / transgenic / recombinant: Refers to a host organism, such as a bacterium, into which a heterologous nucleic acid molecule is introduced. The nucleic acid molecule may be stably integrated into the host genome, or the nucleic acid molecule may also be present as an extrachromosomal molecule. Such an extrachromosomal molecule may be a self-replicating molecule. It is understood that the concept of transformed cells, tissues or plants includes not only the end product of the transformation process, but also their transgenic offspring. The terms “non-transformed”, “non-transgenic” or “non-recombinant” host means a wild-type organism, for example a bacterium that does not contain a heterologous nucleic acid molecule.

Нуклеотиды обозначены по их основаниям с помощью следующих стандартных сокращений: аденин (А), цитозин (С), тимин (Т) и гуанин (G). Аминокислоты также обозначены следующими стандартными сокращениям: аланин (Ala; А), аргинин (Arg; R), аспарагин (Asn; N), аспарагиновая кислота (Asp; D), цистеин (Cys; С), глутамин (Gln; Q), глутаминовая кислота (Glu; E), глицин (Gly; G), гистидин (His; H), изолейцин (Ile; I), лейцин (Leu; L), лизин (Lys; К), метионин (Met, М), фенилаланин (Phe, F); пролин (Pro, Р); серин (Ser, S); треонин (Thr, Т); триптофан (Trp; W), тирозин (Tyr; Y) и валин (Val; V). Кроме того, (Хаа; X) обозначает любую аминокислоту.Nucleotides are labeled based on the following standard abbreviations: adenine (A), cytosine (C), thymine (T), and guanine (G). Amino acids are also indicated by the following standard abbreviations: alanine (Ala; A), arginine (Arg; R), asparagine (Asn; N), aspartic acid (Asp; D), cysteine (Cys; C), glutamine (Gln; Q), glutamic acid (Glu; E), glycine (Gly; G), histidine (His; H), isoleucine (Ile; I), leucine (Leu; L), lysine (Lys; K), methionine (Met, M), phenylalanine (Phe, F); proline (Pro, P); serine (Ser, S); threonine (Thr, T); tryptophan (Trp; W), tyrosine (Tyr; Y) and valine (Val; V). In addition, (Haa; X) denotes any amino acid.

Описание последовательностей, приведенных в перечне последовательностиDescription of the sequences listed in the sequence listing

SEQ ID NO:1 представляет собой нуклеотидую последовательность длиной 68750 пар оснований в виде набора последовательностей фрагментов, содержащего 22 открытые рамки считывания (ORF), которая включает гены биосинтеза эпотилона.SEQ ID NO: 1 is a nucleotide sequence with a length of 68,750 base pairs in the form of a sequence of fragments containing 22 open reading frames (ORF), which includes genes for the biosynthesis of epothilone.

SEQ ID NO:2 представляет собой последовательность протеина поликетид-синтазы типа I (EPOS А), кодируемую ероА (нуклеотиды 7610-11875 SEQ ID NO:1).SEQ ID NO: 2 is a Type I polyketide synthase protein sequence (EPOS A) encoded by EPO (nucleotides 7610-11875 of SEQ ID NO: 1).

SEQ ID NO:3 представляет собой последовательность протеина нерибосомной кислота-аминокислота-лигазы (EPOS Р), кодируемой ероР (нуклеотиды 11872-16104 SEQ ID NO:1).SEQ ID NO: 3 is the sequence of the non-ribosomal acid-amino acid ligase (EPOS P) protein encoded by EPO (nucleotides 11872-16104 of SEQ ID NO: 1).

SEQ ID NO:4 представляет собой последовательность протеина поликетид-синтазы типа I (EPOS В), кодируемую ероВ (нуклеотиды 16251-21749 SEQ ID NO:1).SEQ ID NO: 4 is a Type I polyketide synthase protein sequence (EPOS B) encoded by EPO (nucleotides 16251-21749 of SEQ ID NO: 1).

SEQ ID NO:5 представляет собой последовательность протеина поликетид-синтазы типа I (EPOS С), кодируемую ероС (нуклеотиды 21746-43519 SEQ ID NO:1).SEQ ID NO: 5 is a Type I polyketide synthase protein sequence (EPOS C) encoded by EPO (nucleotides 21746-43519 of SEQ ID NO: 1).

SEQ ID NO:6 представляет собой последовательность протеина поликетид-синтазы типа I (EPOS D), кодируемую epoD (нуклеотиды 43524-54920 SEQ ID NO:1).SEQ ID NO: 6 is a Type I polyketide synthase protein sequence (EPOS D) encoded by epoD (nucleotides 43524-54920 of SEQ ID NO: 1).

SEQ ID NO:7 представляет собой последовательность протеина поликетид-синтазы типа I (EPOS E), кодируемую ероЕ (нуклеотиды 54935-62254 SEQ ID NO:1).SEQ ID NO: 7 is a Type I polyketide synthase protein sequence (EPOS E) encoded by EPO (nucleotides 54935-62254 of SEQ ID NO: 1).

SEQ ID NO:8 представляет собой последовательность протеина гомолога цитохром Р450 оксидазы (EPOS F), кодируемую epoF (нуклеотиды 62369-63628 SEQ ID NO:1).SEQ ID NO: 8 is the cytochrome P450 oxidase (EPOS F) homolog protein sequence encoded by epoF (nucleotides 62369-63628 of SEQ ID NO: 1).

SEQ ID NO:9 представляет собой последовательность протеина (частичная Orf 1), кодируемую orf1 (нуклеотиды 1-1826 SEQ ID NO:1).SEQ ID NO: 9 is a protein sequence (partial Orf 1) encoded by orf1 (nucleotides 1-1826 of SEQ ID NO: 1).

SEQ ID NO:10 представляет собой последовательность протеина (Orf 2), кодируемую orf2 (нуклеотиды 3171-1900 на обратной комплементарной цепи SEQ ID NO:1).SEQ ID NO: 10 is a protein sequence (Orf 2) encoded by orf2 (nucleotides 3171-1900 on the reverse complementary chain of SEQ ID NO: 1).

SEQ ID NO:11 представляет собой последовательность протеина (Orf 3), кодируемую orf3 (нуклеотиды 3415-5556 SEQ ID NO:1).SEQ ID NO: 11 is a protein sequence (Orf 3) encoded by orf3 (nucleotides 3415-5556 of SEQ ID NO: 1).

SEQ ID NO:12 представляет собой последовательность протеина (Orf 4), кодируемую orf4 (нуклеотиды 5992-5612 обратной комплементарной цепи SEQ ID NO:1).SEQ ID NO: 12 is a protein sequence (Orf 4) encoded by orf4 (nucleotides 5992-5612 of the reverse complementary chain of SEQ ID NO: 1).

SEQ ID NO:13 представляет собой последовательность протеина (Orf 5), кодируемую orf5 (нуклеотиды 6226-6675 SEQ ID NO:1).SEQ ID NO: 13 is a protein sequence (Orf 5) encoded by orf5 (nucleotides 6226-6675 of SEQ ID NO: 1).

SEQ ID NO:14 представляет собой последовательность протеина (Orf 6), кодируемую orf6 (нуклеотиды 63779-64333 SEQ ID NO:1).SEQ ID NO: 14 is a protein sequence (Orf 6) encoded by orf6 (nucleotides 63779-64333 of SEQ ID NO: 1).

SEQ ID NO:15 представляет собой последовательность протеина (Orf 7), кодируемую orf7 (нуклеотиды 64290-63853 обратной комплементарной цепи SEQ ID NO:1).SEQ ID NO: 15 is a protein sequence (Orf 7) encoded by orf7 (nucleotides 64290-63853 of the reverse complementary chain of SEQ ID NO: 1).

SEQ ID NO:16 представляет собой последовательность протеина (Orf 8), кодируемую orf8 (нуклеотиды 64363-64920 SEQ ID NO:1).SEQ ID NO: 16 is a protein sequence (Orf 8) encoded by orf8 (nucleotides 64363-64920 of SEQ ID NO: 1).

SEQ ID NO:17 представляет собой последовательность протеина (Orf 9), кодируемую orf9 (нуклеотиды 64727-64287 обратной комплементарной цепи SEQ ID NO:1).SEQ ID NO: 17 is a protein sequence (Orf 9) encoded by orf9 (nucleotides 64727-64287 of the reverse complementary chain of SEQ ID NO: 1).

SEQ ID NO:18 представляет собой последовательность протеина (Orf 10), кодируемую orf10 (нуклеотиды 65063-65767 SEQ ID NO:1).SEQ ID NO: 18 is a protein sequence (Orf 10) encoded by orf10 (nucleotides 65063-65767 of SEQ ID NO: 1).

SEQ ID NO:19 представляет собой последовательность протеина (Orf 11), кодируемую orf11 (нуклеотиды 65874-65008 обратной комплементарной цепи SEQ ID NO:1).SEQ ID NO: 19 is a protein sequence (Orf 11) encoded by orf11 (nucleotides 65874-65008 of the reverse complementary chain of SEQ ID NO: 1).

SEQ ID NO:20 представляет собой последовательность протеина (Orf 12), кодируемую orf12 (нуклеотиды 66338-65871 обратной комплементарной цепи SEQ ID NO:1).SEQ ID NO: 20 is a protein sequence (Orf 12) encoded by orf12 (nucleotides 66338-65871 of the reverse complementary chain of SEQ ID NO: 1).

SEQ ID NO:21 представляет собой последовательность протеина (Orf 13), кодируемую orf13 (нуклеотиды 66667-67137 SEQ ID NO:1).SEQ ID NO: 21 is a protein sequence (Orf 13) encoded by orf13 (nucleotides 66667-67137 SEQ ID NO: 1).

SEQ ID NO:22 представляет собой последовательность протеина (Orf 14), кодируемую encoded by orf14 (нуклеотиды 67334-68251 SEQ ID NO:1).SEQ ID NO: 22 is a protein sequence (Orf 14) encoded by encoded by orf14 (nucleotides 67334-68251 of SEQ ID NO: 1).

SEQ ID NO:23 представляет собой частичную последовательность протеина (частичная Orf 15), кодируемую orf15 (нуклеотиды 68346-68750 SEQ ID NO:1).SEQ ID NO: 23 is a partial protein sequence (partial Orf 15) encoded by orf15 (nucleotides 68346-68750 of SEQ ID NO: 1).

SEQ ID NO:24 представляет собой последовательность универсального "обратного" (обеспечивающего синтез против хода транскрипции) ПЦР-праймера.SEQ ID NO: 24 is a universal reverse sequence (providing synthesis against the course of transcription) of a PCR primer.

SEQ ID NO:25 представляет собой последовательность универсального "прямого" (обеспечивающего синтез по ходу транскрипции) ПЦР-праймера.SEQ ID NO: 25 represents the sequence of universal "direct" (providing synthesis along the transcription) PCR primer.

SEQ ID NO:26 представляет собой последовательность ПЦР-праймера "В" NH24-конца.SEQ ID NO: 26 is the sequence of the PCR primer "B" of the NH24 end.

SEQ ID NO:27 представляет собой последовательность ПЦР-праймера "А" NH2-конца.SEQ ID NO: 27 is the sequence of the PCR primer "A" of the NH2 end.

SEQ ID NO:28 представляет собой последовательность ПЦР-праймера "В" NH2-конца.SEQ ID NO: 28 represents the sequence of the PCR primer "B" of the NH2 end.

SEQ ID NO:29 представляет собой последовательность ПЦР-праймера "В" pEPO15-NH6-конца.SEQ ID NO: 29 represents the sequence of the PCR primer "B" of the pEPO15-NH6 end.

SEQ ID NO:30 представляет собой последовательность ПЦР-праймера "А" рЕРO15-Н2.7-конца.SEQ ID NO: 30 is the sequence of the PCR primer "A" pEPO15-H2.7 end.

Информации о депонированииDeposit Information

Следующие продукты были депонированы в Agricultural Research Service, Patent Culture Collection (NRRL), 1815 North University Street, Peoria, Illinois 61604, в соответствии с Будапештским договором о международном признании депонирования микроорганизмов для целей процедуры патентования (the Budapest Treaty on the International Recognition of the Deposit of Microorganisms for the Purposes of Patent Procedure). Все ограничения по доступности депонированного продукта должны быть бесповоротно устранены после выдачи патента.The following products were deposited with the Agricultural Research Service, Patent Culture Collection (NRRL), 1815 North University Street, Peoria, Illinois 61604, in accordance with the Budapest Treaty on the International Recognition of the Deposit of Microorganisms for the Purposes of the Patent Procedure (the Budapest Treaty on the International Recognition of the Deposit of Microorganisms for the Purposes of Patent Procedure). All restrictions on the availability of the deposited product must be irrevocably removed after the grant of a patent.

Депонированный продуктDeposited product Регистрационный номерRegistration number Дата депонированияDate of deposit рЕРO15PEPO15 NRRL В-30033NRRL B-30033 11 июля 1998 г.July 11, 1998 рЕРO32pEPO32 NRRL В-30119NRRL B-30119 16 апреля 1999 г.April 16, 1999

Подробное описание изобретенияDETAILED DESCRIPTION OF THE INVENTION

Гены, принимающие участие в биосинтезе эпотилонов, могут быть выделены с использованием способов по настоящему изобретению. Согласно наиболее предпочтительной процедуре выделения генов биосинтеза эпотилонов требуется выделение геномной ДНК из организма, выявленного в качестве продуцента эпотилонов А и В, и перенос выделенной ДНК с использованием пригодных плазмиды или вектора в организм-хозяин, который в норме не продуцирует поликетид, с последующей идентификацией колоний трансформированного хозяина, которым придана способность продуцировать эпотилон. С использованием такой методики, как λ::Тn5-транспозонный мутагенез (de Bruijn и Lupski, Gene 27: 131-149 (1984)), может быть более точно определена конкретная область трансформирующей, обусловливающей синтез эпотилона ДНК. В альтернативном или в дополнительном варианте трансформирующая, обусловливающая синтез эпотилона ДНК, может быть расщеплена на более мелкие фрагменты и наименьший из них, который сохраняет способность обусловливать синтез эпотилона, может быть дополнительно охарактеризован. В то время как организм-хозяин, лишенный способности продуцировать эпотилон, может представлять собой виды, отличные от организма, из которого поликетид получен, вариация этого способа включает трансформацию ДНК хозяина этого же самого хозяина, у которого способность продуцировать эпотилон нарушена в результате мутагенеза. Согласно этому варианту способа продуцирующий эпотилон организм подвергают мутации и выделяют мутанты, не способные продуцировать эпотилон. Затем их подвергают комплементации с помощью геномной ДНК, выделенной из продуцирующего эпотилон родительского штамма.Genes involved in the biosynthesis of epothilones can be isolated using the methods of the present invention. According to the most preferred procedure for isolating epothilone biosynthesis genes, it is necessary to isolate genomic DNA from an organism identified as a producer of epothilones A and B, and transfer the isolated DNA using suitable plasmids or vectors to a host that normally does not produce polyketide, followed by identification of colonies transformed host, which is given the ability to produce epothilone. Using a technique such as λ :: Tn5 transposon mutagenesis (de Bruijn and Lupski, Gene 27: 131-149 (1984)), a specific transforming region responsible for the synthesis of DNA epothilone can be more accurately determined. In an alternative or additional embodiment, transforming, causing the synthesis of epothilone DNA, can be split into smaller fragments and the smallest of them, which retains the ability to cause the synthesis of epothilone, can be further characterized. While the host organism, deprived of the ability to produce epothilone, may be species other than the organism from which the polyketide is derived, a variation of this method involves the transformation of the DNA of the host of the same host, in which the ability to produce epothilone is impaired by mutagenesis. According to this variant of the method, an epothilone-producing organism is mutated and mutants that are not able to produce epothilone are isolated. Then they are subjected to complementation using genomic DNA isolated from the epothilone-producing parent strain.

Еще один пример метода, который может использоваться для выделения генов, необходимых для биосинтеза эпотилона, основан на транспозонном мутагенезе для получения мутантов продуцирующего эпотилон организма, которые после мутагенеза теряют способность продуцировать поликетид. Например, область генома хозяина, ответственную за производство эпотилона, метят с помощью транспозона, и она может быть выделена и применяться в качестве зонда для выделения нативных генов из родительского штамма. PKS-гены, которые необходимы для синтеза поликетидов и которые аналогичны известным PKS-генам, могут быть выделены на основе гомологии их последовательности с генами биосинтеза, последовательность которых является известной, например, с генами биосинтеза рифамицина или сорафена. Методы, пригодные для выделения на основе гомологии, включают стандартный скрининг библиотеки путем гибридизации ДНК.Another example of a method that can be used to isolate the genes necessary for epothilone biosynthesis is based on transposon mutagenesis to obtain mutants of the epothilone-producing organism that, after mutagenesis, lose the ability to produce polyketide. For example, the region of the host genome responsible for the production of epothilone is labeled with a transposon, and it can be isolated and used as a probe to isolate native genes from the parent strain. PKS genes that are necessary for the synthesis of polyketides and which are similar to known PKS genes can be isolated on the basis of the homology of their sequence with biosynthesis genes, the sequence of which is known, for example, with rifamycin or sorafen biosynthesis genes. Methods suitable for homology isolation include standard screening of the library by DNA hybridization.

Предпочтительным для применения в качестве молекулы-зонда является фрагмент ДНК, который может быть получен из гена или другой последовательности ДНК, которая играет роль в синтезе известного поликетида. Предпочтительная молекула-зонд включает ДНК-фрагмент Smal длиной 1,2 т.п.н., кодирующий домен кетосинтазы четвертого модуля PKS сорафена (патент US 5716849), и более предпочтительная молекула-зонд включает домены β-кетоацилсинтазы из первого и второго модулей PKS рифамицина (Schupp и др., FEMS Microbiology Letters 159: 201-207 (1998)). Они могут использоваться в качестве зонда библиотеки генов продуцирующего эпотилон микроорганизма для выделения PKS-генов, ответственных за биосинтез эпотилона.A DNA fragment that can be obtained from a gene or other DNA sequence that plays a role in the synthesis of a known polyketide is preferred for use as a probe molecule. A preferred probe molecule includes a 1.2 kb Smal DNA fragment encoding the ketosyntase domain of the fourth PKS module of sorafen (US Pat. No. 5,716,849), and a more preferred probe molecule includes β-ketoacyl synthase domains from the first and second PKS modules rifamycin (Schupp et al., FEMS Microbiology Letters 159: 201-207 (1998)). They can be used as a probe in the gene library of an epothilone-producing microorganism to isolate the PKS genes responsible for epothilone biosynthesis.

Несмотря на хорошо известные трудности, связанные с выделением PKS-генов в целом, и несмотря на трудности, которые, как ожидается, должны быть связаны с выделением генов биосинтеза эпотилона, в частности, с помощью способов, представленных в настоящем описании, неожиданно было установлено, что гены биосинтеза эпотилонов А и В могут быть клонированы из микроорганизма, продуцирующего поликетид. С помощью способов манипуляции генами и получения рекомбинантов, которые приведены в настоящем описании, клонированные PKS-гены могут быть модифицированы и экспрессированы в трансгенных организмах-хозяевах.Despite the well-known difficulties associated with the isolation of PKS genes in general, and despite the difficulties that are expected to be associated with the isolation of epothilone biosynthesis genes, in particular, using the methods presented in the present description, it was unexpectedly found that the genes for the biosynthesis of epothilones A and B can be cloned from a polyketide-producing microorganism. Using methods for manipulating genes and producing recombinants as described herein, cloned PKS genes can be modified and expressed in transgenic host organisms.

Выделенные гены биосинтеза эпотилона могут экспрессироваться в гетерологичных хозяевах, обладающих способностью продуцировать поликетид с повышенной эффективностью по сравнению с той, которую можно ожидать в нативных хозяевах. Методики таких генетических манипуляций специфичны для различных доступных хозяев и известны в данной области. Например, гетерологичные гены могут экспрессироваться в Streptomyces и в других актиномицетах с использованием методов, описанных у McDaniel и др., Science 262: 1546-1550 (1993) и Као и др., Science 265: 509-512 (1994), обе публикации включены в настоящее описание в виде ссылки, см. также Rowe и др., Gene 216: 215-223 (1998); Holmes и др., EMBO Journal 12(8); 3183-3191 (1993) и Bibb и др., Gene 38: 215-226 (1985), все публикации включены в настоящее описание в виде ссылки.Isolated epothilone biosynthesis genes can be expressed in heterologous hosts that have the ability to produce polyketide with increased efficiency compared to what would be expected in native hosts. Techniques for such genetic manipulations are specific to the various hosts available and are known in the art. For example, heterologous genes can be expressed in Streptomyces and in other actinomycetes using methods described by McDaniel et al., Science 262: 1546-1550 (1993) and Kao et al., Science 265: 509-512 (1994), both publications incorporated by reference, see also Rowe et al., Gene 216: 215-223 (1998); Holmes et al., EMBO Journal 12 (8); 3183-3191 (1993) and Bibb et al., Gene 38: 215-226 (1985), all publications are incorporated herein by reference.

В альтернативном варианте гены, ответственные за биосинтез поликетидов, т.е. гены биосинтеза эпотилона, также могут экспрессироваться в других организмах-хозяевах, таких как псевдомонады и Е.coli. Методики таких генетических манипуляций специфичны для различных доступных хозяев и известны в данной области. Например, PKS-гены были с успехом экспрессированы в Е.coli с использованием вектора рТ7-7, в котором используется промотор фага Т7 (см. Tabor и др., Proc. Natl. Acad. Sci. USA 82: 1074-1078 (1985), публикации включены в настоящее описание в виде ссылки. Кроме того, экспрессионные векторы рКК.223-3 и рКК.223-2 могут применяться для экспрессии гетерологичных генов в Е.coli, либо в транскрипционном, либо в трансляционном слиянии, под контролем промотора tac или trc. Для экспрессии оперонов, кодирующих множество ORF, самый простой метод основан на встраивании оперона в такой вектор, как рКК223-3, в транскрипционном слиянии, что позволяет использовать родственный сайг связывания рибосомы гетерологичных генов. Методы сверхэкспрессии в грамположительных видах, таких как Bacillus, также являются известными в данной области и могут применяться согласно настоящему изобретению (Quax и др., в: Industrial Microorganisms: Basic and Applied Molecular Genetics, ред. Baltz и др., American Society for Microbiology, Washington (1993)).Alternatively, the genes responsible for the biosynthesis of polyketides, i.e. epothilone biosynthesis genes can also be expressed in other host organisms, such as pseudomonads and E. coli. Techniques for such genetic manipulations are specific to the various hosts available and are known in the art. For example, PKS genes were successfully expressed in E. coli using the pT7-7 vector, which uses the T7 phage promoter (see Tabor et al., Proc. Natl. Acad. Sci. USA 82: 1074-1078 (1985 ), publications are incorporated herein by reference. In addition, pKK.223-3 and pKK.223-2 expression vectors can be used to express heterologous genes in E. coli, either in transcriptional or translational fusion, under the control of a promoter tac or trc. For the expression of operons encoding multiple ORFs, the simplest method is based on embedding the operon in a vector such as p K223-3, in transcriptional fusion, which allows the use of related ribosome binding sites for heterologous genes Overexpression methods in gram-positive species such as Bacillus are also known in the art and can be used according to the present invention (Quax et al., In: Industrial Microorganisms : Basic and Applied Molecular Genetics, ed. Baltz et al., American Society for Microbiology, Washington (1993)).

Другие системы экспрессии, которые могут применяться с генами биосинтеза эпотилона по изобретению, включают системы экспрессии дрожжей и бакуловирусов (см., например, "The Expression of Recombinant Proteins in Yeasts", Sudbery, P.E., Curr. Opin. Biotechnol. 7(5): 517-524 (1996); "Methods for Expressing Recombinant Proteins in Yeast, Mackay, и др., ред.: Carey, Paul R., Protein Eng. Des. 105-153, Publisher: Academic, San Diego, Calif (1996); "Expression of heterologous gene products in yeast", Pichuantes, и др., ред.: Cleland, J. L., Craik, C. S., Protein Eng. 129-161, Publisher: Wiley-Liss, New York, N. Y (1996); WO 98/27203; Kealey и др., Proc. Natl. Acad. Sci. USA 95: 505-509 (1998); "Insect Cell Culture: Recent Advances, Bioengineering Challenges And Implications In Protein Production", Palomares, и др., ред.: Galindo, Enrique; Ramirez, Octavio Т., Adv. Bioprocess Eng. Vol.II, Invited Pap.Int. Symp., 2-й (1998) 25-52, изд.: Kluwer, Dordrecht, Neth; "Baculovirus Expression Vectors", Jarvis, Donald L., ред: Miller, Lots K., Baculoviruses 389-431, изд.: Plenum, New York, N. Y. (1997); "Production Of Heterologous Proteins Using The Baculovirus/Insect Expression System", Grittiths, и др., Methods Mol. Biol. (Totowa, N.J.) 75 (Basic Cell Culture Protocols (2-е изд.) 427-440 (1997); и "Insect Cell Expression Technology", Luckow, Verne A., Protein Eng. 183-218, изд.: Wiley-Liss, New York, N.Y. (1996); все эти публикации включены в настоящее описание в виде ссылки.Other expression systems that can be used with the epothilone biosynthesis genes of the invention include yeast and baculovirus expression systems (see, for example, "The Expression of Recombinant Proteins in Yeasts", Sudbery, PE, Curr. Opin. Biotechnol. 7 (5) : 517-524 (1996); "Methods for Expressing Recombinant Proteins in Yeast, Mackay, et al., Ed .: Carey, Paul R., Protein Eng. Des. 105-153, Publisher: Academic, San Diego, Calif ( 1996); "Expression of heterologous gene products in yeast", Pichuantes et al., Ed .: Cleland, JL, Craik, CS, Protein Eng. 129-161, Publisher: Wiley-Liss, New York, N. Y ( 1996); WO 98/27203; Kealey et al., Proc. Natl. Acad. Sci. USA 95: 505-509 (1998); "Insect Cell Culture: Recent Advances, Bioengineering Challenges And Implications In Protein Production", Palomares, et al.: Galindo, Enri que; Ramirez, Octavio T., Adv. Bioprocess Eng. Vol.II, Invited Pap.Int. Symp., 2nd (1998) 25-52, ed .: Kluwer, Dordrecht, Neth; "Baculovirus Expression Vectors", Jarvis, Donald L., ed: Miller, Lots K., Baculoviruses 389-431, ed .: Plenum, New York, NY (1997); "Production Of Heterologous Proteins Using The Baculovirus / Insect Expression System", Grittiths, et al., Methods Mol. Biol. (Totowa, NJ) 75 (Basic Cell Culture Protocols (2nd ed.) 427-440 (1997); and Insect Cell Expression Technology, Luckow, Verne A., Protein Eng. 183-218, ed .: Wiley -Liss, New York, NY (1996); all of these publications are incorporated herein by reference.

Другим важным фактором для экспрессии PKS-генов в гетерологичном хозяине является необходимость наличия ферментов для посттрансляционной модификации ферментов PKS путем фосфопантетеинилирования до того, как они смогут синтезировать поликетиды. Однако ферменты, ответственные за модификацию ферментов PKS типа I, фосфопантетеинил (Р-pant)-трансферазы, в норме не присутствуют во многих хозяевах, таких как E.coli. Эта проблема может быть решена путем совместной экспрессии P-pant-трансферазы и PKS-генов в гетерологичном хозяине, как описано у Kealey и др., Proc. Natl. Acad. Sci. USA 95: 505-509 (1998), публикация включена в настоящее описание в виде ссылки.Another important factor for the expression of PKS genes in a heterologous host is the need for enzymes for post-translational modification of PKS enzymes by phosphopantheteinylation before they can synthesize polyketides. However, the enzymes responsible for modifying PKS type I enzymes, phosphopantheteinyl (P-pant) transferases, are not normally present in many hosts, such as E. coli. This problem can be solved by co-expression of P-pant transferase and PKS genes in a heterologous host, as described by Kealey et al., Proc. Natl. Acad. Sci. USA 95: 505-509 (1998), a publication is incorporated herein by reference.

Таким образом, для получения поликетидов важными критериями выбора организма-хозяина являются простота манипуляции с ним, быстрый рост (т.е. ферментация), наличие или пригодность молекулярного механизма для таких процессов, как посттрансляционная модификация, и отсутствие у него чувствительности к поликетиду при его сверхпроизводстве. Наиболее предпочтительными организмами являются актиномицеты, такие как штаммы Streptomyces. Другими предпочтительными организмами-хозяева являются Pseudomonads и Е.coli. Перечисленные выше способы получения поликетидов имеют значительные преимущества по сравнению с известными к настоящему времени методами, применяемые для получения этих соединений. Эти преимущества включают существенно меньшую стоимость получения, возможность получать большие количества соединений и возможность получать соединения в виде предпочтительных с точки зрения биологической активности энантиомеров в противоположность рацемическим смесям, неизбежно получаемым с помощью органического синтеза. Соединения, которые продуцируются гетерологичными хозяевами, могут применяться в медицинской (например, для лечения рака в случае эпотилонов), а также в сельскохозяйственной практике.Thus, to obtain polyketides, important criteria for choosing a host organism are the ease of manipulation with it, rapid growth (i.e., fermentation), the presence or suitability of the molecular mechanism for processes such as post-translational modification, and its lack of sensitivity to polyketide overproduction. Most preferred organisms are actinomycetes, such as Streptomyces strains. Other preferred host organisms are Pseudomonads and E. coli. The above methods for producing polyketides have significant advantages compared to the currently known methods used to obtain these compounds. These advantages include significantly lower production costs, the ability to produce large amounts of compounds, and the ability to produce compounds as enantiomers preferred in terms of biological activity, as opposed to racemic mixtures inevitably obtained by organic synthesis. Compounds that are produced by heterologous hosts can be used in medical (for example, for the treatment of cancer in the case of epothilones), as well as in agricultural practice.

Экспериментальная частьexperimental part

Изобретение дополнительно описано со ссылкой на приведенные ниже подробные примеры. Эти примеры даны только с целью иллюстрации и не направлены на ограничение каким-либо образом объема изобретения, если не указано иное. Стандартные примененные методы рекомбинантной ДНК и молекулярного клонирования являются хорошо известными в данной области и описаны у Ausubel (ред.), Current Protocols in Molecular Biology, John Wiley and Sons, Inc. (1994); Т. Maniatis, Е. F. Fritsch и у J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor laboratory, Cold Spring Harbor, NY (1989); и у T.J.Silhavy, M.L.Berman и L.W.Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984).The invention is further described with reference to the following detailed examples. These examples are given for illustrative purposes only and are not intended to limit in any way the scope of the invention, unless otherwise indicated. The standard recombinant DNA and molecular cloning techniques employed are well known in the art and are described by Ausubel (eds.), Current Protocols in Molecular Biology, John Wiley and Sons, Inc. (1994); T. Maniatis, E. F. Fritsch, and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor laboratory, Cold Spring Harbor, NY (1989); and T.J. Silhavy, M.L. Berman and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984).

Пример 1: Культивирование продуцирующего эпотилон штамма Sorangium cellulosumExample 1: Cultivation of an Epothilone-producing Sorangium cellulosum strain

Штамм Sorangium cellulosum strain 90 (DSM 6773, Немецкая коллекция микроорганизмов и клеточных культур, Брауншвейг (Deutsche Sammlung von Mikroorganismen und Zellkulturen, Braunschweig)) сеют штрихом и выращивают (30°С) на агаровой пластинке в среде SolE (0,35% глюкозы, 0,05% триптона, 0,15% MgSO4·7H2O, 0,05% сульфата аммония, 0,1% CaCl2, 0,006% К2НРО4, 0,01% дитионата натрия, 0,0008% Fe-ЭДТК, 1,2% HEPES, 3,5% [об./об.] супернатанта стерилизованной стационарной культуры S.cellulosum) pH до 7,4. Отбирают клетки с площади примерно 1 см2 и инокулируют в 5 мл жидкой среды G51t (0,2% глюкозы, 0,5% крахмала, 0,2% триптона, 0,1% пробиона S, 0,05% CaCl2·2H2O, 0,05% MgSO4·H2O, 1,2% HEPES, pH до 7,4) и инкубируют при 30°С при перемешивании со скоростью 225 об/мин. Через 4 дня культуру переносят в 50 мл среды G51t и инкубируют в указанных выше условиях в течение 5 дней. Эту культуру используют для инокуляции 500 мл G51t и инкубируют в указанных выше условиях в течение 6 дней. Культуру центрифугируют в течение 10 мин при 4000 об/мин и клеточный дебрис ресуспендируют в 50 мл среды G51t.The strain Sorangium cellulosum strain 90 (DSM 6773, German collection of microorganisms and cell cultures, Braunschweig (Deutsche Sammlung von Mikroorganismen und Zellkulturen, Braunschweig)) is streaked and grown (30 ° C) on an agar plate in SolE medium (0.35% glucose) 0.05% tryptone, 0.15% MgSO 4 · 7H 2 O, 0.05% ammonium sulfate, 0.1% CaCl 2 , 0.006% K 2 NRA 4 , 0.01% sodium dithionate, 0.0008% Fe -EDTA, 1.2% HEPES, 3.5% [v / v] supernatant of a sterilized stationary culture S.cellulosum) pH up to 7.4. Cells were taken from an area of about 1 cm 2 and inoculated in 5 ml of G51t liquid medium (0.2% glucose, 0.5% starch, 0.2% tryptone, 0.1% probion S, 0.05% CaCl 2 · 2H 2 O, 0.05% MgSO 4 · H 2 O, 1.2% HEPES, pH up to 7.4) and incubated at 30 ° C with stirring at a speed of 225 rpm After 4 days, the culture was transferred to 50 ml of G51t medium and incubated under the above conditions for 5 days. This culture was used to inoculate 500 ml of G51t and incubated under the above conditions for 6 days. The culture is centrifuged for 10 min at 4000 rpm and the cell debris is resuspended in 50 ml of G51t medium.

Пример 2: Получение библиотеки бактериальной искусственной хромосомы (Вас)Example 2: Obtaining a library of bacterial artificial chromosome (you)

Для получения библиотеки Вас клетки S.cellulosum, культивированные, как описано выше в примере 1, вносят в агарозные блоки, лизируют и высвободившуюся геномную ДНК частично расщепляют с помощью рестриктазы HindIII. Расщепленную ДНК разделяют на агарозном геле с помощью электрофореза в переменном токе. Из агарозного геля выделяют крупные (примерно 90-150 т.п.н.) фрагменты ДНК и встраивают путем лигирования в вектор pBelobacII. pBelobacII содержит ген, кодирующий устойчивость к хлорамфениколу, множественный сайт клонирования и ген lacZ, позволяющий осуществлять отбор голубых/белых колоний на соответствующей среде, а также гены, необходимые для репликации и поддержания присутствия 1 или 2 копий плазмиды на клетку. Для трансформации электрокомпетентных клеток Escherichia coli DH10B согласно стандартным методам электропорации применяют смесь для лигирования. Устойчивые к хлорамфениколу рекомбинантные колони (белые, lacZ-мутант) переносят на положительно заряженный фильтр в виде найлоновой мембраны формата 384 3×3. Колонии лизируют и ДНК перекрестие сшивают с фильтрами. Эти же колонии также сохраняют в виде жидких культур при -80°С.To obtain a library of you, S.cellulosum cells cultured as described in Example 1 above are introduced into agarose blocks, lysed, and the released genomic DNA is partially digested with HindIII restriction enzyme. The digested DNA is separated on an agarose gel by electrophoresis in alternating current. Large (approximately 90-150 kb) DNA fragments are isolated from the agarose gel and inserted by ligation into the pBelobacII vector. pBelobacII contains a gene encoding resistance to chloramphenicol, a multiple cloning site and the lacZ gene, which allows the selection of blue / white colonies on the appropriate medium, as well as the genes necessary for replication and maintenance of the presence of 1 or 2 copies of the plasmid per cell. A mixture of ligation is used to transform Escherichia coli DH10B electrocompetent cells according to standard electroporation methods. Chloramphenicol-resistant recombinant colonies (white, lacZ mutant) are transferred to a positively charged filter in the form of a 384 3 × 3 format nylon membrane. The colonies are lysed and the crosshair DNA is crosslinked with filters. The same colonies are also stored as liquid cultures at -80 ° C.

Пример 3: Скрининг библиотеки Вас Sorangium cellulosum 90 в присутствии последовательностей, родственных поликетид-синтазе типа IExample 3: Screening of the Sorangium cellulosum 90 library of you in the presence of sequences related to type I polyketide synthase

Фильтры библиотеки Вас зондируют с помощью стандартной Саузерн-гибридизации. Примененные ДНК-зонды кодируют домены β-кетоацилсинтазы из первого и второго модулей поликетид-синтазы рифамицина (Schupp и др., FEMS Microbiology Letters 159: 201-207 (1998)). ДНК-зонды получают с помощью ПЦР с использованием праймеров, фланкирующих каждый домен кетосинтазы, и плазмиды pNE95 в качестве матрицы (pNE95 соответствует космиде 2, описанной у Schupp и др. (1998)). Выделяют 25 нг амплифицированной с помощью ПЦР ДНК из 0,5%-ного агарозного геля и метят с помощью 32Р-дЦТФ с использованием набора для мечения случайным примированием (фирма Gibco-BRL, Бетезда штат Мэриленд, США) согласно инструкциям производителя. Гибридизацию проводят при 65°С в течение 36 ч и мембраны отмывают в строгих условиях (3 раза 0,1×SSC и 0,5%-ным ДСН в течение 20 мин при 65°С). Меченый блот экспонируют на чувствительный к изотопу фосфора экран и определяют сигналы с помощью устройства Phospholmager 445SI (экран и устройство 445SI фирмы Molecular Dynamics). Эта процедура приводит к гибридизации определенных клонов Вас с зондами. Эти клоны отбирают и культивируют в течение ночи в 5 мл бульона Луриа (LB) при 37°С. ДНК Вас из представляющих интерес клонов Вас выделяют с помощью обычной miniprep-процедуры. Клетки ресуспендируют в 200 мкл раствора лизоцима (50 мМ глюкоза, 10 мМ ЭДТК, 25 мМ Трис-HCl, 5 мг/мл лизоцим), лизируют в 400 мкл раствора для лизиса (0,2 н. NaOH и 2% ДСН), протеины осаждают (3,0 М ацетат натрия, значение рН которого доведено до 5,2 с помощью уксусной кислоты) и ДНК Вас осаждают изопропанолом. ДНК ресуспендируют в 20 мкл не содержащей нуклеазы дистиллированной воды, расщепляют с помощью BamHI (фирма New England Biolabs, Inc.) и разделяют на 0,7%-ном агарозном геле. Гель блоттируют Саузерн-гибридизацией, как описано выше, и зондируют в описанных выше условиях с использованием в качестве зонда SmaI-фрагмента ДНК длиной 1,2 т.п.н., который кодирует домен кетосинтазы в четвертом модуле поликетид-синтазы сорафена (см. патент US 5716849). Обнаружено пять различных схем гибридизации. Один клон, характерный для каждой из пяти схем, отбирают и обозначают как рЕРO15, рЕРO20, рЕРO30, рЕРO31 и рЕРО33 соответственно.Library filters probe you using standard Southern hybridization. The DNA probes used encode β-ketoacyl synthase domains from the first and second modules of rifamycin polyketide synthase (Schupp et al., FEMS Microbiology Letters 159: 201-207 (1998)). DNA probes were obtained by PCR using primers flanking each ketosynthase domain and plasmid pNE95 as template (pNE95 corresponds to cosmid 2 described by Schupp et al. (1998)). 25 ng of PCR amplified DNA was isolated from a 0.5% agarose gel and tagged with 32 R-dTTP using a random priming labeling kit (Gibco-BRL, Bethesda, Maryland, USA) according to the manufacturer's instructions. Hybridization is carried out at 65 ° C for 36 h and the membranes are washed under stringent conditions (3 times with 0.1 × SSC and 0.5% SDS for 20 min at 65 ° C). The labeled blot is exposed to a phosphorus isotope-sensitive screen and signals are detected using a Phospholmager 445SI device (Molecular Dynamics screen and 445SI device). This procedure results in the hybridization of certain clones of you with probes. These clones were selected and cultured overnight in 5 ml of Luria broth (LB) at 37 ° C. The DNA of you from the clones of interest is isolated using the usual miniprep procedure. Cells are resuspended in 200 μl of lysozyme solution (50 mM glucose, 10 mM EDTA, 25 mM Tris-HCl, 5 mg / ml lysozyme), lysed in 400 μl lysis solution (0.2 N NaOH and 2% SDS), proteins precipitated (3.0 M sodium acetate, the pH of which was adjusted to 5.2 with acetic acid) and DNA is precipitated with isopropanol. DNA was resuspended in 20 μl of nuclease-free distilled water, digested with BamHI (New England Biolabs, Inc.) and separated on a 0.7% agarose gel. The gel is blotted with Southern hybridization as described above and probed under the conditions described above using a 1.2 kb SmaI DNA fragment as a probe that encodes the ketosyntase domain in the fourth sorafen polyketide synthase module (see US patent 5716849). Five different hybridization patterns were discovered. One clone characteristic of each of the five schemes is selected and designated as pEPO15, pEPO20, pEPO30, pEPO31 and pEPO33, respectively.

Пример 4: Субклонирование BamHI-фрагментов из рЕРO15, рЕРO20, рЕРО30, рЕРО31 и рЕРО33Example 4: Subcloning of BamHI fragments from pEPO15, pEPO20, pEPO30, pEPO31 and pEPO33

ДНК пяти отобранных клонов Вас расщепляют с помощью BamHI и случайные фрагменты субклонируют в pBluescript II SK+ (фирма Stratagene) в сайте BamHI. Субклоны, несущие вставки размером от 2 до 10 т.п.н., отбирают для секвенирования фланкирующих концов вставок и также зондируют с помощью Smal-зонда размером 1,2 т.п.н., как описано выше. Субклоны, для которых обнаружен высокий уровень гомологии последовательности с известными поликетид-синтазами и/или высокий уровень гибридизации с доменом кетосинтазы сорафена, используют для экспериментов по разрушению гена.The DNA of the five selected clones is cleaved with BamHI and random fragments are subcloned into pBluescript II SK + (Stratagene) at the BamHI site. Subclones carrying inserts ranging in size from 2 to 10 kb are selected for sequencing of the flanking ends of the inserts and also probed with a 1.2 kb Smal probe as described above. Subclones for which a high level of sequence homology with known polyketide synthases and / or a high level of hybridization with the sorafen ketosynthase domain is found are used for gene disruption experiments.

Пример 5: Получение устойчивых к стрептомицину случайных мутантов штамма Sorangium cellulosum So ce90Example 5: Preparation of streptomycin-resistant random mutants of the strain Sorangium cellulosum So ce90

0,1 мл трехдневной культуры штамма Sorangium cellulosum So ce90, выращенного в жидкой среде (0,2% экстракта дрожжей, 0,2% обезжиренной соевой муки, 0,8% картофельного крахмала, 0,2% глюкозы, 0,1% MgSO4·7H2O, 0,1% CaCl2·2Н2О, 0,008% Fe-ЭДТК, рН до 7,4 с помощью КОН), сеют на агаровые пластинки со средой SolE, дополненной 100 мкг/мл стрептомицина. Пластинки инкубируют при 30°С в течение 2 недель. Колонии, выросшие на этой среде, представляют собой устойчивые к стрептомицину мутанты, которые высевают штрихом и повторно культивируют на этой же агаровой среде со стрептомицином для очистки. Отбирают один из этих устойчивых к стрептомицину мутант и обозначают как ВСЕ28/2.0.1 ml of a three-day culture of Sorangium cellulosum So ce90 strain grown in liquid medium (0.2% yeast extract, 0.2% fat-free soy flour, 0.8% potato starch, 0.2% glucose, 0.1% MgSO 4 · 7H 2 O, 0.1% CaCl 2 · 2H 2 O, 0.008% Fe-EDTA, pH up to 7.4 with KOH), seeded on agar plates with SolE medium supplemented with 100 μg / ml streptomycin. The plates are incubated at 30 ° C for 2 weeks. The colonies grown on this medium are streptomycin-resistant mutants that are streaked and re-cultured on the same agar medium with streptomycin for purification. One of these streptomycin-resistant mutants was selected and designated as ALL28 / 2.

Пример 6: Разрушение генов в Sorangium cellulosum BCE28/2 с использованием субклонированных BamHI-фрагментовExample 6: Disruption of genes in Sorangium cellulosum BCE28 / 2 using subcloned BamHI fragments

BamHI-вставки из субклонов, полученных, как описано выше, из пяти отобранных клонов Вас, выделяют и встраивают путем лидирования в уникальный сайт BamHI плазмиды рСIВ132 (см., патент US 5716849). Несущими вставки производными рСIВ132 трансформируют штамм Escherichia coli ED8767, содержащий хелперную плазмиду pUZ8 (Hedges и Matthew, Plasmid 2: 269-278 (1979). Трансформантов используют в качестве доноров в экспериментах по конъюгации, в которых в качестве реципиентов применяют Sorangium cellulosum BCE28/2. Для конъюгации 5-10×109 клеток Sorangium cellulosum BCE28/2 из культуры, находящейся на ранней стационарной фазе (при достижении концентрации примерно 5×108 клеток/мл), выращенной при 30°С в жидкой среде G51b (G51b соответствует среде G51t, в которой триптон заменен пептоном), смешивают при соотношении клеток 1:1 с культурой, находящейся на поздней логарифмической фазе (в жидкой среде LB), штамма Е.coli ED8767, содержащей производные рСIВ132, которые несут субклонированные BamHI-фрагменты и хелперную плазмиду pUZ8. Затем смешанные клетки центрифугируют при 4000 об/мин в течение 10 мин и ресуспендируют в 0,5 мл среды G51b. Затем эту клеточную суспензию вносят в виде капли в центр пластинки Sol Е-агаром, содержащим 50 мг/л канамицина. Собирают клетки, полученные после инкубации в течение 24 ч при 30°С, и ресуспендируют в 0,8 мл среды G51bd и 0,1-0,3 мл этой суспензии помещают на твердую среду для отбора SolE, которая содержит флеомицин (30 мг/л), стрептомицин (300 мг/л) и канамицин (50 мг/л). Встречная селекция штамма-донора Escherichia coli происходит при добавлении стрептомицина. Колонии, которые растут на этой среде для отбора после инкубации в течение 8-12 дней при температуре 30°С, выделяют с помощью пластиковой петли и сеют штрихом и культивируют на этой же агаровой среде для второго цикла отбора и очистки. Полученные из культур колонии, которые растут на этой агаровой среде для отбора после инкубации в течение 7 дней при температуре 30°С, представляют собой трансконъюгаты со штаммом Sorangium cellulosum BCE28/2, который имеет приобретенную устойчивость к флеомицину в результате переноса посредством конъюгации производных рСIВ132, несущих субклонированные BamHI-фрагменты.BamHI inserts from subclones obtained, as described above, from five selected You clones, are isolated and inserted by leading to the unique BamHI site of plasmid pCIB132 (see, US Pat. No. 5,716,849). The pCIB132 derivatives bearing the inserts transform the Escherichia coli strain ED8767 containing the helper plasmid pUZ8 (Hedges and Matthew, Plasmid 2: 269-278 (1979). Transformants are used as donors in conjugation experiments using Sorangium / cellulosum 2 2 recipients as recipients For conjugation of 5-10 × 10 9 Sorangium cellulosum BCE28 / 2 cells from a culture in the early stationary phase (at a concentration of approximately 5 × 10 8 cells / ml) grown at 30 ° C in G51b liquid medium (G51b corresponds to medium G51t, in which tryptone is replaced by peptone), mixed at a ratio and 1: 1 cells with a late logarithmic culture (in LB liquid medium) of E. coli strain ED8767 containing pCIB132 derivatives that carry subcloned BamHI fragments and helper plasmid pUZ8, then mixed cells are centrifuged at 4000 rpm for 10 min and resuspended in 0.5 ml of G51b medium.This cell suspension is then added dropwise to the center of the Sol plate with E-agar containing 50 mg / l kanamycin. The cells obtained after incubation for 24 hours at 30 ° C are collected and resuspended in 0.8 ml of G51bd medium and 0.1-0.3 ml of this suspension are placed on solid SolE selection medium that contains phleomycin (30 mg / l), streptomycin (300 mg / l) and kanamycin (50 mg / l). Counter-selection of the donor strain Escherichia coli occurs when streptomycin is added. Colonies that grow on this selection medium after incubation for 8-12 days at a temperature of 30 ° C are isolated using a plastic loop and streaked and cultured on the same agar medium for a second selection and purification cycle. Colonies obtained from cultures that grow on this agar medium for selection after incubation for 7 days at a temperature of 30 ° C are transconjugates with the strain Sorangium cellulosum BCE28 / 2, which has acquired resistance to phleomycin as a result of transfer through conjugation of pCIB132 derivatives, bearing subcloned BamHI fragments.

Интеграцию полученных из рСIВ132 плазмид в хромосому Sorangium cellulosum BCE28/2 путем гомологичной рекомбинации подтверждают Саузерн-гибридизацией. Для этого эксперимента выделяют полную ДНК их 5-10 трансконъюгатов на 1 перенесенный BamHI-фрагмент (из 10 мл культур, выращенных в среде G52-H в течение 3 дней), используя метод, описанный у Pospiech и Neumann, Trends Genet. 11:217 (1995). Для Саузерн-блоттинга выделенную, как описано выше, ДНК расщепляют с помощью рестриктаз BglII, ClaI или NotI и соответствующие BamHI-вставки или рСIВ132 используют в качестве меченных с помощью 32P зондов.The integration of plasmids obtained from pCIB132 into the Sorangium cellulosum BCE28 / 2 chromosome by homologous recombination is confirmed by Southern hybridization. For this experiment, the total DNA of their 5-10 transconjugates per 1 transferred BamHI fragment (from 10 ml of cultures grown in G52-H medium for 3 days) was isolated using the method described by Pospiech and Neumann, Trends Genet. 11: 217 (1995). For Southern blotting, the DNA isolated as described above was digested with BglII, ClaI or NotI restriction enzymes and the corresponding BamHI inserts or pCIB132 were used as 32 P-labeled probes.

Пример 7: Анализ воздействия интегрированных BamHI-фрагментов на производство эпотилона Sorangium cellulosum после разрушения генаExample 7: Analysis of the impact of integrated BamHI fragments on the production of Sorangium cellulosum epothilone after gene destruction

Клетки-трансконъюгаты, выращенные примерно на 1 см2 поверхности пластинок со средой для отбора SolE при втором цикле селекции (см. пример 6), переносят с помощью стерильной пластиковой петли в 10 мл среды G52-H в колбу Эрленмейера объемом 50 мл. После инкубации при 30°С и 180 об/мин в течение 3 дней культуру переносят в 50 мл среды G52-H в колбу Эрленмейера объемом 200 мл. После инкубации при 30°С и 180 об/мин в течение 4-5 дней 10 мл этой культуры переносят в 50 мл среды 23В3 (0,2% глюкозы, 2% картофельного крахмала, 1,6% обезжиренной соевой муки, 0,0008% Fe-ЭДТК, натриевая соль, 0,5% HEPES (4-(2-гидроксиэтил)пиперазин-1-этансульфоновая кислота), 2 об.% полистироловую смолу XAD16 (фирма Rohm и Haas), значение рН доведено до 7,8 с помощью NaOH) в колбу Эрленмейера объемом 200 мл.Transconjugate cells grown on about 1 cm 2 of the surface of the plates with SolE selection medium in the second selection cycle (see Example 6) are transferred using a sterile plastic loop in 10 ml of G52-H medium to a 50 ml Erlenmeyer flask. After incubation at 30 ° C and 180 rpm for 3 days, the culture is transferred into 50 ml of G52-H medium into a 200 ml Erlenmeyer flask. After incubation at 30 ° C and 180 rpm for 4-5 days, 10 ml of this culture is transferred to 50 ml of 23B3 medium (0.2% glucose, 2% potato starch, 1.6% fat-free soy flour, 0.0008 % Fe-EDTA, sodium salt, 0.5% HEPES (4- (2-hydroxyethyl) piperazine-1-ethanesulfonic acid), 2 vol.% XAD16 polystyrene resin (Rohm and Haas), pH adjusted to 7.8 using NaOH) into a 200 ml Erlenmeyer flask.

Количественное определение производства эпотилона проводят после инкубации культур при 30°С и 180 об/мин в течение 7 дней. Полный культуральный бульон фильтруют под вакуумом через найлоновый фильтр с размером пор 150 мкм. Оставшуюся на фильтре смолу затем ресуспендируют в 10 мл изопропанола и экстрагируют встряхиванием суспензии при 180 об/мин в течение 1 ч. Из этой суспензии отбирают 1 мл и центрифугируют при 12000 об/мин на микроцентрифуге Эппендорфа. Количество эпотилонов А и В в ней определяют с помощью ЖХВР и выявляют при 250 нм с помощью детектора типа UV-DAD (ЖХВР на колонке Waters-Symetry C18 и в градиенте 0,02%-ной фосфорной кислоты от 60% до 0% и ацетонитрила от 40% до 100%).Quantitative determination of the production of epothilone is carried out after incubation of cultures at 30 ° C and 180 rpm for 7 days. The complete culture broth is filtered under vacuum through a nylon filter with a pore size of 150 μm. The resin remaining on the filter is then resuspended in 10 ml of isopropanol and extracted by shaking the suspension at 180 rpm for 1 h. 1 ml is taken from this suspension and centrifuged at 12000 rpm on an Eppendorf microcentrifuge. The number of epothilones A and B in it is determined by HPLC and detected at 250 nm using a UV-DAD type detector (HPLC on a Waters-Symetry C18 column and in a gradient of 0.02% phosphoric acid from 60% to 0% and acetonitrile from 40% to 100%).

Трансконъюгаты с тремя различными интегрированными BamHI-фрагментами, субклонированные из рЕРO15, т.е. трансконъюгаты с BamHI-фрагментом плазмиды рЕРO15-21, трансконъюгаты с BamHI-фрагментом плазмиды рЕРO15-4-5 и трансконъюгаты с BamHI-фрагментом плазмиды рЕРO15-4-1, тестируют описанным выше методом. ЖХВР-анализ показал, что все трансконъюгаты уже не могли продуцировать эпотилон А или В. В противоположность этому эпотилон А и В обнаружены в концентрации 2-4 мг/л в трансконъюгатах с BamHI-фрагментами, полученными из рЕРO20, рЕРО30, рЕРО31, рЕРО33, в родительском штамме ВСЕ28/2.Transconjugates with three different integrated BamHI fragments, subcloned from pEPO15, i.e. transconjugates with a BamHI fragment of plasmid pEPO15-21, transconjugates with a BamHI fragment of plasmid pEPO15-4-5 and transconjugates with a BamHI fragment of plasmid pEPO15-4-1, are tested by the method described above. HPLC analysis showed that all transconjugates could no longer produce epothilone A or B. In contrast, epothilone A and B were found at a concentration of 2-4 mg / L in transconjugates with BamHI fragments obtained from pEPO20, pEPO30, pEPO31, pEPO33, in the parent strain ALL28 / 2.

Пример 8: Определение нуклеотидной последовательности клонированных фрагментов и конструирование наборов последовательностей фрагментовExample 8: Determination of the nucleotide sequence of cloned fragments and the construction of sets of sequences of fragments

А. BamHI-вставка плазмиды рЕРO15-21A. BamHI insert of plasmid pEPO15-21

Плазмидную ДНК выделяют из штамма Escherichia coli DH10B [рЕРO15-21] и определяют нуклеотидую последовательность BamHI-вставки размером 2.3 т.п.н. в рЕРO15-21. Автоматическое секвенирование ДНК осуществляют с использованием в качестве матрицы двухцепочечной ДНК методом на основе разрыва дидезоксинуклеотидной цепи с помощью секвенаторов Applied Biosystems, модель 377. Примененные праймеры представляют собой универсальный "обратный" праймер (5'-GGA AAC AGC TAT GAC CAT G-3' (SEQ ID NO:24)) и универсальный "прямой" праймер (5'-GTA AAA CGA CGG ССА GT-3' (SEQ ID NO:25)). В последующих циклах реакций секвенирования для удлинения и соединения наборов последовательностей фрагментов применяют синтезированные обычным образом олигонуклеотиды, сконструированные для 3'-концов ранее определенных последовательностей. Обе цепи секвенируют полностью и каждый нуклеотид секвенируют по меньшей мере дважды. Нуклеотидную последовательность компилируют с использованием программы Sequencher vers. 3.0 (фирма Gene Codes Corporation) и анализируют с помощью программ, разработанных генетической компьютерной группой университета штата Висконсин (University of Wisconsin Genetics Computer Group). Нуклеотидая последовательность вставки размером 2213 пар оснований соответствует нуклеотидам 20779-22991 SEQ ID NO:1.Plasmid DNA was isolated from Escherichia coli strain DH10B [pEPO15-21] and the nucleotide sequence of the BamHI insert of 2.3 kb was determined. in pERO15-21. Automatic DNA sequencing is carried out using a double-stranded DNA matrix as a method based on breaking the dideoxynucleotide chain using Sequencers Applied Biosystems, model 377. The primers used are a universal “reverse” primer (5'-GGA AAC AGC TAT GAC CAT G-3 '( SEQ ID NO: 24)) and a universal “direct” primer (5'-GTA AAA CGA CGG CCA GT-3 '(SEQ ID NO: 25)). In subsequent sequences of sequencing reactions, the oligonucleotides synthesized in the usual way designed for the 3 ′ ends of previously defined sequences are used to extend and join sets of fragment sequences. Both chains are fully sequenced and each nucleotide is sequenced at least twice. The nucleotide sequence is compiled using Sequencher vers. 3.0 (Gene Codes Corporation) and analyzed using programs developed by the University of Wisconsin's genetic computer group (University of Wisconsin Genetics Computer Group). The nucleotide sequence of the insert size of 2213 base pairs corresponds to nucleotides 20779-22991 SEQ ID NO: 1.

Б. BamHI-вставка плазмиды рЕРO15-4-1B. BamHI insert of plasmid pEPO15-4-1

Плазмидную ДНК выделяют из штамма Escherichia coli DH10B [рЕР015-4-1] и нуклеотидую последовательность BamHI-вставки размером 3,9 т.п.н. в рЕРO15-4-1 определяют, как описано выше в разделе (А). Нуклеотидная последовательность вставки размером 3909 пар оснований соответствует нуклеотидам 16876-20784 SEQ ID NO:1.Plasmid DNA was isolated from Escherichia coli strain DH10B [pEP015-4-1] and the nucleotide sequence of the BamHI insert 3.9 kbp. in pEPO15-4-1 is determined as described above in section (A). The nucleotide sequence of the insert size of 3909 base pairs corresponds to nucleotides 16876-20784 SEQ ID NO: 1.

В. BamHI-вставка плазмиды рЕРO15-4-5B. BamHI insert of plasmid pEPO15-4-5

Плазмидную ДНК выделяют из штамма Escherichia coli DH10B [рЕРO15-4-5] и нуклеотидную последовательность BamHI-вставки размером 2,3 т.п.н в рЕРO15-4-5 определяют, как описано выше в разделе (А). Нуклеотидная последовательность вставки размером 2233 пары оснований соответствует нуклеотидам 42528-44760 SEQ ID NO:1.Plasmid DNA was isolated from Escherichia coli strain DH10B [pEPO15-4-5] and the nucleotide sequence of the 2.3 kb BamHI insert in pEPO15-4-5 was determined as described above in section (A). The nucleotide sequence of the insert size of 2233 base pairs corresponds to nucleotides 42528-44760 SEQ ID NO: 1.

Пример 9: Субклонирование и определение расположения фрагментов ДНК плазмиды рЕРO15 содержащей гены биосинтеза эпотилонаExample 9: Subcloning and location of DNA fragments of plasmid pEPO15 containing epothilone biosynthesis genes

рЕРO15 полностью расщепляют с помощью рестриктазы HindIII и образовавшиеся фрагменты субклонируют в pBluescript II SK- или pNEB193 (фирма New England Biolabs), предварительно расщепленных с помощью HindIII и дефосфорилированных с помощью щелочной фосфатазы из кишки теленка. Получают 6 различных клонов, которые обозначают как pEPO15-NH1, рЕРO15-NH2, pEPO15-NH6, pEPO15-NH24 (основой всех является pNEB193) и рЕРO15-Н2.7 и рЕР015-Н3.0 (основой обоих является pBluescript II SK-).pEPO15 was completely digested with HindIII restriction enzyme and the resulting fragments were subcloned into pBluescript II SK- or pNEB193 (New England Biolabs), previously digested with HindIII and dephosphorylated with alkaline phosphatase from the calf intestine. Get 6 different clones, which are designated as pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24 (the basis of all is pNEB193) and pEPO15-H2.7 and pEP015-H3.0 (the basis of both is pBluescript II SK-) .

BamHI-вставку рЕРO15-21 выделяют и метят с помощью DIG (система нерадиоактивного мечения и определения ДНК фирмы Boehringer Mannheim), и используют в качестве зонда в экспериментах по гибридизации ДНК в строгих условиях с pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, рЕРO15-Н2.7 и рЕРO15-Н3.0. Сильный сигнал гибридизации обнаружен для pEPO15-NH24, что свидетельствует о том, что рЕРO15-21 содержится внутри pEPO15-NH24.The pERO15-21 BamHI insert was isolated and labeled with DIG (Boehringer Mannheim non-radioactive labeling and DNA detection system) and used as a probe in DNA hybridization experiments under stringent conditions with pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15-H2.7 and pEPO15-H3.0. A strong hybridization signal was detected for pEPO15-NH24, indicating that pEPO15-21 is contained within pEPO15-NH24.

BamHI-вставку рЕРO15-4-1 выделяют и метят с помощью DIG, как описано выше, и используют в качестве зонда в экспериментах по гибридизации ДНК в строгих условиях с pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, рЕРO15-NH24, рЕРO15-Н2.7 и рЕРO15-Н3.0. Сильные сигналы гибридизации обнаружены для pEPO15-NH24 и рЕРO15-Н2.7. Данные о нуклеотидной последовательности, полученные для одного из концов каждого клона pEPO15-NH24 и рЕРO15-Н2.7, также полностью согласуются с данными о строении ранее определенной последовательности BamHI-вставки рЕРO15-4-1. Эти эксперименты свидетельствуют о том, что рЕРO15-4-1 (который содержит один внутренний сайт HindIII) перекрывает рЕРO15-Н2.7 и pEPO15-NH24 и что рЕРO15-Н2.7 и pEPO15-NH24 по расположению являются смежными.The bamHI insert pEPO15-4-1 was isolated and labeled with DIG as described above, and used as a probe in DNA hybridization experiments under stringent conditions with pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15 -H2.7 and pERO15-H3.0. Strong hybridization signals were detected for pEPO15-NH24 and pEPO15-H2.7. The nucleotide sequence data obtained for one of the ends of each clone pEPO15-NH24 and pEPO15-H2.7 are also completely consistent with the data on the structure of the previously determined sequence of the BamHI insert pEPO15-4-1. These experiments indicate that pEPO15-4-1 (which contains one internal HindIII site) overlaps pEPO15-H2.7 and pEPO15-NH24 and that pEPO15-H2.7 and pEPO15-NH24 are adjacent in location.

BamHI-вставку рЕРO15-4-5 выделяют и метят с помощью DIG, как описано выше, и используют в качестве зонда в экспериментах по гибридизации ДНК в строгих условиях с pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, рЕРO15-Н2.7 и рЕРO15-Н3.0. Сильный сигнал гибридизации обнаружен для pEPO15-NH2, что свидетельствует о том, что рЕРO15-21 содержится внутри pEPO15-NH2.The bamHI insert pEPO15-4-5 was isolated and labeled with DIG as described above, and used as a probe in DNA hybridization experiments under stringent conditions with pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15 -H2.7 and pERO15-H3.0. A strong hybridization signal was detected for pEPO15-NH2, indicating that pEPO15-21 is contained within pEPO15-NH2.

Данные о нуклеотидной последовательности получают для обоих концов pEPO15-NH2 и для конца pEPO15-NH24, который не перекрывается рЕРO15-4-1. На основе этих последовательностей создают ПЦР-праймеры, т.е. "В" для NH24-конца: GTGACTGGCGCCTGGAATCTGCATGAGC (SEQ ID NO:26), "А" для NH2-конца: AGCGGGAGCTTGCTAGACATTCTGTTTC (SEQ ID NO:27), и "В" для NH2-конца: GACGCGCCTCGGGCAGCGCCCCAA (SEQ ID NO:28), обозначенные относительно сайтов HindIII, и применяют в реакциях амплификации с использованием рЕРO15, а в других экспериментах с использованием геномной ДНК Sorangium cellulosum So ce90 в качестве матриц. Специфическая амплификация обнаружена при использовании пары праймеров "В" для NH24-конца и "А" для NH2-конца с обеими матрицами. Полученные в результате амплификации фрагменты (амплимеры) клонируют в pBluescript II SK- и полностью секвенируют. Последовательности амплифицированных фрагментов являются идентичными и также полностью соответствуют концам последовательностей pEPO15-NH24 и pEPO15-NH2, слитых с сайтом HindIII, что свидетельствует о том, что HindIII-фрагменты pEPO15-NH2 и pEPO15-NH24 по своему расположению являются смежными.Nucleotide sequence data is obtained for both ends of pEPO15-NH2 and for the end of pEPO15-NH24, which does not overlap pEPO15-4-1. Based on these sequences, PCR primers are created, i.e. “B” for the NH24 end: GTGACTGGCGCCTGGAATCTGCATGAGC (SEQ ID NO: 26), “A” for the NH2 end: AGCGGGAGCTTGCTAGACATTCTGTTTC (SEQ ID NO: 27), and “B” for the NH2 end: GACGCGCCCGGGA 28CCA GCCA ), designated relative to HindIII sites, and are used in amplification reactions using pEPO15, and in other experiments using Sorangium cellulosum So ce90 genomic DNA as matrices. Specific amplification was detected using a pair of primers “B” for the NH24 end and “A” for the NH2 end with both matrices. The amplification fragments (amplimers) are cloned into pBluescript II SK- and completely sequenced. The sequences of the amplified fragments are identical and also fully correspond to the ends of the sequences pEPO15-NH24 and pEPO15-NH2 fused to the HindIII site, which indicates that the HindIII fragments of pEPO15-NH2 and pEPO15-NH24 are adjacent in their arrangement.

HmdIII-вставку рЕРO15-Н2.7 вьщеляют и метят с помощью DIG, как описано выше, и используют в качестве зонда в экспериментах по гибридизации ДНК в строгих условиях с рЕР015, расщепленном с помощью NotI. Для NotI-фрагмента размером примерно 9 т.п.н. выявлена сильная гибридизация и его затем субклонируют в pBluescript II SK-, предварительно расщепленном с помощью NotI и дефосфорилированном с помощью щелочной фосфатазы из кишки теленка, получая pEPO15-N9-16. NotI-вставку pEPO15-N9-16 выделяют и метят с помощью DIG, как описано выше, и используют в качестве зонда в экспериментах по гибридизации ДНК в строгих условиях с pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, рЕРO15-Н2.7 и рЕРO15-Н3.0. Сильные сигналы гибридизации обнаружены для pEPO15-NH6, а также, как это и ожидалось, для клонов рЕРO15-Н2.7 и pEPO15-NH24. Данные о нуклеотидной последовательности получают для обоих концов pEPO15-NH6 и для конца рЕРO15-Н2.7, который не перекрывается рЕРO15-4-1. Конструируют ПЦР-праймеры, обозначенные относительно сайтов HindIII, и применяют для реакций амплификации с использованием рЕРO15, а в других экспериментах с использованием геномной ДНК Sorangium cellulosum So ce90 в качестве матриц. Специфическая амплификация обнаружена при использовании пары праймеров "В" для pEPO15-NH6-конца: CACCGAAGCGTCGATCTGGTCCATC (SEQ ID NO:29) и "А" для рЕРO15-Н2.7-конца: CGGTCAGATCGACGACGGGCTTTCC (SEQ ID NO:30) с обеими матрицами. Амплифицированные фрагменты клонируют в Bluescript II SK- и полностью секвенируют. Последовательности амплифицированных фрагментов являются идентичными и также полностью соответствуют концам последовательностей pEPO15-NH6 и рЕРO15-Н2.7, слитых с сайтом HindIII, что свидетельствует о том, что HindIII-фрагменты pEPO15-NH6 и рЕРO15-Н2.7 по своему расположению являются смежными.The HmdIII insert of pEPO15-H2.7 was incubated and labeled with DIG as described above and used as a probe in DNA hybridization experiments under stringent conditions with pEP015 digested with NotI. For a NotI fragment of approximately 9 kbp strong hybridization was detected and then subcloned into pBluescript II SK-, previously cleaved with NotI and dephosphorylated with alkaline phosphatase from the calf intestine, obtaining pEPO15-N9-16. The NotI insert pEPO15-N9-16 was isolated and labeled with DIG as described above and used as a probe in DNA hybridization experiments under stringent conditions with pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15 -H2.7 and pERO15-H3.0. Strong hybridization signals were detected for pEPO15-NH6, and also, as expected, for the clones pEPO15-H2.7 and pEPO15-NH24. Nucleotide sequence data is obtained for both ends of pEPO15-NH6 and for the end of pEPO15-H2.7, which does not overlap pEPO15-4-1. The PCR primers designated relative to the HindIII sites were constructed and used for amplification reactions using pEPO15, and in other experiments using Sorangium cellulosum So ce90 genomic DNA as templates. Specific amplification was detected using a pair of primers “B” for the pEPO15-NH6 end: CACCGAAGCGTCGATCTGGTCCATC (SEQ ID NO: 29) and “A” for the pEPO15-H2.7 end: CGGTCAGATCGACGACGGGCCTTTCC (SEQ ID NO: 30). Amplified fragments are cloned into Bluescript II SK and completely sequenced. The sequences of the amplified fragments are identical and also fully correspond to the ends of the sequences pEPO15-NH6 and pEPO15-H2.7 fused to the HindIII site, which indicates that the HindIII fragments of pEPO15-NH6 and pEPO15-H2.7 are adjacent in their arrangement.

Все эти эксперименты, взятые вместе, позволяют определить набор последовательностей HindIII-фрагментов, перекрывающий область размером примерно 55 т.п.н. и состоящий из HindIII-вставок pEPO15-NH6, рЕРO15-Н2.7, pEPO15-NH24 и pEPO15-NH2, расположенных в указанном порядке. Установлено, что вставки двух оставшихся HindIII-субклонов, т.е. pEPO15-NH1 и рЕРO15-Н3.0, не являются частями этого набора последовательностей фрагментов.All these experiments, taken together, allow us to determine the set of sequences of HindIII fragments, covering an area of approximately 55 kbp. and consisting of HindIII inserts pEPO15-NH6, pEPO15-H2.7, pEPO15-NH24 and pEPO15-NH2 arranged in this order. The inserts of the two remaining HindIII subclones, i.e. pEPO15-NH1 and pEPO15-H3.0 are not part of this set of fragment sequences.

Пример 10: Дополнительное удлинение субклона набора последовательностей фрагментов, перекрывающего гены биосинтеза эпотилонаExample 10: Additional lengthening of the subclone of the set of sequence of fragments that overlap the genes of epothilone biosynthesis

BamHI - HindIII-фрагмент, полученный из расположенного по ходу транскрипции конца вставки pEPO15-NH2 и, таким образом, представляющий собой расположенный по ходу транскрипции конец субклона набора последовательностей фрагментов, описанного в примере 9, выделяют, метят с помощью DIG и используют в экспериментах по Саузерн-гибридизации с ДНК рЕРO15 и pEPO15-NH2, расщепленными с помощью нескольких ферментов. Во всех случаях сильно гибридизующиеся полосы имеют одинаковый размер для двух ДНК-мишеней, что свидетельствует о том, что фрагмент геномной ДНК Sorangium cellulosum So ce90, клонированный в рЕРO15, заканчивается сайтом HindIII на расположенном по ходу транскрипции конце pEPO15-NH2.BamHI - HindIII fragment obtained from the transcriptional end of the pEPO15-NH2 insert and, thus, representing the transcriptional end of the subclone of the sequence of fragments described in Example 9, isolated, labeled with DIG and used in experiments on Southern hybridization with pEPO15 and pEPO15-NH2 DNA digested with several enzymes. In all cases, strongly hybridizing bands have the same size for two target DNAs, which indicates that the Sorangium cellulosum So ce90 genomic DNA fragment cloned into pEPO15 ends with the HindIII site at the transcriptional end of pEPO15-NH2.

С помощью обычных процедур создают космидную библиотеку ДНК Sorangium cellulosum So ce90 в pScosTriplex-II (Ji и др., Genomics 31: 185-192 (1996)). Вкратце метод состоит в следующем: высокомолекулярную геномную ДНК Sorangium cellulosum So ce90 частично расщепляют с помощью рестриктазы Sau3AI, получая фрагменты со средним размером примерно 40 т.п.н., и встраивают путем лигирования в расщепленную с помощью BamHI и XbaI плазмиду pScosTriplex-II. Смесь для лигирования упаковывают в Gigapack III XL (фирма Stratagene) и применяют для трансфекции клеток Е.coli XL1 Blue MR.Using conventional procedures, a cosmid DNA library of Sorangium cellulosum So ce90 is created in pScosTriplex-II (Ji et al., Genomics 31: 185-192 (1996)). Briefly, the method consists in the following: the high molecular weight genomic DNA of Sorangium cellulosum So ce90 is partially digested with the restriction enzyme Sau3AI to obtain fragments with an average size of about 40 kb and inserted by ligation into the pScosTriplex-II plasmid digested with BamHI and XbaI. The ligation mixture was packaged in Gigapack III XL (Stratagene) and used to transfect E. coli XL1 Blue MR cells.

Космидную библиотеку подвергают скринингу с использованием BamHI-HindIII-фрагмента размером примерно 2,2 т.п.н., полученного из расположенного по ходу транскрипции конца pEPO15-NH2-вставки, в качестве зонда для гибридизации колонии. Отбирают клон, для которого обнаружен сильный сигнал гибридизации, обозначенный как рЕРO4Е7.The cosmid library was screened using a BamHI-HindIII fragment of approximately 2.2 kbp obtained from the downstream end of the pEPO15-NH2 insert as a colony hybridization probe. A clone was selected for which a strong hybridization signal, designated pEPO4E7, was detected.

ДНК клона рЕРO4Е7 выделяют, расщепляют с помощью рестриктаз и зондируют в экспериментах по Саузерн-гибридизации с помощью BamHI-HindIII-фрагмента размером 2,2 т.п.н. Отбирают Notl-фрагмент размером 9 т.п.н., для которого обнаружен сильный сигнал гибридизации, и субклонируют в pBluescript II SK-, получая pEPO4E7-N9-8. Дополнительные эксперименты с использованием Саузерн-гибридизации свидетельствуют о том, что Notl-вставка размером примерно 9 т.п.н. pEPO4E7-N9-8 перекрывает NotI - HindIII-фрагмент длиной свыше 6 т.п.н. pEPO15-NH2, в то время как оставшийся HindIII - NotI-фрагмент размером примерно 3 т.п.н., как ожидается, должен перекрывать субклон набора последовательностей фрагментов, описанный в примере 9. Однако окончательное секвенирование показало, что расположенная по ходу транскрипции рЕРO4Е7-N9-8-вставка содержит BamHI - NotI-полилинкер pScosTriplex-II, что свидетельствует о том, что геномная ДНК-вставка рЕР04Е7 заканчивается в сайге Sau3AI внутри удлиняющего HindIII - NotI-фрагмента и что сайт NotI происходит из pScosTriplex-II.The pEPO4E7 clone DNA was isolated, digested with restriction enzymes and probed in a Southern hybridization experiment using a 2.2 kb BamHI-HindIII fragment. A 9 kb Notl fragment was selected for which a strong hybridization signal was detected, and subcloned into pBluescript II SK- to give pEPO4E7-N9-8. Additional experiments using Southern hybridization indicate that the Notl insert is approximately 9 kb in size. pEPO4E7-N9-8 overlaps the NotI - HindIII fragment with a length of over 6 kb. pEPO15-NH2, while the remaining HindIII - NotI fragment of approximately 3 kbp was expected to overlap the subclone of the sequence of fragments described in Example 9. However, the final sequencing showed that pEPO4E7 located along the transcription The -N9-8 insert contains a BamHI-NotI-polylinker pScosTriplex-II, which indicates that the pEP04E7 genomic DNA insert ends in the Sau3AI saiga inside the HindIII-NotI extension fragment and that the NotI site is derived from pScosTriplex-II.

PstI - SalI-фрагмент размером примерно 1,6 т.п.н., происходящий из удлиняющего HindIII - NotI - подфрагмента размером примерно 3 т.п.н. pEPO4E7-N9-8, который содержит только происходящие из Sorangium cellulosum So ce90 последовательности без вектора, применяют в качестве зонда для библиотеки бактериальной искусственной хромосомы, описанной в примере 2. Помимо ранее выделенного клона ЕРO15, обнаружено, что клон Вас, обозначенный как ЕРO32, сильно гибридизуется с зондом. рЕРO32 выделяют, расщепляют с использованием нескольких рестриктаз и подвергают гибридизации с PstI - SalI - зондом размером примерно 1,6 т.п.н. Обнаружено, что HindIII - EcoRV-фрагмент размером примерно 13 т.п.н. дает сильный сигнал гибридизации с зондом и его субклонируют в pBluescript II SK-, расщепленном с помощью HindIII и Hindi, получая pEPO32-HEV15.PstI is a SalI fragment of about 1.6 kb in size, derived from an extension of HindIII - NotI is a subfragment of about 3 kb. pEPO4E7-N9-8, which contains only sequences without a vector derived from Sorangium cellulosum So ce90, is used as a probe for the bacterial artificial chromosome library described in Example 2. In addition to the previously isolated clone EPO15, it was found that you clone designated EPO32 hybridizes strongly with the probe. pEPO32 is isolated, digested using several restriction enzymes and hybridized with a PstI-SalI probe of approximately 1.6 kbp. HindIII was found to be an EcoRV fragment of approximately 13 kbp. gives a strong hybridization signal to the probe and is subcloned into pBluescript II SK-, digested with HindIII and Hindi to give pEPO32-HEV15.

Конструируют олигонуклеотидные праймеры, основываясь на расположенной по ходу транскрипции концевой последовательности pEPO15-NH2 и на расположенной против хода транскрипции (HindIII) концевой последовательности, полученной из pEPO32-HEV15, и используют их в реакциях секвенирования с pEPO4E7-N9-8 в качестве матрицы. Последовательности позволяют обнаружить присутствие небольшого HindIII-фрагмента (ЕРO4Е7-Н0.02) размером 24 пары оснований, который не мог быть обнаружен с помощью стандартных рестрикционных анализов, отделяющего сайт HindIII на расположенном по ходу транскрипции конце pEPO15-NH2 от сайта HindIII на расположенном против хода транскрипции конце pEPO32-HEV15.Oligonucleotide primers are constructed based on the transposed pEPO15-NH2 end sequence and the upstream transcriptional (HindIII) end sequence obtained from pEPO32-HEV15 and used in sequencing reactions with pEPO4E7-N9-8 as a template. The sequences make it possible to detect the presence of a small HindIII fragment (EPO4E7-H0.02) of 24 base pairs, which could not be detected using standard restriction assays separating the HindIII site at the upstream end of pEPO15-NH2 from the HindIII site at the opposite end transcription end pEPO32-HEV15.

Таким образом, субклон набора последовательностей фрагментов, описанный в примере 9, удлиняют, включая HindIII-фрагмент ЕРO4Е7-Н0.02 и рЕРO32-НЕV15-вставку, в результате чего он содержит вставки: pEPO15-NH6, рЕРO15-Н2.7, pEPO15-NH24, pEPO15-NH2, ЕРO4Е7-Н0.02 и pEPO32-HEV15, расположенные в указанном порядке.Thus, the subclone of the sequence of fragments described in Example 9 is extended, including the HindIII fragment of EPO4E7-H0.02 and the pEPO32-HEV15 insert, as a result of which it contains the inserts: pEPO15-NH6, pEPO15-H2.7, pEPO15- NH24, pEPO15-NH2, EPO4E7-H0.02 and pEPO32-HEV15, arranged in this order.

Пример 11: Определение нуклеотидной последовательности субклона набора последовательностей фрагментов, перекрывающего гены биосинтеза эпотилонаExample 11: Determination of the nucleotide sequence of a subclone of a set of fragment sequences that overlap the epothilone biosynthesis genes

Нуклеотидные последовательности субклона набора последовательностей фрагментов, описанного в примере 10, определяют следующим образом:The nucleotide sequences of the subclone of the sequence of fragments described in example 10 are determined as follows:

рЕРO15-Н2.7. Плазмидную ДНК выделяют из штамма Escherichia coli DH10B [рЕРO15-Н2.7] и определяют нуклеотидную последовательность BamHI-вставки в рЕРO15-Н2.7 размером 2,7 т.п.н. Автоматическое секвенирование ДНК осуществляют с использованием в качестве матрицы двухцепочечной ДНК методом на основе разрыва дидезоксинуклеотидной цепи с помощью секвенаторов Applied Biosystems, модель 377. Примененные праймеры представляют собой универсальный "обратный" праймер (5'-GGA ААС AGC TAT GAC CAT G-3' (SEQ ID NO:24)) и универсальный "прямой" праймер (5'-GTA ААА CGA CGG ССА GT-3' (SEQ ID NO:25)). В последующих циклах реакций секвенирования для удлинения и соединения наборов последовательностей фрагментов применяют синтезированные обычным образом олигонуклеотиды, сконструированные для 3'-концов ранее определенных последовательностей.pEPO15-H2.7. Plasmid DNA was isolated from the Escherichia coli strain DH10B [pEPO15-H2.7] and the nucleotide sequence of the BamHI insert in pEPO15-H2.7 of 2.7 kb was determined. Automatic DNA sequencing is carried out using a double-stranded DNA matrix as a method based on breaking the dideoxynucleotide chain using Sequencers Applied Biosystems, model 377. The primers used are a universal “reverse” primer (5'-GGA AAC AGC TAT GAC CAT G-3 '( SEQ ID NO: 24)) and a universal “direct” primer (5'-GTA AAA CGA CGG CCA GT-3 '(SEQ ID NO: 25)). In subsequent sequences of sequencing reactions, the oligonucleotides synthesized in the usual way designed for the 3 ′ ends of previously defined sequences are used to extend and join sets of fragment sequences.

pEPO15-NH6, pEPO15-NH24 и pEPO15-NH2. HmdIII - вставки этих плазмид выделяют и подвергают случайной фрагментации, используя устройство типа Hydroshear (фирма Genomic Instrumentation Services, Inc.), получая фрагменты, средний размер которых составляет 1-2 т.п.н. Репарируют концы фрагментов, используя ДНК-полимеразу фага Т4 и ДНК-полимеразу Кленова в присутствии дезоксинуклеотидтрифосфатов и фосфорилируют с помощью ДНК-киназы фага Т4 в присутствии рибо-АТФ. Фрагменты размером от 1,5 до 2,2 т.п.н. выделяют из агарозных гелей и встраивают путем лигирования в вектор pBluescript II SK-, предварительно расщепленный с помощью EcoRV и дефосфорилированный. Произвольные субклоны секвенируют, используя универсальный "обратный" и универсальный "прямой" праймеры.pEPO15-NH6, pEPO15-NH24 and pEPO15-NH2. HmdIII - inserts of these plasmids are isolated and randomly fragmented using a Hydroshear device (Genomic Instrumentation Services, Inc.) to obtain fragments with an average size of 1-2 kb. The ends of the fragments are repaired using T4 phage DNA polymerase and Klenov DNA polymerase in the presence of deoxynucleotide triphosphates and phosphorylated using T4 phage DNA kinase in the presence of ribo-ATP. Fragments ranging in size from 1.5 to 2.2 kb isolated from agarose gels and inserted by ligation into the pBluescript II SK- vector, pre-digested with EcoRV and dephosphorylated. Arbitrary subclones are sequenced using universal “reverse” and universal “forward” primers.

pEPO32-HEV15. pEPO32-HEV15 расщепляют с помощью HindIII и SspI и выделяют фрагмент размером примерно 13,3 т.п.н., который содержит HindIII - EcoRV - вставку из So. cellulosum So се90 размером ~13 т.п.н., и Hindi - SspI - фрагмент из pBluescript II SK- размером 0,3 т.п.н. и частично расщепляют с помощью HaeIII, получая фрагменты, средний размер которых составляют 1-2 т.п.н. Фрагменты размером 1,5-2,2 т.п.н. выделяют из агарозных гелей и встраивают путем лигирования в вектор Bluescript II SK-, предварительно расщепленный с помощью EcoRV и десфорилированный. Произвольные субклоны секвенируют, используя универсальный "обратный" и универсальный "прямой" праймеры.pEPO32-HEV15. pEPO32-HEV15 was digested with HindIII and SspI and a fragment of approximately 13.3 kbp was isolated which contains the HindIII - EcoRV insert from So. cellulosum So ce90 ~ 13 kbp, and Hindi - SspI - a fragment from pBluescript II SK - 0.3 kbp. and partially digested with HaeIII to give fragments whose average size is 1-2 kb. Fragments of 1.5-2.2 kbp isolated from agarose gels and inserted by ligation into the Bluescript II SK- vector, pre-digested with EcoRV and desforylated. Arbitrary subclones are sequenced using universal “reverse” and universal “forward” primers.

Хроматограммы анализируют и объединяют в наборы последовательностей фрагментов с помощью программ Phred, Phrap и Consed (Ewing и др., Genome Res. 8(3); 175-185 (1998); Ewing и др., Genome Res. 8(3): 186-194 (1998); Gordon и др., Genome Res. 8(3): 195-202 (1998)). Бреши в наборах последовательностей фрагментов заполняют, имеющие противоречие последовательности расщепляют и области, для которых получены недостаточно надежные данные, повторно секвенируют, используя сконструированные обычным образом олигонуклеотидные праймеры для секвенирования либо исходных субклонов, либо клонов, выбранных из случайных библиотек субклонов. Обе цепи полностью секвенируют и каждую пару оснований характеризуют по крайней мере минимальным обобщенным баллом Фреда (Phred), равным 40 (уровень значимости 99,99%).Chromatograms are analyzed and combined into sets of fragment sequences using the programs Phred, Phrap and Consed (Ewing et al., Genome Res. 8 (3); 175-185 (1998); Ewing et al., Genome Res. 8 (3): 186-194 (1998); Gordon et al., Genome Res. 8 (3): 195-202 (1998)). Gaps in the sets of sequences of fragments are filled, conflicting sequences are split, and regions for which insufficiently reliable data are obtained are re-sequenced using oligonucleotide primers designed in the usual way for sequencing either the original subclones or clones selected from random subclone libraries. Both chains are completely sequenced and each base pair is characterized by at least a minimum generalized Fred score of Phred equal to 40 (significance level 99.99%).

Нуклеотидная последовательность набора последовательностей фрагментов размером 68750 пар оснований представлена в SEQ ID NO:1.The nucleotide sequence of the sequence sequence of fragments of 68,750 base pairs is presented in SEQ ID NO: 1.

Пример 12: Анализ нуклеотидной последовательности генов биосинтеза эпотилонаExample 12: Analysis of the nucleotide sequence of the epothilone biosynthesis genes

Установлено, что SEQ ID NO:1 содержит 22 ORF, что подробно представлено ниже в таблице 1:It is established that SEQ ID NO: 1 contains 22 ORF, which is presented in detail below in table 1:

Таблица 1Table 1 ORFORF Стартовый кодонStart codon Стоп-кодонStop codon Гомология выведенного протеинаHomology derived protein Предполагаемая функция выведенного протеинаEstimated Protein Function Orf1Orf1 вне секвенированного диапазонаout of sequence range 18261826 orf2*orf2 * 31713171 19001900 Гипотетический протеин SP: Q11037; DD-пептидаза SP: P15555Hypothetical protein SP: Q11037; DD peptidase SP: P15555 orf3orf3 34153415 55565556 Na/H антипортер PID: D1017724Na / H Antiporter PID: D1017724 транспортtransport orf4*orf4 * 59925992 56125612 orf5orf5 62266226 66756675 epoAepoA 76107610 1187511875 поликетид-синтаза типа Ipolyketide synthase type I Эпотилон-синтаза: формирование тиазольного кольцаEpothilone synthase: thiazole ring formation epoPepoP 1187211872 1610416104 нерибосомная кислота-аминокислота-лигазаnon-ribosomal acid-amino acid ligase Эпотилон-синтаза: формирование тиазольного кольцаEpothilone synthase: thiazole ring formation epoBepoB 1625116251 2174921749 поликетид-синтаза типа Ipolyketide synthase type I Эпотилон-синтаза: формирование каркаса поликетидаEpothilone synthase: polyketide scaffold formation epoCepoC 2174621746 4351943519 поликетид-синтаза типа Ipolyketide synthase type I Эпотилон - синтаза: формирование каркаса поликетидаEpothilone synthase: polyketide scaffold formation epoDepoD 4352443524 5492054920 поликетид-синтаза типа Ipolyketide synthase type I Эпотилон-синтаза: формирование каркаса поликетидаEpothilone synthase: polyketide scaffold formation epoEepoE 5493554935 6225462254 поликетид-синтаза типа Ipolyketide synthase type I Эпотилон-синтаза: формирование каркаса поликетидаEpothilone synthase: polyketide scaffold formation epoFepoF 6236962369 6362863628 цитохром Р450cytochrome P450 Эпотилон-макролактооксидазаEpothilone Macrolactic Oxidase orf6orf6 6377963779 6433364333 orf7*orf7 * 6429064290 6385363853 orf8orf8 6436364363 6492064920

ORFORF Стартовый кодонStart codon Стоп-кодонStop codon Гомология выведенного протеинаHomology derived protein Предполагаемая функция выведенного протеинаEstimated Derived Protein Function orf9*orf9 * 6472764727 6428764287 orf10orf10 6506365063 6576765767 orf11*orf11 * 6587465874 6500865008 orf12*orf12 * 6633866338 6587165871 orf13orf13 6666766667 6713767137 orf14orf14 6733467334 6825168251 гипотетический протеин GI: 3293544; протеин системы выхода катионов GI: 2623026hypothetical protein GI: 3293544; cation exit system protein GI: 2623026 транспортtransport orf15orf15 6834668346 вне секвенированного диапазонаout of sequence range * На цепи обратной комплементарной. Нумерация согласно SEQ ID NO:1.* On the reverse circuit complementary. Numbering according to SEQ ID NO: 1.

ероА (нуклеотиды 7610-11875 SEQ ID NO:1) кодирует EPOS A (SEQ ID NO:2), поликетид-синтазу типа I, состоящую из одного модуля и несущую следующие домены: β-кетоацилсинтазы (KS) (нуклеотиды 7643-8920 SEQ ID NO:1, аминокислоты 11-437 SEQ ID NO:2); ацилтрансферазы (AT) (нуклеотиды 9236-10201 SEQ ID NO:1, аминокислоты 543-864 SEQ ID NO:2); еноилредуктазы (ER) (нуклеотиды 10529-11428 SEQ ID NO:1, аминокислоты 974-1273 SEQ ID NO:2) и домен, гомологичный домену протеина-носителя ацила (АСР) (нуклеотиды 11549-11764 SEQ ID NO:1, аминокислоты 1314-1385 SEQ ID NO:2). Сравнение последовательностей и анализ мотивов (Haydock и др. FEBS Lett.374: 246-248 (1995); Tang и др., Gene 216: 255-265 (1998)) свидетельствует о том, что AT, кодируемая EPOS А, является малонил-СоА-специфичной. EPOS A должна быть включена в инициацию биосинтеза эпотилона путем введения ацетатного звена в многоферментный комплекс, который должен в конце концов образовать часть 2-метилтиазольного кольца (С26 и С20).eroA (nucleotides 7610-11875 SEQ ID NO: 1) encodes EPOS A (SEQ ID NO: 2), a type I polyketide synthase consisting of one module and bearing the following domains: β-ketoacyl synthase (KS) (nucleotides 7643-8920 SEQ ID NO: 1, amino acids 11-437 SEQ ID NO: 2); acyltransferases (AT) (nucleotides 9236-10201 SEQ ID NO: 1, amino acids 543-864 SEQ ID NO: 2); enoyl reductases (ER) (nucleotides 10529-11428 SEQ ID NO: 1, amino acids 974-1273 SEQ ID NO: 2) and a domain homologous to the domain of the acyl carrier protein (ACP) (nucleotides 11549-11764 SEQ ID NO: 1, amino acids 1314 -1385 SEQ ID NO: 2). Comparison of sequences and analysis of motifs (Haydock et al. FEBS Lett. 374: 246-248 (1995); Tang et al., Gene 216: 255-265 (1998)) suggests that AT encoded by EPOS A is malonyl -COA-specific. EPOS A should be included in the initiation of epothilone biosynthesis by introducing an acetate unit into the multienzyme complex, which should eventually form part of the 2-methylthiazole ring (C26 and C20).

ероР (нуклеотиды 11872-16104 SEQ ID NO:1) кодирует EPOS P (SEQ ID NO:3), нерибосомную кислота-аминокислота-лигазу, содержащую один модуль. EPOS P несет следующие домены:epop (nucleotides 11872-16104 SEQ ID NO: 1) encodes EPOS P (SEQ ID NO: 3), a non-ribosomal acid-amino acid ligase containing one module. EPOS P carries the following domains:

- домен образования пептидной связи, соответствующий мотиву К (аминокислоты 72-81 [FPLTDIQESY] SEQ ID NO:3, соответствующие нуклеотидам 12085-12114 SEQ ID NO:1); мотиву L (аминокислоты 118-125 [VVARHDML] SEQ ID NO:3, соответствующие нуклеотидам 12223-12246 SEQ ID NO:1); мотиву М (аминокислоты 199-212 [SIDLINVDLGSLSI] SEQ ID NO:3, соответствующие нуклеотидам 12466-12507 SEQ ID NO:1), и мотиву О (аминокислоты 353-363 [GDFTSMVLLDI] SEQ ID NO:3, соответствующие нуклеотидам 12928-12960 SEQ ID NO:1);- peptide bond formation domain corresponding to motive K (amino acids 72-81 [FPLTDIQESY] SEQ ID NO: 3, corresponding to nucleotides 12085-12114 SEQ ID NO: 1); L motif (amino acids 118-125 [VVARHDML] SEQ ID NO: 3, corresponding to nucleotides 12223-12246 SEQ ID NO: 1); motive M (amino acids 199-212 [SIDLINVDLGSLSI] SEQ ID NO: 3, corresponding to nucleotides 12466-12507 SEQ ID NO: 1), and motive O (amino acids 353-363 [GDFTSMVLLDI] SEQ ID NO: 3, corresponding to nucleotides 12928-12960 SEQ ID NO: 1);

- домен образования аминоациладенилата, соответствующий мотиву А (аминокислоты 549-565 [LTYEELSRRSRRLGARL] SEQ ID NO:3, соответствующие нуклеотидам 13516-13566 SEQ ID NO:1); мотиву В (аминокислоты 588-603 [VAVLAVLESGAAYVPI] SEQ ID NO:3, соответствующие нуклеотидам 13633-13680 SEQ ID NO:1); мотиву С (аминокислоты 669-684 [AYVIYTSGSTGLPKGV] SEQ ID NO:3, соответствующие нуклеотидам 13876-13923 SEQ ID NO:1); мотиву D (аминокислоты 815-821 [SLGGATE] SEQ ID NO:3, соответствующие нуклеотидам 14313-14334 SEQ ID NO:1); мотиву Е (аминокислоты 868-892 [GQLYIGGVGLALGYWRDEEKTRKSF] SEQ ID NO:3, соответствующие нуклеотидам 14473-14547 SEQ ID NO:1); мотиву F (аминокислоты 903-912 [YKTGDLGRYL] SEQ ID NO:3, соответствующие нуклеотидам 14578-14607 SEQ ID NO:1); мотиву G (аминокислоты 918-940 [EFMGREDNQIKLRGYRVELGEIE] SEQ ID NO:3, соответствующие нуклеотидам 14623-14692 SEQ ID NO:1); мотиву Н (аминокислоты 1268-1274 [LPEYMVP] SEQ ID NO:3, соответствующие нуклеотидам 15673-15693 SEQ ID NO:1), и мотиву I (аминокислоты 1285-1297 [LTSNGKVDRKALR] SEQ ID NO:3, соответствующие нуклеотидам 15724-15762 SEQ ID NO:1);- the formation domain of aminoacyl adenylate corresponding to motive A (amino acids 549-565 [LTYEELSRRSRRLGARL] SEQ ID NO: 3, corresponding to nucleotides 13516-13566 SEQ ID NO: 1); motive B (amino acids 588-603 [VAVLAVLESGAAYVPI] SEQ ID NO: 3, corresponding to nucleotides 13633-13680 SEQ ID NO: 1); motive C (amino acids 669-684 [AYVIYTSGSTGLPKGV] SEQ ID NO: 3 corresponding to nucleotides 13876-13923 of SEQ ID NO: 1); motif D (amino acids 815-821 [SLGGATE] SEQ ID NO: 3, corresponding to nucleotides 14313-14334 SEQ ID NO: 1); motive E (amino acids 868-892 [GQLYIGGVGLALGYWRDEEKTRKSF] SEQ ID NO: 3, corresponding to nucleotides 14473-14547 SEQ ID NO: 1); motif F (amino acids 903-912 [YKTGDLGRYL] SEQ ID NO: 3, corresponding to nucleotides 14578-14607 SEQ ID NO: 1); motif G (amino acids 918-940 [EFMGREDNQIKLRGYRVELGEIE] SEQ ID NO: 3 corresponding to nucleotides 14623-14692 SEQ ID NO: 1); motive H (amino acids 1268-1274 [LPEYMVP] SEQ ID NO: 3, corresponding to nucleotides 15673-15693 SEQ ID NO: 1), and motive I (amino acids 1285-1297 [LTSNGKVDRKALR] SEQ ID NO: 3, corresponding to nucleotides 15724-15762 SEQ ID NO: 1);

- неизвестный домен, встроенный между мотивами G и Н домена образования аминоациладенилата (аминокислоты 973-1256 SEQ ID NO:3, соответствующие нуклеотидам 14788-15639 SEQ ID NO:1); и- an unknown domain inserted between the G and H motifs of the aminoacyladenylate formation domain (amino acids 973-1256 of SEQ ID NO: 3 corresponding to nucleotides 14788-15639 of SEQ ID NO: 1); and

- домен, гомологичный домену протеина-носителя пептидила (РСР), соответствующий мотиву J (аминокислоты 1344-1351 [GATSIHIV] SEQ ID NO:3, соответствующие нуклеотидам 15901-15924 SEQ ID NO:1).- a domain homologous to the domain of the peptidyl carrier protein (PCP) corresponding to motive J (amino acids 1344-1351 [GATSIHIV] SEQ ID NO: 3, corresponding to nucleotides 15901-15924 of SEQ ID NO: 1).

Предполагается, что EPOS P принимает участие в активации цистеина путем аденилирования, связывания активированного цистеина в виде аминоацил-S-PCP, образования пептидной связи между связанным ферментом цистеином и ацетил-S-ACP, поставляемым EPOS А, и образования начального тиазолинового кольца посредством внутримолекулярной гетероциклизации. Неизвестный домен EPOS P обладает очень слабыми гомологиями с NAD(P)H-оксидазами и редуктазами видов Bacillus. Таким образом, неизвестный домен и/или ER-домен EPOS А могут принимать участие в окислении начального 2-метилтиазолинового кольца с образованием 2-метилтиазола.EPOS P is believed to be involved in the activation of cysteine by adenylation, the binding of activated cysteine as aminoacyl-S-PCP, the formation of a peptide bond between the linked cysteine enzyme and acetyl-S-ACP supplied by EPOS A, and the formation of an initial thiazoline ring via intramolecular heterocyclization . The unknown EPOS P domain has very weak homologies with NAD (P) H oxidases and reductases of Bacillus species. Thus, the unknown domain and / or ER domain of EPOS A can be involved in the oxidation of the initial 2-methylthiazoline ring to form 2-methylthiazole.

ероВ (нуклеотиды 16251-21749 SEQ ID NO:1) кодирует EPOS В (SEQ ID NO:4), поликетид-синтазу типа I, состоящую из одного модуля и несущего следующие домены: KS (нуклеотиды 16269-17546 SEQ ID NO:1, аминокислоты 7-432 SEQ ID NO:4); AT (нуклеотиды 17865-18827 SEQ ID NO:1, аминокислоты 539-859 SEQ ID NO:4); дегидратазы (DH) (нуклеотиды 18855-19361 SEQ ID NO:1, аминокислоты 869-1037 SEQ ID NO:4); β-кеторедуктазы (KR) (нуклеотиды 20565-21302 SEQ ID NO:1, аминокислоты 1439-1684 SEQ ID NO:4) и АСР (нуклеотиды 21414-21626 SEQ ID NO:1, аминокислоты 1722-1792 SEQ ID NO:4). Сравнение последовательностей и анализ мотивов свидетельствует о том, что AT, кодируемая EPOS А, является метилмалонил-СоА-специфичной. EPOS А может быть вовлечена в первое удлинение поликетидной цепи путем катализа конденсации типа реакции Кляйзена исходной группы, т.е. 2-метил-4-тиазолкарбоксил-S-PCP, с метилмалонил-S-ACP и последующего восстановления b-кето-группы С17 до еноила.EPOB (nucleotides 16251-21749 SEQ ID NO: 1) encodes EPOS B (SEQ ID NO: 4), a type I polyketide synthase consisting of one module and bearing the following domains: KS (nucleotides 16269-17546 SEQ ID NO: 1, amino acids 7-432 of SEQ ID NO: 4); AT (nucleotides 17865-18827 SEQ ID NO: 1, amino acids 539-859 SEQ ID NO: 4); dehydratase (DH) (nucleotides 18855-19361 of SEQ ID NO: 1, amino acids 869-1037 of SEQ ID NO: 4); β-ketoreductases (KR) (nucleotides 20565-21302 SEQ ID NO: 1, amino acids 1439-1684 SEQ ID NO: 4) and ACP (nucleotides 21414-21626 SEQ ID NO: 1, amino acids 1722-1792 SEQ ID NO: 4) . Comparison of sequences and analysis of motifs indicates that AT encoded by EPOS A is methylmalonyl-CoA-specific. EPOS A may be involved in the first extension of the polyketide chain by catalysis of condensation such as the Kleisen reaction of the parent group, i.e. 2-methyl-4-thiazolecarboxyl-S-PCP, with methylmalonyl-S-ACP and subsequent reduction of the C17 b-keto group to enoyl.

ероС (нуклеотиды 21746-43519 SEQ ID NO:1) кодирует EPOS С (SEQ ID NO:5), поликетид-синтазу типа I, состоящую из 4 модулей. Первый модуль несет домены KS (нуклеотиды 21860-23116 SEQ ID NO:1, аминокислоты 39-457 SEQ ID NO:5); малонил-СоА-специфической AT (нуклеотиды 23431-24397 SEQ ID NO:1, аминокислоты 563-884 SEQ ID NO:5); KR (нуклеотиды 25184-25942 SEQ ID NO:1, аминокислоты 1147-1399 SEQ ID NO:5) и АСР (нуклеотиды 26045-26263 SEQ ID NO:1, аминокислоты 1434-1506 SEQ ID NO:5). Этот модуль включает ацетатное звено-удлинитель (С14-С13) и восстанавливает β-кетогруппу в положении С15 с образованием гидроксильной группы, которая принимает участие в окончательной лактонизации макролактонового кольца эпотилона. Второй модуль EPOS С несет домены KS (нуклеотиды 26318-27595 SEQ ID NO:1, аминокислоты 1524-1950 SEQ ID NO:5); малонил-СоА-специфической AT (нуклеотиды 27911-28876 SEQ ID NO:1, аминокислоты 2056-2377 SEQ ID NO:5); KR (нуклеотиды 29678-30429 SEQ ID NO:1, аминокислоты 2645-2895 SEQ ID NO:5) и АСР (нуклеотиды 30539-30759 SEQ ID NO:1, аминокислоты 2932-3005 SEQ ID NO:5). Этот модуль включает ацетатное звено-удлинитель (С12-С11) и восстанавливает β-кетогруппу в положении С13 с образованием гидроксильной группы. Таким образом, образующаяся поликетидная цепь эпотилона соответствует эпотилону А, а для включения метильной боковой цепи в положении С12 в эпотилон В требуется наличие С-метилтрансферазной активности после воздействия PKS. Для формирования эпоксикольца в положениях С13-С12 также требуется стадия окисления после воздействия PKS. Третий модуль EPOS С несет домены KS (нуклеотиды 30815-32092 SEQ ID NO:1, аминокислоты 3024-3449 SEQ ID NO:5); малонил-СоА-специфической AT (нуклеотиды 32408-33373 SEQ ID NO:1, аминокислоты 3555-3876 SEQ ID NO:5); DH (нуклеотиды 33401-33889 SEQ ID NO:1, аминокислоты 3886-4048 SEQ ID NO:5); ER (нуклеотиды 35042-35902 SEQ ID NO:1, аминокислоты 4433-4719 SEQ ID NO:5); KR (нуклеотиды 35930-36667 SEQ ID NO:1, аминокислоты 4729-4974 SEQ ID NO:5) и АСР (нуклеотиды 36773-36991 SEQ ID NO:1, аминокислоты 5010-5082 SEQ ID NO:5). Этот модуль включает ацетатное звено-удлинитель (С10-С9) и полностью восстанавливает β-кетогруппу в положении С11. Четвертый модуль EPOS С несет домены KS (нуклеотиды 37052-38320 SEQ ID NO:1, аминокислоты 5103-5525 SEQ ID NO:5); метилмалонил-СоА-специфической AT (нуклеотиды 38636-39598 SEQ ID NO:1, аминокислоты 5631-5951 SEQ ID NO:5); DH (нуклеотиды 39635-40141 SEQ ID NO:1, аминокислоты 5964-6132 SEQ ID NO:5); ER (нуклеотиды 41369-42256 SEQ ID NO:1, аминокислоты 6542-6837 SEQ ID NO:5); KR (нуклеотиды 42314-43048 SEQ ID NO:1, аминокислоты 6857-7101 SEQ ID NO:5) и АСР (нуклеотиды 43163-43378 SEQ ID NO:1, аминокислоты 7140-7211 SEQ ID NO:5). Этот модуль включает пропионатное звено-удлинитель (С24 и С8-С7) и полностью восстанавливает β-кетогруппу в положении С9.epoC (nucleotides 21746-43519 SEQ ID NO: 1) encodes EPOS C (SEQ ID NO: 5), a type I polyketide synthase consisting of 4 modules. The first module carries KS domains (nucleotides 21860-23116 of SEQ ID NO: 1, amino acids 39-457 of SEQ ID NO: 5); malonyl-CoA specific AT (nucleotides 23431-24397 SEQ ID NO: 1, amino acids 563-884 SEQ ID NO: 5); KR (nucleotides 25184-25942 SEQ ID NO: 1, amino acids 1147-1399 SEQ ID NO: 5) and ACP (nucleotides 26045-26263 SEQ ID NO: 1, amino acids 1434-1506 SEQ ID NO: 5). This module includes an acetate extension unit (C14-C13) and restores the β-keto group at position C15 to form a hydroxyl group that takes part in the final lactonization of the macrolactone ring of the epothilone. The second EPOS C module carries KS domains (nucleotides 26318-27595 SEQ ID NO: 1, amino acids 1524-1950 SEQ ID NO: 5); malonyl-CoA-specific AT (nucleotides 27911-28876 SEQ ID NO: 1, amino acids 2056-2377 SEQ ID NO: 5); KR (nucleotides 29678-30429 SEQ ID NO: 1, amino acids 2645-2895 SEQ ID NO: 5) and ACP (nucleotides 30539-30759 SEQ ID NO: 1, amino acids 2932-3005 SEQ ID NO: 5). This module includes an acetate extension unit (C12-C11) and restores the β-keto group at position C13 to form a hydroxyl group. Thus, the resulting polyketide chain of epothilone corresponds to epothilone A, and the inclusion of a methyl side chain at position C12 in epothilone B requires the presence of C-methyltransferase activity after exposure to PKS. The formation of an epoxy ring at positions C13-C12 also requires an oxidation step after exposure to PKS. The third EPOS C module carries KS domains (nucleotides 30815-32092 SEQ ID NO: 1, amino acids 3024-3449 SEQ ID NO: 5); malonyl-CoA-specific AT (nucleotides 32408-33373 SEQ ID NO: 1, amino acids 3555-3876 SEQ ID NO: 5); DH (nucleotides 33401-33889 SEQ ID NO: 1, amino acids 3886-4048 SEQ ID NO: 5); ER (nucleotides 35042-35902 SEQ ID NO: 1, amino acids 4433-4719 SEQ ID NO: 5); KR (nucleotides 35930-36667 SEQ ID NO: 1, amino acids 4729-4974 SEQ ID NO: 5) and ACP (nucleotides 36773-36991 SEQ ID NO: 1, amino acids 5010-5082 SEQ ID NO: 5). This module includes an acetate extension unit (C10-C9) and completely restores the β-keto group at position C11. The fourth EPOS C module carries KS domains (nucleotides 37052-38320 SEQ ID NO: 1, amino acids 5103-5525 SEQ ID NO: 5); methylmalonyl-CoA-specific AT (nucleotides 38636-39598 SEQ ID NO: 1, amino acids 5631-5951 SEQ ID NO: 5); DH (nucleotides 39635-40141 SEQ ID NO: 1, amino acids 5964-6132 SEQ ID NO: 5); ER (nucleotides 41369-42256 SEQ ID NO: 1, amino acids 6542-6837 SEQ ID NO: 5); KR (nucleotides 42314-43048 SEQ ID NO: 1, amino acids 6857-7101 SEQ ID NO: 5) and ACP (nucleotides 43163-43378 SEQ ID NO: 1, amino acids 7140-7211 SEQ ID NO: 5). This module includes a propionate extension unit (C24 and C8-C7) and completely restores the β-keto group at position C9.

epoD (нуклеотиды 43524-54920 SEQ ID NO:1) кодирует EPOS D (SEQ ID NO:6), поликетид-синтазу типа I, состоящую из 2 модулей. Первый модуль несет домены KS (нуклеотиды 43626-44885 SEQ ID NO:1, аминокислоты 35-454 SEQ ID NO:6); метилмалонил-СоА-специфической AT (нуклеотиды 45204-46166 SEQ ID NO:1, аминокислоты 561-881 SEQ ID NO:6); KR (нуклеотиды 46950-47702 SEQ ID NO:1, аминокислоты 1143-1393 SEQ ID NO:6) и АСР (нуклеотиды 47811-48032 SEQ ID NO:1, аминокислоты 1430-1503 SEQ ID NO:6). Этот модуль включает пропионатное звено-удлинитель (С23 и С6-С5) и восстанавливает β-кетогруппу в положении С7 с образованием гидроксильной группы. Второй модуль несет домены KS (нуклеотиды 48087-49361 SEQ ID NO:1, аминокислоты 1522-1946 SEQ ID NO:6); метилмалонил-СоА-специфической AT (нуклеотиды 49680-50642 SEQ ID NO:1, аминокислоты 2053-2373 SEQ ID NO:6); DH (нуклеотиды 50670-51176 SEQ ID NO:1, аминокислоты 2383-2551 SEQ ID NO:6); метилтрансферазы (МТ, нуклеотиды 51534-52657 SEQ ID NO:1, аминокислоты 2671-3045 SEQ ID NO:6); KR (нуклеотиды 53697-54431 SEQ ID NO:1, аминокислоты 3392-3636 SEQ ID NO:6) и АСР (нуклеотиды 54540-54758 SEQ ID NO:1, аминокислоты 3673-3745 SEQ ID NO:6). Этот модуль включает пропионатное звено-удлинитель (С21 или С22 и С4-С3) и восстанавливает β-кетогруппу в положении С5 с образованием гидроксильной группы. Это восстановление является в определенной степени неожиданным, поскольку эпотилоны содержат кетогруппу в положении С5. Однако такого типа несоответствия между предсказанными восстановительными способностями модулей PKS и восстановительно-окислительным статусом соответствующих положений в конечных поликетидных продуктах известны из литературы (см., например, Schwecke и др., Proc. Natl. Acad. Sci. USA 92: 7839-7843 (1995) и Schupp и др., FEMS Microbiology Letters 159: 201-207 (1998)). Важной особенностью эпотилонов является присутствие гем-метильных боковых групп в положении С4 (С21 и С22). Второй модуль EPOS D, вероятно, включает пропионатное звено в растущую поликетидную цепь, обеспечивая появление одной метильной боковой цепи в положении С4. Этот модуль также содержит домен метилтрансферазы, интегрированный в PKS между доменами DH и KR, в ориентации аналогичной обнаруженной для йерсиниабактин-синтазы HMWP1 (Gehring A.M., DeMoll E., Fetherston J.D., Mori I., Mayhew G.F., Blattner F.R., Walsh C.T. и Perry, R.D.: Iron acquisition in plague: modular logic in enzymatic biogenesis of yersiniabactin by Yersinia pestis. Chem. Biol. 5, 573-586, 1998). Этот МТ-домен в EPOS D, вероятно, ответствен за включение второй метильной боковой группы (С21 или С22) в положении С4.epoD (nucleotides 43524-54920 SEQ ID NO: 1) encodes EPOS D (SEQ ID NO: 6), a type I polyketide synthase consisting of 2 modules. The first module carries KS domains (nucleotides 43626-44885 SEQ ID NO: 1, amino acids 35-454 SEQ ID NO: 6); methylmalonyl-CoA-specific AT (nucleotides 45204-46166 SEQ ID NO: 1, amino acids 561-881 SEQ ID NO: 6); KR (nucleotides 46950-47702 SEQ ID NO: 1, amino acids 1143-1393 SEQ ID NO: 6) and ACP (nucleotides 47811-48032 SEQ ID NO: 1, amino acids 1430-1503 SEQ ID NO: 6). This module includes a propionate extension unit (C23 and C6-C5) and restores the β-keto group at position C7 to form a hydroxyl group. The second module carries the KS domains (nucleotides 48087-49361 of SEQ ID NO: 1, amino acids 1522-1946 of SEQ ID NO: 6); methylmalonyl-CoA-specific AT (nucleotides 49680-50642 SEQ ID NO: 1, amino acids 2053-2373 SEQ ID NO: 6); DH (nucleotides 50670-51176 SEQ ID NO: 1, amino acids 2383-2551 SEQ ID NO: 6); methyltransferases (MT, nucleotides 51534-52657 SEQ ID NO: 1, amino acids 2671-3045 SEQ ID NO: 6); KR (nucleotides 53697-54431 SEQ ID NO: 1, amino acids 3392-3636 SEQ ID NO: 6) and ACP (nucleotides 54540-54758 SEQ ID NO: 1, amino acids 3673-3745 SEQ ID NO: 6). This module includes a propionate extension unit (C21 or C22 and C4-C3) and restores the β-keto group at position C5 to form a hydroxyl group. This recovery is somewhat unexpected, since the epothilones contain a keto group at position C5. However, this type of mismatch between the predicted reduction ability of the PKS modules and the reduction-oxidation status of the corresponding positions in the final polyketide products is known from the literature (see, for example, Schwecke et al., Proc. Natl. Acad. Sci. USA 92: 7839-7843 ( 1995) and Schupp et al., FEMS Microbiology Letters 159: 201-207 (1998)). An important feature of epothilones is the presence of hemethyl side groups at position C4 (C21 and C22). The second EPOS D module probably incorporates a propionate unit into the growing polyketide chain, providing one methyl side chain at position C4. This module also contains the methyltransferase domain integrated into the PKS between the DH and KR domains in an orientation similar to that found for yersiniabactin synthase HMWP1 (Gehring AM, DeMoll E., Fetherston JD, Mori I., Mayhew GF, Blattner FR, Walsh CT and Perry , RD: Iron acquisition in plague: modular logic in enzymatic biogenesis of yersiniabactin by Yersinia pestis. Chem. Biol. 5, 573-586, 1998). This MT domain in EPOS D is probably responsible for the inclusion of a second methyl side group (C21 or C22) at position C4.

ероЕ (нуклеотиды 54935-62254 SEQ ID NO:1) кодирует EPOS E (SEQ ID NO:7), поликетид-синтазу типа I, состоящую из одного модуля, несущего домены KS (нуклеотиды 55028-56284 SEQ ID NO:1, аминокислоты 32-450 SEQ ID NO:7); малонил-СоА-специфической AT (нуклеотиды 56600-57565 SEQ ID NO:1, аминокислоты 556-877 SEQ ID NO:7); DH (нуклеотиды 57593-58087 SEQ ID NO:1, аминокислоты 887-1051 SEQ ID NO:7); вероятно не функционально активной ER (нуклеотиды 59366-60304 SEQ ID NO:1, аминокислоты 1478-1790 SEQ ID NO:7); KR (нуклеотиды 60362-61099 SEQ ID NO:1, аминокислоты 1810-2055 SEQ ID NO:7), АСР (нуклеотиды 61211-61426 SEQ ID NO:1, аминокислоты 2093-2164 SEQ ID NO:7) и тиоэстеразы (ТЕ) (нуклеотиды 61427-62254 SEQ ID NO:1, аминокислоты 2165-2439 SEQ ID NO:7). ER-домен в этом модуле несет мотив сайтов с некоторыми совершенно необычными аминокислотными заменами, что, вероятно, делает этот домен неактивным. Модуль включает ацетатное звено-удлинитель (С2-С1) и восстанавливает β-кетогруппу в положении С3 с образованием еноильной группы. Эпотилоны содержат гидроксильную группу в положении С3, поэтому это восстановление, вероятно, является избыточным, как обсуждалось для второго модуля EPOS D. ТЕ-домен EPOS E принимает участие в высвобождении и циклизации растущей поликетидной цепи путем образования лактона между карбоксильной группой в положении С1 и гидроксильной группой в положении С15.EPOE (nucleotides 54935-62254 SEQ ID NO: 1) encodes EPOS E (SEQ ID NO: 7), a type I polyketide synthase consisting of one module bearing KS domains (nucleotides 55028-56284 SEQ ID NO: 1, amino acids 32 -450 SEQ ID NO: 7); malonyl-CoA specific AT (nucleotides 56600-57565 SEQ ID NO: 1, amino acids 556-877 SEQ ID NO: 7); DH (nucleotides 57593-58087 SEQ ID NO: 1, amino acids 887-1051 SEQ ID NO: 7); probably not a functionally active ER (nucleotides 59366-60304 SEQ ID NO: 1, amino acids 1478-1790 SEQ ID NO: 7); KR (nucleotides 60362-61099 SEQ ID NO: 1, amino acids 1810-2055 SEQ ID NO: 7), ACP (nucleotides 61211-61426 SEQ ID NO: 1, amino acids 2093-2164 SEQ ID NO: 7) and thioesterase (TE) (nucleotides 61427-62254 of SEQ ID NO: 1, amino acids 2165-2439 of SEQ ID NO: 7). The ER domain in this module carries the site motif with some completely unusual amino acid substitutions, which probably makes this domain inactive. The module includes an acetate extension unit (C2-C1) and restores the β-keto group at position C3 with the formation of an enoyl group. Epothilones contain a hydroxyl group at position C3, so this reduction is probably redundant, as discussed for the second module of EPOS D. The EPOS E domain takes part in the release and cyclization of the growing polyketide chain by the formation of a lactone between the carboxyl group at position C1 and the hydroxyl group in position C15.

В секвенированной области против хода транскрипции ероА обнаружено 5 ORF. Частично секвенированная orf1 не имеет гомологичных последовательностей в банках данных. Выведенный протеиновый продукт (Orf 2, SEQ ID NO:10) orf2 (нуклеотиды 3171-1900 на обратной комплементарной цепи SEQ ID NO:1) проявляет заметные аналогии с гипотетическими ORF из Mycobacterium и Streptomyces coelicolor и более отдаленные аналогии с карбоксипептидазами и DD-пептидазами различных бактерий. Выведенный протеиновый продукт orf3 (нуклеотиды 3415-5556 SEQ ID NO:1), Orf 3 (SEQ ID NO:11), обладает гомологией с Na/H-антипортерами различных бактерий. Orf 3 может принимать участие в экспорте эпотилонов из штамма-продуцента. orf4 и orf5 не имеют гомологичных последовательностей в банках данных.In the sequenced region against the course of transcription of epoA, 5 ORFs were detected. Partially sequenced orf1 does not have homologous sequences in the data banks. The derived protein product (Orf 2, SEQ ID NO: 10) orf2 (nucleotides 3171-1900 on the reverse complementary chain of SEQ ID NO: 1) shows noticeable analogies with the hypothetical ORFs from Mycobacterium and Streptomyces coelicolor and more distant analogies with carboxypeptidases and DD peptidases various bacteria. The derived orf3 protein product (nucleotides 3415-5556 SEQ ID NO: 1), Orf 3 (SEQ ID NO: 11), has homology with the Na / H antiporters of various bacteria. Orf 3 may be involved in the export of epothilones from a producer strain. orf4 and orf5 do not have homologous sequences in the databanks.

В секвенированной области по ходу транскрипции ероЕ обнаружено 11 ORF. epoF (нуклеотиды 62369-63628 SEQ ID NO:1) кодирует EPOS F (SEQ ID NO:8), выведенный протеин, обладающий выраженными аналогиями последовательности с цитохром Р450 оксигеназами. EPOS F может принимать участие в регуляции окислительно-восстановительного статуса углеродов С12, С5 и/или С3. Выведенный протеиновый продукт orf14 (нуклеотиды 67334-68251 SEQ ID NO:1), Orf 14 (SEQ ID NO:22) проявляет заметные аналогии с GI:3293544, гипотетическим протеином из Streptomyces coelicolor с неизвестной функцией, а также с человеческим протеином из легких эмбриона GI:2654559. Он также имеет более отдаленное родство с протеинами системы выхода катионов типа GI:2623026 из Methanobacterium thermoautotrophicum, поэтому он также может принимать участие в экспорте эпотилонов из клеток-продуцентов. Остальные ORF (orf6-orf13 и orf15) не имеют гомологичных последовательностей в банках данных.In the sequenced region, 11 ORFs were detected during transcription of epoE. epoF (nucleotides 62369-63628 SEQ ID NO: 1) encodes EPOS F (SEQ ID NO: 8), an isolated protein having pronounced sequence analogies with cytochrome P450 oxygenases. EPOS F may be involved in the regulation of the redox status of C12, C5 and / or C3 carbon. The derived protein product orf14 (nucleotides 67334-68251 SEQ ID NO: 1), Orf 14 (SEQ ID NO: 22) shows noticeable analogies with GI: 3293544, a hypothetical protein from Streptomyces coelicolor with an unknown function, as well as a human protein from the lungs of the embryo GI: 2654559. It also has a more distant relationship with the proteins of the GI cation exit system: 2623026 from Methanobacterium thermoautotrophicum, so it can also be involved in the export of epothilones from producer cells. The remaining ORFs (orf6-orf13 and orf15) do not have homologous sequences in the data banks.

Пример 13: Рекомбинантная экспрессия генов биосинтеза эпотилонаExample 13: Recombinant expression of epothilone biosynthesis genes

Гены эпотилон-синтазы по настоящему изобретению экспрессируют в гетерологичных организмах с целью получения эпотилона в больших количествах, чем при ферментации с использованием Sorangium cellulosum. Предпочтительным хозяином для гетерологичной экспрессии является Streptomyces, например, Streptomyces coelicolor, вид, который в естественных условиях продуцирует поликетид актинородин. Методики рекомбинантной экспрессии гена PKS в этом хозяине описаны у McDaniel и др., Science 262: 1546-1550 (1993) и Као и др., Science 265: 509-512 (1994) (см. также Holmes и др., ЕМВО Journal 12(8): 3183-3191 (1993) и Bibb и др., Gene 38: 215-226 (1985), а также в патентах US 5521077, 5672491 и 5712146, которые включены в настоящее описание в виде ссылки.The epothilone synthase genes of the present invention are expressed in heterologous organisms in order to produce epothilone in larger quantities than by fermentation using Sorangium cellulosum. A preferred host for heterologous expression is Streptomyces, for example Streptomyces coelicolor, a species that naturally produces actinorodine polyketide. Recombinant PKS gene expression techniques in this host are described by McDaniel et al., Science 262: 1546-1550 (1993) and Kao et al., Science 265: 509-512 (1994) (see also Holmes et al., EMBO Journal 12 (8): 3183-3191 (1993) and Bibb et al., Gene 38: 215-226 (1985), as well as in US patents 5521077, 5672491 and 5712146, which are incorporated herein by reference.

Согласно одному из способов конструируют штамм гетерологичного хозяина, имеющего хромосомную делецию кластера генов актинородина (act). Экспрессионные плазмиды, содержащие гены эпотилон-синтазы по изобретению, конструируют путем переноса ДНК из чувствительной к температуре плазмиды-донора в челночный (бифункциональный) вектор-реципиент в Е.coli (McDaniel и др. (1993) и Као и др. (1994)), так что гены синтазы получают путем гомологичной рекомбинации в векторе. В альтернативном варианте кластер генов эпотилон-синтазы интродуцируют в вектор путем лигирования рестрикционных фрагментов. После селекции, проведенной, например, как описано у Као и др. (1994), ДНК из вектора интродуцируют в штамм Streptomyces coelicolor act-минус согласно протоколам, приведенным у Hopwood и др., Genetic Manipulation of Streptomyces. A Laboratory Manual (John Innes Foundation, Norwich, United Kingdom, 1985), публикация включена в настоящее описание в виде ссылки. Рекомбинантный штамм Streptomyces выращивают в среде R2YE (Hopwood и др. (1985)) и получают эпотилоны.In one method, a heterologous host strain is constructed having a chromosomal deletion of the actinorodine gene cluster (act). Expression plasmids containing the epothilone synthase genes of the invention are constructed by transferring DNA from a temperature-sensitive donor plasmid to a shuttle (bifunctional) recipient vector in E. coli (McDaniel et al. (1993) and Kao et al. (1994) ), so that synthase genes are obtained by homologous recombination in a vector. Alternatively, the epothilone synthase gene cluster is introduced into the vector by ligation of restriction fragments. After selection, carried out, for example, as described by Kao et al. (1994), DNA from the vector is introduced into the Streptomyces coelicolor act minus strain according to the protocols given by Hopwood et al., Genetic Manipulation of Streptomyces. A Laboratory Manual (John Innes Foundation, Norwich, United Kingdom, 1985), a publication is incorporated herein by reference. The recombinant strain of Streptomyces is grown in R2YE medium (Hopwood et al. (1985)) and epothilones are obtained.

В другом варианте гены эпотилон-синтазы по настоящему изобретению экспрессируют в других организмах-хозяевах, таких как Pseudomonads, Bacillus, дрожжи, клетки насекомых и/или Е.coli. Гены PKS и NRPS предпочтительно экспрессируют в Е. coli, используя вектор рТ7-7, в который входит промотор Т7 (см. Tabor и др., Proc. NatL Acad. Sci. USA 82: 1074-1078 (1985). Согласно другому варианту осуществления для экспрессии генов PKS и NRPS в Е.coli, в слиянии, которое обеспечивает транскрипцию или трансляцию, под контролем промотора tac или trc, применяют экспрессионные векторы рКК223-3 и рКК223-2. Для экспрессии генов PKS и NRPS в гетерологичных хозяевах, которые в естественных условиях не имеют фосфопантетеинил-(Р-pant)-трансфераз, которые необходимы для посттрансляционной модификации ферментов PKS, требуется совместная экспрессия в хозяине P-pant-трансферазы, как описано у Kealey и др., Proc. NatL Acad. Sci. USA 95: 505-509 (1998).In another embodiment, the epothilone synthase genes of the present invention are expressed in other host organisms such as Pseudomonads, Bacillus, yeast, insect cells and / or E. coli. The PKS and NRPS genes are preferably expressed in E. coli using the pT7-7 vector, which includes the T7 promoter (see Tabor et al., Proc. NatL Acad. Sci. USA 82: 1074-1078 (1985). In another embodiment, for expression of the PKS and NRPS genes in E. coli, in a fusion that provides transcription or translation, under the control of the tac or trc promoter, the pKK223-3 and pKK223-2 expression vectors are used. For the expression of the PKS and NRPS genes in heterologous hosts that in vivo do not have phosphopantetheinyl- (P-pant) -transferases, which are necessary for post-translational modification and PKS enzymes, co-expression in the P-pant transferase host is required, as described by Kealey et al., Proc. NatL Acad. Sci. USA 95: 505-509 (1998).

Пример 14: Выделение эпотилонов из штаммов-продуцентовExample 14: Isolation of Epothilones from Producer Strains

Примеры методов культивирования, ферментации и экстракции для выделения поликетидов, которые могут применяться для экстракции эпотилонов как из естественных, так и из рекомбинантных хозяев по настоящему изобретению, даны в WO 93/10121, включенной в настоящее описание в виде ссылки, в примере 57 патента US 5639949 и у Gerth и др., J. Antibiotics 49: 560-563 (1996), а также в заявке на патент SE 396/98, поданной 19 февраля 1998 г., в заявке на патент US 09/248, 910 (в которой также описаны предпочтительные мутантные штаммы Sorangium cellulosum), обе заявки включены в настоящее описание в виде ссылки. Ниже приведены процедуры, которые могут применяться для выделения эпотилонов из культивируемых штаммов Sorangium cellulosum, таких как So ce90, и которые также могут использоваться для выделения эпотилонов из рекомбинантных хозяев.Examples of cultivation, fermentation and extraction methods for isolating polyketides that can be used to extract epothilones from both natural and recombinant hosts of the present invention are given in WO 93/10121, incorporated herein by reference, in Example 57 of US Pat. 5639949 and Gerth et al., J. Antibiotics 49: 560-563 (1996), as well as in patent application SE 396/98, filed February 19, 1998, in patent application US 09/248, 910 (in which also describes preferred mutant strains of Sorangium cellulosum), both applications are hereby incorporated by reference Lki. The following are procedures that can be used to isolate epothilones from cultured strains of Sorangium cellulosum, such as So ce90, and which can also be used to isolate epothilones from recombinant hosts.

А: Культивирование продуцирующих эпотилон штаммов:A: Cultivation of epothilone-producing strains:

Штамм: Sorangium cellulosum Soce-90 или рекомбинантный штамм-хозяин по настоящему изобретению.Strain: Sorangium cellulosum Soce-90 or recombinant host strain of the present invention.

Консервация штамма: В жидком N2.Preservation of the strain: In liquid N 2 .

Среда: Предварительные культуры и промежуточные культуры G52Wednesday: Pre-crops and Intercultures G52

Основная культура: 1В12Main culture: 1B12

Среда G52:G52 environment:

дрожжевой экстракт с низкой концентрациейlow concentration yeast extract соли (фирма BioSpringer, Maisonsalts (BioSpringer, Maison Alfort, Франция) 2 г/лAlfort, France) 2 g / l MgSO4 (7Н2О) MgSO 4 (7H 2 O) 1 г/л1 g / l CaCl2 (2H2О) CaCl 2 (2H 2 O) 1 г/л1 g / l обезжиренная соевая мука (фирма Lucaslow fat soy flour (Lucas Meyer, Hamburg, Германия)) Meyer, Hamburg, Germany)) 2 г/л2 g / l картофельный крахмал Noredux (фирмаNoredux potato starch (company Blattmann, Wadenswil, Щвейцария) Blattmann, Wadenswil, Switzerland) 8 г/л8 g / l безводная глюкоза anhydrous glucose 2 г/л2 g / l натриевая соль Fe-ЭДТК (8 г/л) Fe-EDTA sodium salt (8 g / l) 1 мл/л1 ml / l

значение рН 7,4 скорректировано с помощью КОНpH 7.4 adjusted using KOH

Стерилизация: 20 мин при 120°СSterilization: 20 min at 120 ° C

Среда 1В12:Wednesday 1B12:

картофельный крахмал Noredux A-150potato starch Noredux A-150 (фирма Blattmann, Wadenswil, Щвейцария) (Blattmann, Wadenswil, Switzerland) 20 г/л20 g / l обезжиренная соевая мука Soyamin 50Tfat free soy flour Soyamin 50T (фирма Lucas Meyer, Hamburg, Германия) (company Lucas Meyer, Hamburg, Germany) 11 г/л11 g / l натриевая соль Fe(III)-ЭДТК sodium salt of Fe (III) -EDTA 8 мг/л8 mg / l

значение рН 7,8 скорректировано с помощью КОНpH 7.8 adjusted with KOH

Стерилизация: 20 мин при 120°С.Sterilization: 20 min at 120 ° C.

Добавление циклодекстринов и циклодекстриновых производных:Addition of cyclodextrins and cyclodextrin derivatives:

Различные концентрации циклодекстринов (фирма Fluka, Buchs, Щвейцария или Wacker Chemie, Munich, Германия) стерилизуют отдельно и добавляют в среду 1В12 до посева культуры.Different concentrations of cyclodextrins (Fluka, Buchs, Switzerland, or Wacker Chemie, Munich, Germany) are sterilized separately and added to 1B12 medium before culture.

Культивирование: 1 мл супернатанта штамма Sorangium cellulosum Soce90 ВСЕ33/10 из ампулы с жидким N2 переносят в 10 мл среды G52 (в колбе Эрленмейера объемом 50 мл) и инкубируют в течение 3 дней в мешалке со смещением 25 мм при скорости вращения 180 об/мин и при 30°С. 5 мл этой культуры переносят в 45 мл среды G52 (в колбе Эрленмейера объемом 200 мл) и инкубируют в течение 3 дней в мешалке со смещением 25 мм при скорости вращения 180 об/мин и при 30°С. 50 мл этой культуры затем добавляют к 450 мл среды G52 (в колбе Эрленмейера объемом 2 л) и инкубируют в течение 3 дней в мешалке со смещением 50 мм при скорости вращения 180 об/мин и при 30°С.Cultivation: 1 ml of the supernatant of the strain Sorangium cellulosum Soce90 VSE33 / 10 from an ampoule with liquid N 2 is transferred into 10 ml of G52 medium (in an Erlenmeyer flask with a volume of 50 ml) and incubated for 3 days in a mixer with an offset of 25 mm at a rotation speed of 180 rpm min and at 30 ° C. 5 ml of this culture is transferred into 45 ml of G52 medium (in a 200 ml Erlenmeyer flask) and incubated for 3 days in a mixer with a displacement of 25 mm at a rotation speed of 180 rpm and at 30 ° C. 50 ml of this culture is then added to 450 ml of G52 medium (in a 2 L Erlenmeyer flask) and incubated for 3 days in a mixer with a displacement of 50 mm at a rotation speed of 180 rpm and at 30 ° C.

Поддерживающая культура: Культуры пересевают каждые 3-4 дня, добавляя 50 мл культуры к 450 мл среды G52 (в колбе Эрленмейера объемом 2 л). Все эксперименты и процессы ферментации проводят, используя в качестве исходной эту поддерживающую культуру.Maintaining culture: Cultures are reseeded every 3-4 days by adding 50 ml of culture to 450 ml of G52 medium (in a 2 L Erlenmeyer flask). All experiments and fermentation processes are carried out using this supporting culture as a source.

Опыты в колбе:Experiments in the flask:

(I) Предварительная культура во встряхиваемой колбе:(I) Pre-culture in shake flask:

Используя в качестве исходной 500 мл поддерживающей культуры, 1×450 мл среды G52 засевают с помощью 50 мл поддерживающей культуры и инкубируют в течение 4 дней в мешалке со смещением 50 мм при скорости вращения 180 об/мин и при 30°С.Using 500 ml of the supporting culture as the initial one, 1 × 450 ml of G52 medium is seeded with 50 ml of the supporting culture and incubated for 4 days in a mixer with a displacement of 50 mm at a rotation speed of 180 rpm and at 30 ° C.

(II) Основная культура во встряхиваемой колбе:(II) The main culture in the shake flask:

40 мл среды 1 В12 плюс 5 г/л порошка 4-морфолинпропансульфоновой кислоты (MOPS) (в колбе Эрленмейера объемом 200 мл) смешивают с 5 мл 10-кратного концентрированного раствора циклодекстрина, высевают 10 мл предварительной культуры и инкубируют в течение 5 дней в мешалке со смещением 50 мм при скорости вращения 180 об/мин и при 30°С.40 ml of 1 B12 medium plus 5 g / l of 4-morpholine propanesulfonic acid (MOPS) powder (in a 200 ml Erlenmeyer flask) are mixed with 5 ml of a 10-fold concentrated cyclodextrin solution, 10 ml of pre-culture are inoculated and incubated for 5 days in a stirrer with a displacement of 50 mm at a rotation speed of 180 rpm and at 30 ° C.

Ферментация: Процессы ферментации осуществляют в объемах 10 л, 100 л и 500 л. Ферментации в 20 л и в 100 л служат в качестве промежуточной стадии культивирования. В то время как предварительные культуры и промежуточные культуры высевают в виде поддерживающей среды в концентрация 10 об.%, основную культуру засевают с помощью 20 об.%-ной промежуточной культуры. Важно отметить: в противоположность к перемешиваемым культурами ингредиенты сред для ферментации рассчитывают по отношению к конечному объему культуры, включая инокулят. Например, если объединяют 18 л среды +2 л инокулята, то вещества взвешивают из расчета 20 л, однако смешивают только с 18 л.Fermentation: Fermentation processes are carried out in volumes of 10 l, 100 l and 500 l. Fermentations of 20 L and 100 L serve as an intermediate stage of cultivation. While preliminary cultures and intermediate cultures are sown in the form of a supporting medium at a concentration of 10 vol.%, The main culture is sown with 20 vol.% Intermediate culture. It is important to note: in contrast to culture-agitated, the ingredients of the fermentation media are calculated with respect to the final volume of the culture, including the inoculum. For example, if 18 liters of medium + 2 liters of inoculum are combined, then the substances are weighed at the rate of 20 liters, however, they are mixed only with 18 liters.

Предварительная культура во встряхиваемой колбе:Pre-culture in shake flask:

Используя в качестве исходной 500 мл поддерживающей культуры, 4х450 мл среды G52 (в колбе Эрленмейера объемом 200 мл) засевают с помощью 50 мл этой культуры и инкубируют в течение 4 дней в мешалке со смещением 50 мм при скорости вращения 180 об/мин и при 30°С.Using the initial 500 ml of supporting culture, 4x450 ml of G52 medium (in an Erlenmeyer flask of 200 ml) is inoculated with 50 ml of this culture and incubated for 4 days in a mixer with a displacement of 50 mm at a rotation speed of 180 rpm and at 30 ° C.

Промежуточная культура. 20-литровая или 100-литровая:Intermediate culture. 20 liter or 100 liter:

20-литровая: 18 л среды G52 в ферментере, имеющем общий объем 30 л, засевают с помощью 2 л предварительной культуры. Культивирование продолжают в течение 3-4 дней в следующих условиях; 30°С, 250 об/мин, 0,5 л воздуха на 1 л жидкой среды в мин, избыточное давление 0,5 бар, без контроля рН.20 liter: 18 L of G52 medium in a fermenter having a total volume of 30 L is seeded with 2 L of pre-culture. Cultivation is continued for 3-4 days under the following conditions; 30 ° C, 250 rpm, 0.5 l of air per 1 l of liquid medium per min, overpressure 0.5 bar, without pH control.

100-литровая: 90 л среды G52 в ферментере, имеющем общий объем 150 л, засевают с помощью 10 л 20-литровой предварительной культуры. Культивирование продолжают в течение 3-4 дней в следующих условиях: 30°С, 150 об/мин, 0,5 л воздуха на 1 л жидкой среды в мин, избыточное давление 0,5 бар, без контроля рН.100 liter: 90 liters of G52 medium in a fermenter having a total volume of 150 liters are seeded with 10 liters of a 20 liter pre-culture. Cultivation is continued for 3-4 days under the following conditions: 30 ° C, 150 rpm, 0.5 L of air per 1 L of liquid medium per minute, overpressure 0.5 bar, without pH control.

Основная культура, 10-, 100- или 500-литровая:Main culture, 10-, 100- or 500-liter:

10-литровая: Ингредиенты для получения 10 л среды 1В12 стерилизуют в 7 л воды, затем добавляют 1 л стерильного 10%-ного раствора 2-(гидроксипропил)-β-циклодекстрина (ГП-β-ЦД) и засевают с помощью 2 л 20-литровой промежуточной культуры. Продолжительность культивирования основной культуры составляет 6-7 дней в следующих условиях: 30°С, 250 об/мин, 0,5 л воздуха на 1 л жидкой среды в мин, избыточное давление 0,5 бар, контроль рН с помощью H2SO4/KOH до рН 7,6±0,5 (т.е. без контроля при значении рН от 7,1 до 8,1).10 liter: The ingredients for 10 l of medium 1B12 are sterilized in 7 l of water, then 1 l of a sterile 10% solution of 2- (hydroxypropyl) -β-cyclodextrin (GP-β-CD) is added and seeded with 2 l of 20 liter intermediate culture. The duration of cultivation of the main culture is 6-7 days under the following conditions: 30 ° C, 250 rpm, 0.5 l of air per 1 l of liquid medium per min, overpressure 0.5 bar, pH control with H 2 SO 4 / KOH to a pH of 7.6 ± 0.5 (i.e., no control at a pH of 7.1 to 8.1).

100-литровая: Ингредиенты для получения 100 л среды 1В12 стерилизуют в 70 л воды, затем добавляют 10 л стерильного 10%-ного раствора 2-(гидроксипропил)-β-циклодекстрина и засевают с помощью 20 л 20-литровой промежуточной культуры. Продолжительность культивирования основной культуры составляет 6-7 дней в следующих условиях: 30°С, 200 об/мин, 0,5 л воздуха на 1 л жидкой среды в мин, избыточное давление 0,5 бар, контроль рН с помощью H2SO4/KOH до рН 7,6±0,5. Последовательность посевов для 100-литрового ферментера схематично приведена ниже:100 L: The ingredients for 100 L of 1B12 medium are sterilized in 70 L of water, then 10 L of a sterile 10% solution of 2- (hydroxypropyl) -β-cyclodextrin is added and seeded with 20 L of a 20 L intermediate culture. The duration of cultivation of the main culture is 6-7 days under the following conditions: 30 ° C, 200 rpm, 0.5 l of air per 1 l of liquid medium per minute, overpressure 0.5 bar, pH control with H 2 SO 4 / KOH to pH 7.6 ± 0.5. The sowing sequence for the 100 liter fermenter is schematically shown below:

Figure 00000002
Figure 00000002

500-литровая: Ингредиенты для получения 500 л среды 1В12 стерилизуют в 350 л воды, затем добавляют 50 л стерильного 10%-ного раствора 2- (гидроксипропил)-β-циклодекстрина и засевают с помощью 100 л 100-литровой промежуточной культуры. Продолжительность культивирования основной культуры составляет 6-7 дней в следующих условиях: 30°С, 120 об/мин, 0,5 л воздуха на 1 л жидкой среды в мин, избыточное давление 0,5 бар, контроль рН с помощью Н2SO4/КОН до рН 7,6±0,5.500 L: Ingredients for 500 L of 1B12 medium are sterilized in 350 L of water, then 50 L of a sterile 10% solution of 2- (hydroxypropyl) -β-cyclodextrin is added and seeded with 100 L of a 100 L intermediate culture. The duration of cultivation of the main culture is 6-7 days under the following conditions: 30 ° C, 120 rpm, 0.5 l of air per 1 l of liquid medium per min, overpressure 0.5 bar, pH control with H 2 SO 4 / KOH to pH 7.6 ± 0.5.

Анализ продуктов:Product Analysis:

Приготовление образца:Sample preparation:

50 мл образцов смешивают с 2 мл полистирола Amberlite XAD16 (фирма Rohm и Haas, Frankfurt, Германия) и встряхивают при 180 об/мин в течение 1 ч при 30°С. Полистирол затем фильтруют, используя найлоновое сито с размером пор 150 мкм, промывают 1 л воды и затем смешивают с фильтром в пробирке типа Nunc объемом 15 мл.50 ml of samples are mixed with 2 ml of Amberlite XAD16 polystyrene (Rohm and Haas, Frankfurt, Germany) and shaken at 180 rpm for 1 h at 30 ° C. The polystyrene is then filtered using a nylon sieve with a pore size of 150 μm, washed with 1 L of water and then mixed with a filter in a 15 ml Nunc type tube.

Элюдия продукта из полистирола:Polystyrene Product Elude:

В пробирку с фильтром и полистиролом добавляют 10 мл изопропанола (>99%). После этого закрытую пробирку встряхивают в течение 30 мин при комнатной температуре на роторном смесителе типа Rota-Mixer (фирма Labinco BV, Нидерланды). Затем 2 мл жидкости удаляют центрифугированием и добавляют супернатант с помощью пипетки в пробирки для ЖХВР.In a test tube with a filter and polystyrene, 10 ml of isopropanol (> 99%) is added. After that, the closed tube was shaken for 30 min at room temperature on a Rota-Mixer type rotary mixer (Labinco BV, Netherlands). Then, 2 ml of the liquid was removed by centrifugation and the supernatant was added by pipette to the HPLC tubes.

ЖХВР-анализ:HPLC analysis:

Колонка: Waters-Symetry C18, 100×4 мм, 3,3 мкм WAT066220+предварительная колонка 3,9×20 мм WAT054225Column: Waters-Symetry C18, 100 × 4 mm, 3.3 μm WAT066220 + preliminary column 3.9 × 20 mm WAT054225

Растворители: Solvents: А: 0,02%-ная фосфорная кислотаA: 0.02% phosphoric acid Б: ацетонитрил (чистоты для ЖХВР)B: acetonitrile (purity for HPLC) Градиент: Gradient: 41% Б от 0 до 7 мин41% B from 0 to 7 minutes 100% Б от 7,2 мин до 7,8 мин100% B from 7.2 minutes to 7.8 minutes 41% В от 8 до 12 мин41% B 8 to 12 min

Температура термостата: 30°СThermostat temperature: 30 ° C

Определение: 250 нм, УФ-DAD-определениеDefinition: 250 nm, UV-DAD determination

Объем вводимой пробы: 10 мклThe volume of the injected sample: 10 μl

Время удерживания: эпотилон А: 4,30 мин; эпотилон В: 5,38 минRetention time: epothilone A: 4.30 min; epothilone B: 5.38 min

Б. Воздействие добавления циклодекстрина и циклодекстриновых производных на концентрации полученных эпотилоновB. The effect of adding cyclodextrin and cyclodextrin derivatives on the concentration of the resulting epothilones

Циклодекстрины представляют собой циклические (α-1,4)-связанные олигосахариды α-D-глюкопиранозы с относительно гидрофобной центральной полостью и гидрофильной областью внешней поверхности.Cyclodextrins are cyclic (α-1,4) -linked α-D-glucopyranose oligosaccharides with a relatively hydrophobic central cavity and a hydrophilic region on the outer surface.

Следует отметить, в частности (цифрами в скобках обозначено количество остатков глюкозы на молекулу): α-циклодекстрин (6), β-циклодекстрин (7), γ-циклодекстрин (8), δ-циклодекстрин (9), ε-циклодекстрин (10), ζ-циклодекстрин (11), η-циклодекстрин (12) и θ-циклодекстрин (13). Наиболее предпочтительными являются δ-циклодекстрин и особенно α-циклодекстрин, β-циклодекстрин или γ-циклодекстрин или их смеси.It should be noted in particular (the numbers in parentheses indicate the number of glucose residues per molecule): α-cyclodextrin (6), β-cyclodextrin (7), γ-cyclodextrin (8), δ-cyclodextrin (9), ε-cyclodextrin (10 ), ζ-cyclodextrin (11), η-cyclodextrin (12), and θ-cyclodextrin (13). Most preferred are δ-cyclodextrin and especially α-cyclodextrin, β-cyclodextrin or γ-cyclodextrin, or mixtures thereof.

Циклодекстриновые производные прежде всего представляют собой вышеперечисленные циклодекстрины, особенно α-циклодекстрин, β-циклодекстрин или γ-циклодекстрин, прежде всего циклодекстрины, в которых одна или большее количество вплоть до всех гидроксигрупп (3 на радикал глюкозы) преобразованы с образованием простого или сложного эфира. Простые эфиры прежде всего представляют собой алкиловые простые эфиры, предпочтительно (низш.) алкиловые эфиры, такие как метиловый или этиловый эфир, а также пропиловый или бутиловый эфир; и арилгидроксиалкиловые эфиры, такие как фенилгидрокси(низш.)алкиловый, предпочтительно фенилгидроксиэтиловый эфир; гидроксиалкиловые эфиры, в частности гидрокси (низш,) алкиловые эфиры, предпочтительно 2-гидроксиэтиловый, гидроксипропиловый, такой как 2-гидроксипропиловый, или гидроксибутиловый, такой как 2-гидроксибутиловый эфир; карбоксиалкиловые эфиры, в частности карбокси (низш.) алкиловые эфиры, предпочтительно карбоксиметиловый или карбоксиэтиловый эфир; дериватизированные карбоксиалкиловые эфиры, в частности дериватизированный карбокси (низш.)алкиловый эфир, в котором дериватизированная карбоксигруппа является этерифизированной или амидированной карбоксигруппой (прежде всего аминокарбонилом, моно- или ди-(низш.)алкиламинокарбонил, морфолино-, пиперидино-, пирролидино- или пиперазинокарбонилом, или алкоксикарбонилом), в частности (низш.)алкокси-карбонил-(низш) алкиловые эфиры, например, метилоксикарбонилпропиловый эфир или этилкарбонилпропиловый эфир; сульфоалкиловые эфиры, в частности сульфо(низш.)алкиловые эфиры, предпочтительно сульфобутиловый эфир; циклодекстрины, в которых одна или большее количество ОН-групп этерифизировано с помощью радикала формулыThe cyclodextrin derivatives are primarily the aforementioned cyclodextrins, especially α-cyclodextrin, β-cyclodextrin or γ-cyclodextrin, especially cyclodextrins, in which one or more up to all hydroxy groups (3 per glucose radical) are converted to form an ether or ester. The ethers are primarily alkyl ethers, preferably lower alkyl ethers, such as methyl or ethyl ether, as well as propyl or butyl ether; and arylhydroxyalkyl ethers, such as phenylhydroxy lower alkyl, preferably phenylhydroxyethyl ether; hydroxyalkyl ethers, in particular hydroxy (lower) alkyl ethers, preferably 2-hydroxyethyl, hydroxypropyl, such as 2-hydroxypropyl, or hydroxybutyl, such as 2-hydroxybutyl ether; carboxyalkyl ethers, in particular carboxy (lower) alkyl ethers, preferably carboxymethyl or carboxyethyl ether; derivatized carboxyalkyl ethers, in particular derivatized carboxy (lower) alkyl ether, in which the derivatized carboxy group is an esterified or amidated carboxy group (especially aminocarbonyl, mono- or di- (lower) alkylaminocarbonyl, morpholino-piperipiperide or alkoxycarbonyl), in particular lower alkoxycarbonyl lower alkyl esters, for example methyloxycarbonylpropyl ether or ethylcarbonylpropyl ether; sulfoalkyl ethers, in particular sulfo (lower) alkyl ethers, preferably sulfobutyl ether; cyclodextrins in which one or more OH groups are esterified with a radical of the formula

-O-[алк-O]n-O- [alk-O] n -H

где алк обозначает алкил, предпочтительно (низш.)алкил и n обозначает целое число от 2 до 12, предпочтительно 2-5, в частности 2 или 3; циклодекстрины, в которых одна или большее количество ОН-групп этерифизировано с помощью радикала формулыwhere alk is alkyl, preferably lower alkyl and n is an integer from 2 to 12, preferably 2-5, in particular 2 or 3; cyclodextrins in which one or more OH groups are esterified with a radical of the formula

где R' обозначает атом водорода, гидрокси, -O-(алк-O)z-Н, -O-(алк(-R)-O)p-Н или -O-(алк(-R)-O)q-алк-СО-Y; алк во всех случаях обозначает алкил, предпочтительно (низш.) алкил; m, n, p, q и z обозначают целое число от 1 до 12, предпочтительно 2-5, в частности 2 или 3; и Y обозначает OR1 или NR2R3, где R1, R2 и R3 независимо друг от друга обозначают атом водорода или (низш.) алкил или R2 и R3 вместе с присоединенным атом азота обозначают морфолино, пиперидино, пирролидино или пиперазино; или разветвленные циклодекстрины, в которых присутствуют эфирные группы или ацетали, образованные с другими молекулами сахаров, предпочтительно глюкозил-, диглюкозил(G2-β-циклодекстрин), мальтозил- или димальтозилциклодекстрин или N-ацетилглюкозаминил- глюкозаминил-, N-ацетилгалактотозаминил или галактозаминилциклодекстрин.where R 'is a hydrogen atom, hydroxy, -O- (alk-O) z -H, -O- (alk (-R) -O) p -H or -O- (alk (-R) -O) q -alk-CO-Y; alk in all cases is alkyl, preferably lower alkyl; m, n, p, q and z are an integer from 1 to 12, preferably 2-5, in particular 2 or 3; and Y is OR 1 or NR 2 R 3 , where R 1 , R 2 and R 3 independently represent a hydrogen atom or lower alkyl or R 2 and R 3 together with an attached nitrogen atom represent morpholino, piperidino, pyrrolidino or piperazino; or branched cyclodextrins in which ether groups or acetals are formed with other sugar molecules, preferably glucosyl, diglucosyl (G 2 -β-cyclodextrin), maltosyl or dimaltosyl cyclodextrin or N-acetylglucosaminyl-glucosaminyl-, N-acetylgalactloctinamines or.

Сложные эфиры прежде всего представляют собой алканоиловые эфиры, в частности (низш.) алканоиловые эфиры, такие как ацетиловые эфиры или циклодекстрины.Esters are primarily alkanoyl ethers, in particular lower alkanoyl ethers such as acetyl ethers or cyclodextrins.

Также возможно использовать циклодекстрины, в которых два или большее количество указанных различных групп простых эфиров и групп сложных эфиров присутствует одновременно.It is also possible to use cyclodextrins in which two or more of these different groups of ethers and ester groups are present simultaneously.

Смеси из двух или большего количества этих циклодекстринов и/или циклодекстриновых производных также могут применяться.Mixtures of two or more of these cyclodextrins and / or cyclodextrin derivatives can also be used.

Предпочтение отдается, в частности α-, β- или γ-циклодекстринам или их простым (низш.)алкиловым эфирам, таким как метил-β-циклодекстрин или особенно предпочтительно 2,6-ди-О-метил-β-циклодекстрин, или предпочтительно их простым гидрокси(низш.)алкиловым эфирам, таким как 2-гидроксипропил-α-, 2-гидроксипропил-β- или 2-гидроксипропил-γ-циклодекстрин.Particular preference is given to, in particular, α-, β- or γ-cyclodextrins or their lower alkyl esters, such as methyl-β-cyclodextrin or particularly preferably 2,6-di-O-methyl-β-cyclodextrin, or preferably their hydroxy lower alkyl ethers such as 2-hydroxypropyl-α-, 2-hydroxypropyl-β- or 2-hydroxypropyl-γ-cyclodextrin.

Циклодекстрины или циклодекстриновые производные добавляют в культуральную среду предпочтительно в концентрации 0,02-10, предпочтительно 0,05-5, особенно предпочтительно 0,1-4, например, 0,1-2% (мас./об.).Cyclodextrins or cyclodextrin derivatives are added to the culture medium, preferably at a concentration of 0.02-10, preferably 0.05-5, particularly preferably 0.1-4, for example 0.1-2% (w / v).

Циклодекстрины или циклодекстриновые производные являются известными или могут быть получены с помощью известных методов (см., например, US 3459731; US 4383992; US 4535152; US 4659696; EP 0094157; EP 0149197; EP 0197571; EP 0300526; EP 0320032; EP 0499322; EP 0503710; EP 0818469; WO 90/12035; WO 91/11200; WO 93/19061; WO 95/089993; WO 96/14090; GB 2189245; DE 3118218; DE 3317064 и указанные в них ссылки, которые также относятся к синтезу циклодекстринов или циклодекстриновых производных, или также у Т. Loftsson и М.Е.Brewster (1996): Pharmaceutical Applications of Cyclodextrins: Drug Solubilization and Stabilisation: Journal of Pharmaceutical Science 85 (10): 1017-1025; R.A.Rajewski и VJ. Stella (1996) Pharmaceutical Applications of Cyclodextrins: In vivo Drug Delivery: Journal of Pharmaceutical Science 85 (11):1142-1168).Cyclodextrins or cyclodextrin derivatives are known or can be obtained using known methods (see, for example, US 3459731; US 4383992; US 4535152; US 4659696; EP 0094157; EP 0149197; EP 0197571; EP 0300526; EP 0320032; EP 0499322; EP 0503710; EP 0818469; WO 90/12035; WO 91/11200; WO 93/19061; WO 95/089993; WO 96/14090; GB 2189245; DE 3118218; DE 3317064 and the references therein that also relate to the synthesis cyclodextrins or cyclodextrin derivatives, or also from T. Loftsson and M.E. Brewster (1996): Pharmaceutical Applications of Cyclodextrins: Drug Solubilization and Stabilization: Journal of Pharmaceutical Science 85 (10): 1017-1025; RARajewski and VJ. Stella (1996) Pharmaceutical Applications of Cyclodextrins: In vivo Drug Del ivery: Journal of Pharmaceutical Science 85 (11): 1142-1168).

Все изученные циклодекстриновые производные получены от компании Fluka, Buchs, CH. Опыты проводят во встряхиваемых колбах объемах 200 мл. В качестве контролей используют колбы с адсорбентом - смолой (полистиролом) Amberlite XAD16 (фирма Rohm & Haas, Frankfurt, Германия) и без добавления абсорбента. После инкубации в течение 5 дней с помощью ХЖВР могут быть определены следующие титры эпотилонов:All studied cyclodextrin derivatives were obtained from Fluka, Buchs, CH. The experiments are carried out in 200 ml shaken flasks. As controls, flasks with an adsorbent - resin (polystyrene) Amberlite XAD16 (Rohm & Haas, Frankfurt, Germany) and without adding absorbent are used. After incubation for 5 days with the help of HPLC, the following epothilone titers can be determined:

Таблица 2:Table 2: ДобавкаAdditive № продуктаProduct No. Конц. [%, мас./об.]1 Conc. [%, w / v] 1 Эпотилон А [мг/л]Epothilone A [mg / L] Эпотилон В [мг/л]Epothilone B [mg / l] Amberlite XAD16 (об./об.)Amberlite XAD16 (V / V) 2,0 об.%2.0 vol.% 9,29.2 3,83.8

ДобавкаAdditive № продуктаProduct No. Конц. [%, мас./об.]1 Conc. [%, w / v] 1 Эпотилон А [мг/л]Epothilone A [mg / L] Эпотилон В [мг/л]Epothilone B [mg / l] 2-гидроксипропил-β-циклодекстрин2-hydroxypropyl-β-cyclodextrin 5633256332 0,10.1 2,72.7 1,71.7 2-гидроксипропил-β-циклодекстрин2-hydroxypropyl-β-cyclodextrin "" 0,50.5 4,74.7 3,33.3 2-гидроксипропил-β-циклодекстрин2-hydroxypropyl-β-cyclodextrin "" 1,01,0 4,74.7 3,43.4 2-гидроксипропил-β-циклодекстрин2-hydroxypropyl-β-cyclodextrin "" 2,02.0 4,74.7 4,14.1 2-гидроксипропил-β-циклодекстрин2-hydroxypropyl-β-cyclodextrin "" 5,05,0 1,71.7 0,50.5 2-гидроксипропил-α-циклодекстрин2-hydroxypropyl-α-cyclodextrin 5633056330 0,50.5 1,21,2 1,21,2 2-гидроксипропил-α-циклодекстрин2-hydroxypropyl-α-cyclodextrin "" 1,01,0 1,21,2 1,21,2 2-гидроксипропил-α-циклодекстрин2-hydroxypropyl-α-cyclodextrin "" 5,05,0 2,52,5 2,32,3 β-циклодекстринβ-cyclodextrin 2870728707 0,10.1 1,61,6 1,31.3 β-циклодекстринβ-cyclodextrin "" 0,50.5 3,63.6 2,52,5 β-циклодекстринβ-cyclodextrin "" 1,01,0 4,84.8 3,73,7 β-циклодекстринβ-cyclodextrin "" 2,02.0 4,84.8 2,92.9 β-циклодекстринβ-cyclodextrin "" 5,05,0 1,21,2 0,40.4 метил-β-циклодекстринmethyl β-cyclodextrin 6629266292 0,50.5 0,80.8 <0,3<0.3 метил-β-циклодекстринmethyl β-cyclodextrin "" 1,01,0 <0,3<0.3 <0,3<0.3 метил-β-циклодекстринmethyl β-cyclodextrin "" 2,02.0 <0,3<0.3 <0,3<0.3 2,6-ди-орто-метил-β-циклодекстрин2,6-di-ortho-methyl-β-cyclodextrin 3991539915 1,01,0 <0,3<0.3 <0,3<0.3 2-гидроксипропил-γ-циклодекстрин2-hydroxypropyl-γ-cyclodextrin 5633456334 0,10.1 0,30.3 <0,3<0.3 2-гидроксипропил-γ-циклодекстрин2-hydroxypropyl-γ-cyclodextrin "" 0,50.5 0,90.9 0,80.8

ДобавкаAdditive № продуктаProduct No. Конц. [%, мас./об]1 Conc. [%, w / v] 1 Эпотилон А [мг/л]Epothilone A [mg / L] Эпотилон В [мг/л]Epothilone B [mg / l] 2-гидроксипропил-γ-циклодекстрин2-hydroxypropyl-γ-cyclodextrin "" 1,01,0 1,11,1 0,70.7 2-гидроксипропил-γ-циклодекстрин2-hydroxypropyl-γ-cyclodextrin "" 2,02.0 2,62.6 0,70.7 2-гидроксипропил-γ-циклодекстрин2-hydroxypropyl-γ-cyclodextrin "" 5,05,0 5,05,0 1,11,1 без добавленияwithout adding 0,50.5 0,50.5 1)Помимо Amberlite (об.%) все проценты представляют собой: мас./об. 1) In addition to Amberlite (vol.%) All percentages are: wt./about.

Некоторые из изученных циклодекстринов (2,6-ди-орто-метил-β-циклодекстрин, метил-β-циклодекстрин) в изученных концентрациях не обладают никаким действием или оказывают отрицательное действие на производство эпотилона. Как видно из примеров, добавление 1-2% 2-гидроксипропил-β-циклодекстрина повышает производство в 6-8 раз по сравнению с производством без использования циклодекстринов.Some of the studied cyclodextrins (2,6-di-ortho-methyl-β-cyclodextrin, methyl-β-cyclodextrin) in the studied concentrations have no effect or have a negative effect on the production of epothilone. As can be seen from the examples, the addition of 1-2% 2-hydroxypropyl-β-cyclodextrin increases the production by 6-8 times in comparison with the production without the use of cyclodextrins.

В: Ферментация 10-литровой культуры с добавлением 1% 2-гидроксипропил-β-циклодекстринаB: Fermentation of a 10 liter culture with 1% 2-hydroxypropyl-β-cyclodextrin

Ферментацию проводят в 15-литровом стеклянном ферментере. Среда содержит 10 г/л 2-(гидроксипропил)-β-циклодекстрина, полученного от фирмы Wacker Chemie, Munich, Германия. Изменение выхода продукта в процессе ферментации представлено в таблице 2. Ферментацию заканчивают через 6 дней и производят обработку продукта.Fermentation is carried out in a 15 liter glass fermenter. The medium contains 10 g / l of 2- (hydroxypropyl) -β-cyclodextrin obtained from Wacker Chemie, Munich, Germany. The change in product yield during the fermentation process is presented in table 2. The fermentation is completed after 6 days and the product is processed.

Таблица 3:Table 3: Изменение выхода продукта в процессе 10-литровой ферментацииChange in product yield during 10 liter fermentation Процесс культивирования (дни)The cultivation process (days) Эпотилон А (мг/л)Epothilone A (mg / L) Эпотилон В (мг/л)Epothilone B (mg / L) 00 00 00 11 00 00 22 0,50.5 0,30.3 33 1,81.8 2,52,5 44 3,03.0 5,15.1

Процесс культивирования (дни)The cultivation process (days) Эпотилон А (мг/л)Epothilone A (mg / L) Эпотилон В (мг/л)Epothilone B (mg / L) 55 3,73,7 5,95.9 66 3,63.6 5,75.7

Г: Ферментация 100-литровой культуры с добавлением 1% 2-гидроксипропил-β-диклодекстринаD: Fermentation of a 100 liter culture with 1% 2-hydroxypropyl-β-diclodextrin

Ферментацию проводят в 150-литровом ферментере. Среда содержит 10 г/л 2-(гидроксипропил)-β-циклодекстрина. Изменение выхода продукта в процессе ферментации представлено в таблице 3. Ферментацию заканчивают через 7 дней и производят обработку продукта.Fermentation is carried out in a 150 liter fermenter. The medium contains 10 g / l of 2- (hydroxypropyl) -β-cyclodextrin. The change in product yield during fermentation is presented in table 3. The fermentation is completed after 7 days and the product is processed.

Таблица 4:Table 4: Изменение выхода продукта в процессе 100-литровой ферментацииChange in product yield during 100 liter fermentation Процесс культивирования (дни)The cultivation process (days) Эпотилон А (мг/л)Epothilone A (mg / L) Эпотилон В (мг/л)Epothilone B (mg / L) 00 00 00 11 00 00 22 0,30.3 00 33 0,90.9 1,11,1 44 1,51,5 2,32,3 55 1,61,6 3,33.3 66 1,81.8 3,73,7 77 1,81.8 3,53,5

Д: Ферментация 500-литровой культуры с добавлением 1% 2-гидроксипропил-β-циклодекстринаD: Fermentation of a 500 liter culture with 1% 2-hydroxypropyl-β-cyclodextrin

Ферментацию проводят в 750-литровом ферментере. Среда содержит 10 г/л 2-(гидроксипропил)-β-циклодекстрина. Изменение выхода продукта в процессе ферментации представлено в таблице 4. Полученный в результате ферментации продукт собирают через 7 дней и производят его обработку.Fermentation is carried out in a 750 liter fermenter. The medium contains 10 g / l of 2- (hydroxypropyl) -β-cyclodextrin. The change in product yield during the fermentation process is presented in table 4. The product obtained as a result of fermentation is collected after 7 days and processed.

Таблица 5:Table 5: Изменение выхода продукта в процессе 500-литровой ферментацииChange in product yield during 500 liter fermentation Процесс культивирования (дни)The cultivation process (days) Эпотилон А (мг/л)Epothilone A (mg / L) Эпотилон В (мг/л)Epothilone B (mg / L) 00 00 00 11 00 00 22 00 00 33 0,60.6 0,60.6 44 1,71.7 2,22.2 55 3,13,1 4,54,5 66 3,13,1 5,15.1

Е: Сравнительный пример ферментации 10-литровой культуры без добавления адсорбентаE: A comparative example of the fermentation of a 10 liter culture without the addition of adsorbent

Ферментацию проводят в 15-литровом стеклянном ферментере. Среда не содержит никакого циклодекстрина или другого адсорбента. Изменение выхода продукта в процессе ферментации представлено в таблице 5. Полученный в результате ферментации продукт не собирают и не обрабатывают.Fermentation is carried out in a 15 liter glass fermenter. The medium does not contain any cyclodextrin or other adsorbent. The change in product yield during the fermentation process is presented in table 5. The product obtained as a result of fermentation is not collected and is not processed.

Таблица 6:Table 6: Изменение выхода продукта в процессе 10-литровой ферментации без адсорбентаChange in product yield during 10 liter fermentation without adsorbent Процесс культивирования (дни)The cultivation process (days) Эпотилон А (мг/л)Epothilone A (mg / L) Эпотилон В (мг/л)Epothilone B (mg / L) 00 00 00 11 00 00 22 00 00 33 00 00 44 0,70.7 0,70.7 55 0,70.7 1,01,0 66 0,80.8 1,31.3

Ж: Обработка эпотилонов: выделение из 500-литровой основной культуры:F: Epothilone treatment: isolation from a 500 liter primary culture:

Выход 500-литровой основной культуры, описанной в примере 2Г, составляет 450 л, его отделяют с помощью очищающего сепаратора Westfalia типа SA-20-06 (скорость вращения 6500 об/мин) на жидкую фазу (центрифугат + промывочная вода) и твердую фазу (клетки примерно 15 кг). Основная часть эпотилонов обнаружена в центрифугате. Полученная после центрифугирования клеточная масса содержит <15% от установленного количества эпотилонов и ее далее не обрабатывали. Центрифугат объемом 650 л затем помещают в резервуар с мешалкой объемом 4000 л, смешивают с 10 л Amberlite XAD16 (объемное соотношение центрифугата: смолы (полистирола) =65:1) и перемешивают.После контакта в течение примерно 2 ч смолу удаляют центрифугированием с помощью центрифуги со сливом типа Heine (вместимость корзины 40 л, скорость вращения 2800 об/мин). Смолу удаляют из центрифуги и промывают 10-15 л деионизированной воды. Десорбцию осуществляют, перемешивая смолу дважды в стеклянных резервуарах с мешалкой объемом 30 л по 30 мин, каждый раз используя по 30 л изопропанола. Отделение изопропанольной фазы от смолы проводят с помощью всасывающего фильтра. Затем изопропанол удаляют из объединенных изопропанольных фаз, добавляя 15-20 л воды в вакуумном испарителе с циркуляцией (фирма Schmid-Verdampfer) и полученную водную фазу объемом примерно 10 л экстрагируют трижды, используя каждый раз по 10 л этилацетата. Этилацетатный экстракт концентрируют до объема 3-5 л в вакуумном испарителе с циркуляцией (фирма Schmid-Verdampfer) и после этого концентрируют досуха на роторном испарителе (типа Büchi). В результате получают 50,2 г этилацетатного экстракта. Этилацетатный экстракт растворяют в 500 мл метанола, нерастворимые фракции отфильтровывают с помощью складчатого фильтра и раствор вносят в 10-кг колонку Sephadex LH 20 (Pharmacia, Ippsala, Швеция) (диаметр колонки 20 см, уровень заполнения примерно 1,2 м). Элюцию осуществляют, используя в качестве элюента метанол. Эпотилоны А и В в основном присутствуют во фракциях 21-23 (при размере фракции 1 л). Эти фракции концентрируют досуха в вакууме на роторном испарителе (общая масса 9,0 г). После чего эти сефадексные фракции с максимальным содержанием эпотилонов (9,0 г) растворяют в 92 мл смеси ацетонитрил: вода: метиленхлорид (50:40:2), раствор фильтруют через складчатый фильтр и вносят в RP-колонку (устройство типа Prepbar 200, фирма Merck; 2,0 кг LiChrospher RP-18, Merck, размер гранул 12 мкм, диаметр колонки 10 см, уровень заполнения 42 см; фирма Merck, Darmstadt, Германия). Элюцию осуществляют смесью ацетонитрил: вода (3:7) (скорость потока 500 мл/мин; время удерживания эпотилона А примерно 51-59 мин; время удерживания эпотилона В примерно 60-69 мин). Фракционирование контролируют с помощью УФ-детектора при длине волны 250 нм. Фракции концентрируют досуха в вакууме с помощью роторного испарителя типа Büchi. Масса эпотилона А во фракции с максимальным содержанием составляет 700 мг, что согласно полученным с помощью ЖХВР (с внутренним стандартом) соответствует 75,1%. Масса эпотилона В во фракции с максимальным содержанием составляет 1980 мг, что согласно полученным с помощью ЖХВР (с внутренним стандартом) соответствует 86,6%. И наконец фракцию эпотилона А (700 мг) кристаллизуют из 5 мл смеси этилацетат:толуол (2:3) и получают 170 мг эпотилона А в виде чистого кристаллизата [содержание по данным ЖХВР (площадь, %) составляет 94,3%]. Кристаллизацию эпотилона В (1980 мг) осуществляют с помощью 18 мл метанола, получая 144 мг эпотилона В в виде чистого кристаллизата [содержание по данным ЖХВР (площадь, %) составляет 99,2%], tпл (эпотилон В): например, 124-125°С; 1Н-ЯМР для эпотилона В:The yield of the 500-liter main culture described in Example 2G is 450 L; it is separated using a Westfalia type SA-20-06 cleaning separator (rotational speed of 6500 rpm) into the liquid phase (centrifugate + wash water) and the solid phase ( cells about 15 kg). The main part of epothilones was found in a centrifuge. The cell mass obtained after centrifugation contains <15% of the established amount of epothilones and it was not further processed. A 650 L centrifuge is then placed in a 4000 L stirred tank, mixed with 10 L Amberlite XAD16 (centrifugate: resin (polystyrene) volume ratio = 65: 1) and mixed. After contact for about 2 hours, the resin is removed by centrifugation using a centrifuge with Heine drain (basket capacity 40 l, rotation speed 2800 rpm). The resin is removed from the centrifuge and washed with 10-15 L of deionized water. Desorption is carried out by stirring the resin twice in glass tanks with a 30 L agitator for 30 min, each time using 30 L of isopropanol. The separation of the isopropanol phase from the resin is carried out using a suction filter. Isopropanol is then removed from the combined isopropanol phases by adding 15-20 L of water in a circulating vacuum evaporator (Schmid-Verdampfer) and the resulting aqueous phase of approximately 10 L is extracted three times using 10 L of ethyl acetate each time. The ethyl acetate extract was concentrated to a volume of 3-5 L in a circulating vacuum evaporator (Schmid-Verdampfer) and then concentrated to dryness on a rotary evaporator (type Büchi). The result is 50.2 g of ethyl acetate extract. The ethyl acetate extract was dissolved in 500 ml of methanol, the insoluble fractions were filtered off with a pleated filter and the solution was added to a 10 kg Sephadex LH 20 column (Pharmacia, Ippsala, Sweden) (column diameter 20 cm, filling level approximately 1.2 m). Elution is carried out using methanol as eluent. Epothilones A and B are mainly present in fractions 21-23 (with a fraction size of 1 l). These fractions were concentrated to dryness in vacuo on a rotary evaporator (total weight 9.0 g). Then these Sephadex fractions with the maximum content of epothilones (9.0 g) are dissolved in 92 ml of a mixture of acetonitrile: water: methylene chloride (50: 40: 2), the solution is filtered through a pleated filter and introduced into an RP column (Prepbar 200 device Merck company; 2.0 kg LiChrospher RP-18, Merck, granule size 12 μm, column diameter 10 cm, filling level 42 cm; company Merck, Darmstadt, Germany). The elution is carried out with a mixture of acetonitrile: water (3: 7) (flow rate 500 ml / min; retention time of epothilone A about 51-59 minutes; retention time epothilone A about 60-69 minutes). Fractionation is monitored using a UV detector at a wavelength of 250 nm. Fractions were concentrated to dryness in vacuo using a Büchi rotary evaporator. The mass of epothilone A in the fraction with the maximum content is 700 mg, which, according to those obtained using HPLC (with the internal standard), corresponds to 75.1%. The mass of epothilone B in the fraction with the maximum content is 1980 mg, which, according to those obtained using HPLC (with the internal standard), corresponds to 86.6%. Finally, the epothilone A fraction (700 mg) was crystallized from 5 ml of a mixture of ethyl acetate: toluene (2: 3) and 170 mg of epothilone A were obtained as pure crystallizate [content according to HPLC (area,%) is 94.3%]. The crystallization of epothilone B (1980 mg) was carried out using 18 ml of methanol, obtaining 144 mg of epothilone B in the form of a pure crystallisate [content according to HPLC (area,%) is 99.2%], t PL (epothilone B): for example, 124 -125 ° C; 1 H-NMR for epothilone B:

500 МГц-ЯМР, растворитель: ДМСО-d6. Химический сдвиг δ в част./млн относительно TMS. s обозначает синглет; d обозначает дублет; m обозначает мультиплет500 MHz NMR, solvent: DMSO-d 6 . Chemical shift δ in ppm relative to TMS. s is a singlet; d is a doublet; m stands for multiplet

δ (кратность)δ (multiplicity) Интеграл (количество Н)Integral (number of N) 7,34 (s)7.34 (s) 11 6,50 (s)6.50 (s) 11 5,28 (d)5.28 (d) 11 5,08 (d)5.08 (d) 11 4,46 (d)4.46 (d) 11 4,08 (m)4.08 (m) 11 3,47 (m)3.47 (m) 11

δ (кратность)δ (multiplicity) Интеграл (количество Н)Integral (number of N) 3,11 (m)3.11 (m) 11 2,83 (dd)2.83 (dd) 11 2,64 (s)2.64 (s) 11 2,36 (m)2.36 (m) 22 2,09 (s)2.09 (s) 33 2,04 (m)2.04 (m) 11 1,83 (m)1.83 (m) 11 1,61 (m)1.61 (m) 11 1,47-1,24 (m)1.47-1.24 (m) 44 1,18 (s)1.18 (s) 66 1,13 (m)1.13 (m) 22 1,06 (d)1.06 (d) 33 0,89 (d+s, перекрытие)0.89 (d + s, overlap) 66 Σ=41Σ = 41

Пример 15: Медицинское применение полученных рекомбинантным путем эпотилоновExample 15: Medical use of recombinantly prepared epothilones

Фармацевтические препараты или композиции, включающие эпотилоны, применяют, например, для лечения злокачественных заболеваний, таких как различные твердые опухоли у человека. Такие противораковые композиции содержат, например, эпотилон в качестве действующего вещества в сочетании с одним или с несколькими органическими или неорганическими жидкими или твердыми фармацевтически приемлемыми носителями. Такие композиции вводят, например, энтерально, назально, ректально, орально или парентерально, прежде всего внутримышечно или внутривенно. Доза действующего вещества зависит от веса тела, возраста и физического и фармакокинетического состояния пациента, а также от пути введения. Поскольку эпотилоны напоминают по биологическим воздействиям таксол, эпотилоны могут использоваться для замены таксола в композициях и методах применения таксола для лечения рака (см., например, патенты US 5496804, 5565478 и 5641803, которые включены в настоящее описание в виде ссылки).Pharmaceutical preparations or compositions comprising epothilones are used, for example, for the treatment of malignant diseases, such as various solid tumors in humans. Such anti-cancer compositions contain, for example, epothilone as an active substance in combination with one or more organic or inorganic liquid or solid pharmaceutically acceptable carriers. Such compositions are administered, for example, enterally, nasally, rectally, orally or parenterally, especially intramuscularly or intravenously. The dose of the active substance depends on the body weight, age and physical and pharmacokinetic state of the patient, as well as on the route of administration. Since epothilones resemble the biological effects of taxol, epothilones can be used to replace taxol in compositions and methods of using taxol for treating cancer (see, for example, US Pat. Nos. 5,496,804, 5,565,478 and 5,641,803, which are incorporated herein by reference).

Например, для лечения эпотилон В поставляют в отдельных стеклянных ампулах объемом 2 мл в виде бесцветного концентрата (1 мг/мл) для внутривенного введения. Приготавливают форму вещества в полиэтиленгликоле 300 (ПЭГ 300) и разбавляют 50 или 100 мл 0,9%-ного раствора хлорида натрия для инъекций фармакопеи США (Sodium Chloride Injection, USP), получая требуемую конечную концентрацию лекарства, предназначенного для инфузии. Его вводят в виде однократной 30-минутной внутривенной инфузии каждые 21 день (3-недельная обработка) в виде 6 циклов или в виде однократной 30-минутной внутривенной инфузии каждые 7 дней (еженедельная обработка).For example, for treatment, epothilone B is delivered in separate 2 ml glass ampoules in the form of a colorless concentrate (1 mg / ml) for intravenous administration. A form of the substance is prepared in polyethylene glycol 300 (PEG 300) and diluted with 50 or 100 ml of 0.9% sodium chloride injection for US Pharmacopoeia (Sodium Chloride Injection, USP) to obtain the desired final concentration of the drug intended for infusion. It is administered as a single 30-minute intravenous infusion every 21 days (3-week treatment) in the form of 6 cycles or as a single 30-minute intravenous infusion every 7 days (weekly treatment).

Для еженедельной обработки предпочтительно доза находится в диапазоне от примерно 0,1 до примерно 6, предпочтительно от примерно 0,1 до примерно 5 мг/м2, более предпочтительно от примерно 0,1 до примерно 3 мг/м2, еще более предпочтительно от 0,1 до 1,7 мг/м2, наиболее предпочтительно от примерно 0,3 до примерно 1 мг/м2; для трехнедельной обработки (обработка каждые 3 недели или каждую третью неделю) доза находится в диапазоне от примерно 0,3 до примерно 18 мг/м2, предпочтительно от примерно 0,3 до примерно 15 мг/м2, более предпочтительно от примерно 0,3 до примерно 12 мг/м2, еще более предпочтительно от примерно 0,3 до примерно 7,5 мг/м2 и еще более предпочтительно от примерно 0,3 до примерно 5 мг/м2, наиболее предпочтительно от примерно 1,0 до примерно 3,0 мг/м2. Эту дозу предпочтительно вводят человеку внутривенно (i.v.) в течение 2-180 мин, предпочтительно 2-120 мин, более предпочтительно в течение от примерно 5 до примерно 30 мин, наиболее предпочтительно в течение от примерно 10 до примерно 30 мин, например, в течение примерно 30 мин.For weekly treatment, preferably the dose is in the range of from about 0.1 to about 6, preferably from about 0.1 to about 5 mg / m 2 , more preferably from about 0.1 to about 3 mg / m 2 , even more preferably from 0.1 to 1.7 mg / m 2 , most preferably from about 0.3 to about 1 mg / m 2 ; for a three-week treatment (treatment every 3 weeks or every third week), the dose is in the range of from about 0.3 to about 18 mg / m 2 , preferably from about 0.3 to about 15 mg / m 2 , more preferably from about 0, 3 to about 12 mg / m 2 , even more preferably from about 0.3 to about 7.5 mg / m 2 and even more preferably from about 0.3 to about 5 mg / m 2 , most preferably from about 1.0 up to about 3.0 mg / m 2 . This dose is preferably administered to a person intravenously (iv) for 2-180 minutes, preferably 2-120 minutes, more preferably for about 5 to about 30 minutes, most preferably for about 10 to about 30 minutes, for example, about 30 minutes

Хотя настоящее изобретение описано со ссылкой на конкретные варианты осуществления, должно быть очевидно, что могут быть сделаны многочисленные изменения, модификации и варианты и, следовательно, все такие изменения, модификации и варианты подпадают под сущность и объем изобретения.Although the present invention has been described with reference to specific embodiments, it should be apparent that numerous changes, modifications and variations can be made and, therefore, all such changes, modifications and variations fall within the spirit and scope of the invention.

Figure 00000003
Figure 00000003

Figure 00000004
Figure 00000004

Figure 00000005
Figure 00000005

Figure 00000006
Figure 00000006

Figure 00000007
Figure 00000007

Figure 00000008
Figure 00000008

Figure 00000009
Figure 00000009

Figure 00000010
Figure 00000010

Figure 00000011
Figure 00000011

Figure 00000012
Figure 00000012

Figure 00000013
Figure 00000013

Figure 00000014
Figure 00000014

Figure 00000015
Figure 00000015

Figure 00000016
Figure 00000016

Figure 00000017
Figure 00000017

Figure 00000018
Figure 00000018

Figure 00000019
Figure 00000019

Figure 00000020
Figure 00000020

Figure 00000021
Figure 00000021

Figure 00000022
Figure 00000022

Figure 00000023
Figure 00000023

Figure 00000024
Figure 00000024

Figure 00000025
Figure 00000025

Figure 00000026
Figure 00000026

Figure 00000027
Figure 00000027

Figure 00000028
Figure 00000028

Figure 00000029
Figure 00000029

Figure 00000030
Figure 00000030

Figure 00000031
Figure 00000031

Figure 00000032
Figure 00000032

Figure 00000033
Figure 00000033

Figure 00000034
Figure 00000034

Figure 00000035
Figure 00000035

Figure 00000036
Figure 00000036

Figure 00000037
Figure 00000037

Figure 00000038
Figure 00000038

Figure 00000039
Figure 00000039

Figure 00000040
Figure 00000040

Figure 00000041
Figure 00000041

Figure 00000042
Figure 00000042

Figure 00000043
Figure 00000043

Figure 00000044
Figure 00000044

Figure 00000045
Figure 00000045

Figure 00000046
Figure 00000046

Figure 00000047
Figure 00000047

Figure 00000048
Figure 00000048

Figure 00000049
Figure 00000049

Figure 00000050
Figure 00000050

Figure 00000051
Figure 00000051

Figure 00000052
Figure 00000052

Figure 00000053
Figure 00000053

Figure 00000054
Figure 00000054

Figure 00000055
Figure 00000055

Figure 00000056
Figure 00000056

Figure 00000057
Figure 00000057

Figure 00000058
Figure 00000058

Figure 00000059
Figure 00000059

Figure 00000060
Figure 00000060

Figure 00000061
Figure 00000061

Figure 00000062
Figure 00000062

Figure 00000063
Figure 00000063

Figure 00000064
Figure 00000064

Figure 00000065
Figure 00000065

Figure 00000066
Figure 00000066

Figure 00000067
Figure 00000067

Figure 00000068
Figure 00000068

Figure 00000069
Figure 00000069

Figure 00000070
Figure 00000070

Figure 00000071
Figure 00000071

Figure 00000072
Figure 00000072

Figure 00000073
Figure 00000073

Figure 00000074
Figure 00000074

Figure 00000075
Figure 00000075

Figure 00000076
Figure 00000076

Figure 00000077
Figure 00000077

Figure 00000078
Figure 00000078

Figure 00000079
Figure 00000079

Figure 00000080
Figure 00000080

Figure 00000081
Figure 00000081

Figure 00000082
Figure 00000082

Figure 00000083
Figure 00000083

Figure 00000084
Figure 00000084

Figure 00000085
Figure 00000085

Figure 00000086
Figure 00000086

Figure 00000087
Figure 00000087

Figure 00000088
Figure 00000088

Claims (12)

1. Рекомбинантная клетка-хозяин, включающая химерный ген, включающий гетерологичную промоторную последовательность, функционально связанную с молекулой нуклеиновой кислоты, которая кодирует, по меньшей мере, один полипептид, вовлеченный в биосинтез эпотилонов.1. A recombinant host cell comprising a chimeric gene comprising a heterologous promoter sequence operably linked to a nucleic acid molecule that encodes at least one polypeptide involved in epothilone biosynthesis. 2. Рекомбинантная клетка-хозяин по п.1, представляющая собой бактерию.2. The recombinant host cell according to claim 1, which is a bacterium. 3. Рекомбинантная клетка-хозяин по п.2, представляющая собой Actinomycete.3. The recombinant host cell according to claim 2, which is Actinomycete. 4. Рекомбинантная клетка-хозяин по п.3, представляющая собой Streptomyces.4. The recombinant host cell according to claim 3, which is Streptomyces. 5. Клон Вас, включающий молекулу нуклеиновой кислоты, которая кодирует, по меньшей мере, один полипептид, вовлеченный в биосинтез эпотилонов.5. A clone of you, comprising a nucleic acid molecule that encodes at least one polypeptide involved in the biosynthesis of epothilones. 6. Рекомбинантная клетка-хозяин, включающая экспрессируемый рекомбинантным путем полипептид, вовлеченный в биосинтез эпотилонов.6. Recombinant host cell, comprising a recombinantly expressed polypeptide involved in the biosynthesis of epothilones. 7. Рекомбинантная клетка-хозяин по п.6, представляющая собой бактерию.7. The recombinant host cell according to claim 6, which is a bacterium. 8. Рекомбинантная клетка-хозяин по п.7, представляющая собой Actinomycete.8. The recombinant host cell according to claim 7, which is Actinomycete. 9. Рекомбинантная клетка-хозяин по п.8, представляющая собой Streptomyces.9. The recombinant host cell of claim 8, which is Streptomyces. Приоритет по пунктам:Priority on points: 18.06.1998 по пп.1-9;06/18/1998 according to claims 1-9; 24.09.1998 по пп.1-9;09/24/1998 according to claims 1-9; 05.02.1999 по пп.1-9.02/05/1999 according to claims 1-9.
RU2003130458/13A 1998-06-18 1999-06-16 Recombinant cell-host (variants) and bac clone RU2265054C2 (en)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US9950498A 1998-06-18 1998-06-18
US09/099,504 1998-06-18
US09/099504 1998-06-18
US10163198P 1998-09-24 1998-09-24
US60/101,631 1998-09-24
US60/101631 1998-09-24
US60/118906 1999-02-05
US60/118,906 1999-02-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2000131705/13A Division RU2234532C2 (en) 1998-06-18 1999-06-16 Nucleic acid (variants), it using for expression of epotilones, polypeptide (variants), escherichia coli microorganism clone

Publications (2)

Publication Number Publication Date
RU2003130458A RU2003130458A (en) 2005-04-20
RU2265054C2 true RU2265054C2 (en) 2005-11-27

Family

ID=35634384

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003130458/13A RU2265054C2 (en) 1998-06-18 1999-06-16 Recombinant cell-host (variants) and bac clone

Country Status (1)

Country Link
RU (1) RU2265054C2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2628097C2 (en) * 2011-06-23 2017-08-14 АрЭйчОу РЕНЬЮЭБЛС, ИНК. Recombinant cell for the production of phenolic compounds and process of producing phenolic compounds

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SCHUPT Т. et al, J.Bacteriol., vol.177, №13, 1995, p.p.3673-3679. МАНИАТИС Т. и др. Методы генетической инженерии. Молекулярное клонирование. М.: Мир, 1984, с.9, 291-332. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2628097C2 (en) * 2011-06-23 2017-08-14 АрЭйчОу РЕНЬЮЭБЛС, ИНК. Recombinant cell for the production of phenolic compounds and process of producing phenolic compounds

Also Published As

Publication number Publication date
RU2003130458A (en) 2005-04-20

Similar Documents

Publication Publication Date Title
US6858404B2 (en) Genes for the biosynthesis of epothilones
JP2006061166A (en) Gene for biosynthesis of epothilone
JP4662635B2 (en) Recombinant methods and materials for producing epothilone and epothilone derivatives
ES2233028T3 (en) FERMENTATIVE PREPARATION PROCEDURE FOR CITOSTATIC AGENTS AND CRYSTAL FORMS OF THE SAME.
KR100832145B1 (en) Production of polyketides
US7323573B2 (en) Production of polyketides
KR20010085877A (en) Polyketide synthase enzymes and recombinant dna constructs therefor
AU2001295195A1 (en) Myxococcus host cells for the production of epothilones
EP1303615A2 (en) Fermentation process for epothilones
WO2006126723A1 (en) Genetically modified microorganism and process for production of macrolide compound using the microorganism
RU2385935C2 (en) Gene cluster involves in biosynthesis of safracin and application thereof in genetic engineering
RU2265054C2 (en) Recombinant cell-host (variants) and bac clone
RU2234532C2 (en) Nucleic acid (variants), it using for expression of epotilones, polypeptide (variants), escherichia coli microorganism clone
CN100359014C (en) Novel epothilones compound and its preparation method and application
KR20130097538A (en) Chejuenolide biosynthetic gene cluster from hahella chejuensis
AU2007200160B2 (en) Heterologous production of polyketides
AU2001279025B2 (en) Fermentation process for epothilones
Julien et al. Genetic Engineering of Myxobacterial Natural Product Biosynthetic Genes
AU2001279025A1 (en) Fermentation process for epothilones

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20140617