EA038595B1 - Композиции и способы для конструирования вирусного генома in vitro - Google Patents

Композиции и способы для конструирования вирусного генома in vitro Download PDF

Info

Publication number
EA038595B1
EA038595B1 EA201791343A EA201791343A EA038595B1 EA 038595 B1 EA038595 B1 EA 038595B1 EA 201791343 A EA201791343 A EA 201791343A EA 201791343 A EA201791343 A EA 201791343A EA 038595 B1 EA038595 B1 EA 038595B1
Authority
EA
Eurasian Patent Office
Prior art keywords
seq
viral
nucleic acid
engineered
genome
Prior art date
Application number
EA201791343A
Other languages
English (en)
Other versions
EA201791343A1 (ru
Inventor
Кайл К. Кэди
Э. Магда Барбу
Кристен Г. Дипетрилло
Original Assignee
Си3Джей ТЕРАПЬЮТИКС, ИНК.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Си3Джей ТЕРАПЬЮТИКС, ИНК. filed Critical Си3Джей ТЕРАПЬЮТИКС, ИНК.
Publication of EA201791343A1 publication Critical patent/EA201791343A1/ru
Publication of EA038595B1 publication Critical patent/EA038595B1/ru

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10211Podoviridae
    • C12N2795/10221Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10211Podoviridae
    • C12N2795/10222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10321Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/14011Details ssDNA Bacteriophages
    • C12N2795/14111Inoviridae
    • C12N2795/14121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/14011Details ssDNA Bacteriophages
    • C12N2795/14111Inoviridae
    • C12N2795/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Изобретение относится к способу конструирования нуклеиновых кислот в условиях in vitro. Изобретение дополнительно относится к in vitro конструированию вирусных геномов и к улучшению вирусных свойств с помощью геномной инженерии in vitro вирусных геномов. В частности, изобретение относится к расщеплению вирусного генома в условиях in vitro с использованием РНК-направляемой Cas9, сборки рекомбинантного генома путем вставки фрагмента ДНК или РНК в расщепленный вирусный геном и трансформации клетки-хозяина рекомбинантным геномом. Данный способ также относится к конструированию in vitro для исправления ошибок в нуклеиновых кислотах.

Description

Перекрестная ссылка на родственные заявки
Настоящая заявка испрашивает приоритет в соответствии с USC 119 (е) по предварительной заявке на патент США № 62/092707, поданной 16 декабря 2014 г., предварительной заявке на патент США № 62/102362, поданной 12 января 2015 г., и предварительной патентной заявке США № 62/242811, поданной 16 октября 2015 г., полное содержание каждой из которых включено в настоящий документ посредством ссылки.
Перечень последовательностей
Настоящая заявка содержит ссылки на последовательности нуклеиновой кислоты, которые одновременно представлены в виде текстового файла с перечнем последовательностей SGI1840_3WO_Sequence_Listing_ST25.txt, с размером файла (139 кБ) в килобайтах, созданного 15 декабря 2015 г., который включен в качестве ссылки в полном объеме в соответствии со Сводом федеральных нормативных актов США, раздела 37, пункта 1.52(е) (iii) (5).
Область техники
Изобретение в основном относится к быстрому конструированию геномов и, более конкретно, к конструированию вирусных геномов in vitro.
Уровень техники
Вирусы используют во многих научных целях, особенно при разработке профилактических, терапевтических и диагностических средств. Для этих целей вирусы часто подвергают генной инженерии. Инженерия in vitro требует легко поддающегося обработке организма-хозяина и часто может занять от нескольких недель до нескольких месяцев для создания модифицированных вирусов и вирусных векторов (Levin and Bull, Nat. Rev. Microbiol., 2004 Feb; 2(2): 166-73, включенный в настоящий документ посредством ссылки). Кроме того, существуют проблемы токсичности, связанные с манипулированием многими вирусными геномами в клетках. Усилия по разработке методов генной инженерии in vitro крупных вирусных геномов до сих пор были ограничены наличием уникальных последовательностей целевых рестрикционных ферментов и низкой эффективностью, полученной для расщепления генома и последующей рекомбинантной сборки. Кроме того, многие усилия в области генной инженерии пресекаются неправильно предсказанными вирусными геномными точками окончания репликации. Например, общедоступные PB1-подобные вирусные геномы неправильно размещают концевые последовательности в середине генома, что является часто встречающейся ошибкой при использовании современных методов секвенирования и сборки генома in silico (Ceyssens et al., Environ Mibrobiol. 2009 Nov; 11(11): 2874-83).
Остается потребность в быстрой генной инженерии вирусных геномов, особенно для вирусов, инфицирующих генетически неприемлемых хозяев. Изобретение использует Cas9-опосредованное расщепление in vitro и сборку сайтспецифических модифицированных целых вирусных геномов. Настоящий способ значительно увеличивает точность, простоту и скорость, с которой вирусные геномы могут быть генетически модифицированы. Кроме того, настоящий способ преодолевает общепризнанную сложность манипулирования часто токсичными вирулентными вирусными геномами внутри нативных и гетерологичных клеток-хозяев. Использование раскрытого способа конструирования in vitro также позволяет идентифицировать подходящие вирусные геномные концы, что облегчает последующее конструирование при помощи настоящего раскрытия.
Коррекция ошибок in vitro представляет собой бесценный метод получения желаемых последовательностей после клонирования или методов сборки. Стандартные методы коррекции ошибок, основаные на ПЦР, которая имеет две неотъемлемые проблемы: 1) ПЦР может вводить дополнительные нежелательные мутации в нуклеиновую кислоту; и 2) ПЦР в этом контексте имеет ограничение по размеру приблизительно 5 т.п.н. (тысяча пар нуклеотидов), прежде чем она становится все более подверженной ошибкам (руководство по набору Quick Change site-directed mutagenesis kit, New England Biolabs, США). Поэтому стандартные методы исправления ошибок на основе ПЦР не могут быть надежно выполнены на плазмидах размером более 5 т.п.н., либо из-за дополнительных создаемых ПЦР мутаций, либо из-за невозможности амплификиции всей матрицы.
Сущность изобретения
Среди различных аспектов настоящего раскрытия представлены композиции и способы для конструирования последовательностей нуклеиновых кислот in vitro с использованием РНК-направляемой нуклеазы. В одном аспекте раскрытие относится к улучшению специфических вирусных свойств при помощи генетической инженерии in vitro последовательностей вирусных нуклеиновых кислот и к улучшенным вирусным композициям или частицам. В другом аспекте раскрытие относится к расщеплению in vitro последовательностей вирусных нуклеиновых кислот с использованием эндонуклеазы, направляемой РНК, например Cas9, с последующей сборкой последовательности рекомбинантной нуклеиновой кислоты путем вставки фрагмента(ов) ДНК или РНК в расщепленную вирусную нуклеиновую кислоту.
В некоторых вариантах реализации настоящее изобретение относится к сконструированному вирусу, содержащему сконструированную вирусную нуклеиновую кислоту, способную при введении в клетку-хозяина продуцировать не встречающиеся в природе вирусные частицы с двумя или более улучшенными вирусными свойствами по сравнению с вирусными частицами, полученными путем введения несконструированной вирусной нуклеиновой кислоты в клетку-хозяина.
- 1 038595
В некоторых аспектах полученные вирусные частицы имеют по меньшей мере три улучшенных вирусных свойства.
В некоторых аспектах каждое улучшенное вирусное свойство выбрано из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунологического надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотической сенсибилизации бактерий, модуляции вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых аспектах сконструированная вирусная нуклеиновая кислота представляет собой сконструированный вирусный геном.
В некоторых аспектах сконструированный вирусный геном представляет собой сконструированный геном бактериофага. В некоторых аспектах по меньшей мере одно из улучшенных вирусных свойств представляет собой специфичность к хозяевам.
В некоторых аспектах каждое улучшенное вирусное свойство представляет собой результат по меньшей мере одной модификации в сконструированной вирусной нуклеиновой кислоте.
В некоторых аспектах по меньшей мере одно улучшенное вирусное свойство представляет собой результат по меньшей мере двух модификаций в сконструированной вирусной нуклеиновой кислоте.
В некоторых аспектах по меньшей мере одна модификация в сконструированной вирусной нуклеиновой кислоте представляет собой результат одного этапа конструирования.
В некоторых аспектах по меньшей мере одна модификация в сконструированной вирусной нуклеиновой кислоте представляет собой результат неоднократно повторяемых этапов конструирования.
В некоторых аспектах по меньшей мере одна из модификаций находится в последовательности нуклеиновой кислоты, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 50 или SEQ ID NO: 25.
В некоторых аспектах по меньшей мере одна из модификаций находится в последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 5, SEQ ID NO: 48 или SEQ ID NO: 49.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 85% идентичности с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит весь или часть гетерологичного гена gp18. В некоторых аспектах гетерологичный ген gp18 имеет по меньшей мере 85% идентичности с SEQ ID NO: 26. В некоторых аспектах гетерологичный ген gp18 кодирует аминокислотную последовательность с по меньшей мере 85% идентичностью с SEQ ID NO: 38.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 85% идентичности с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит весь или часть сконструированного гена gp34. В некоторых аспектах сконструированный ген gp34 кодирует аминокислотную последовательность, содержащую мутацию в положении, соответствующем положению 55 аминокислоты в SEQ ID NO: 5.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 85% идентичности с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в одной или более последовательностях, имеющих по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 50. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в каждой последовательности, имеющей по меньшей мере 85% идентичности SEQ ID NO: 1, последовательности, имеющей по меньшей мере 85% идентичности SEQ ID NO: 2, последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 3 и последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 50. В некоторых аспектах модификации включают замену G на А в положении, соответствующем положению 50 нуклеиновой кислоты SEQ ID NO: 1, замену G на Т в положении, соответствующем положению 160 нуклеиновой кислоты в SEQ ID NO: 50, замену А на G в положении, соответствующем положению 245 нуклеиновой кислоты в SEQ ID NO: 2, замену AT на ТС в положениях, соответствующих положениям 247-248 нуклеиновой кислоты в SEQ ID NO: 2 и замену А на G в положении, соответствующем положению 757 нуклеиновой кислоты в SEQ ID NO: 3.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 85% идентичности с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно включает модификацию в одной или более последовательностях нуклеиновой кислоты, кодирующих аминокислотную последовательность, имеющую по меньшей мере 85% идентичности, с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 и SEQ ID NO: 48. В некоторых аспектах сконструированный вирусный геном включает модификацию в последовательности нуклеиновой кислоты, кодирующей каждую из аминокислотной последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 34,
- 2 038595 аминокислотной последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 35, аминокислотной последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 36, и аминокислотной последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 48. В некоторых аспектах модификации включают замену С на Y в положении, соответствующем аминокислотному положению 17 в SEQ ID NO: 34, замену D на Y в положении, соответствующем аминокислотному положению 36 в SEQ ID NO: 48, замену D на G в положении, соответствующем аминокислотной положению 82 в SEQ ID NO: 35, замену I на S в положении, соответствующем аминокислотному положению 83 в SEQ ID NO: 35 и замену N на D в положении, соответствующем аминокислотному положению 253 в SEQ ID NO: 36.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 85% идентичности с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в пределах последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 25. В некоторых аспектах модификация представляет собой введение гетерологичной молекулы нуклеиновой кислоты в последовательность, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 25, или замену последовательности, содержащейся в последовательности, имеющей по меньшей мере 85% идентичности с SEQ ID NO: 25 с гетерологичной молекулой нуклеиновой кислоты. В некоторых аспектах гетерологичная молекула нуклеиновой кислоты содержит гетерологичную последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 и SEQ ID NO: 20.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 85% идентичности с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в пределах последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 49. В некоторых аспектах модификация представляет собой введение гетерологичной молекулы нуклеиновой кислоты в последовательность нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 49, или замену последовательности нуклеиновой кислоты, содержащейся в последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 49 с гетерологичной молекулой нуклеиновой кислоты. В некоторых аспектах гетерологичная молекула нуклеиновой кислоты содержит гетерологичную последовательность нуклеиновой кислоты, кодирующую аминокислотную последовательность, имеющую по меньшей мере 85% идентичности, с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 46 и SEQ ID NO: 47.
В некоторых аспектах сконструированная вирусная нуклеиновая кислота содержит гетерологичную последовательность нуклеиновой кислоты, функционально связанную с промотором, содержащим последовательность нуклеиновой кислоты, содержащуюся в SEQ ID NO: 21, или ее часть.
В некоторых аспектах сконструированная вирусная нуклеиновая кислота содержит гетерологичную последовательность нуклеиновой кислоты, функционально связанную с терминатором, содержащим последовательность нуклеиновой кислоты SEQ ID NO: 22, или ее часть.
В некоторых вариантах реализации настоящее раскрытие представляет способ создания сконструированного вируса, представляющего интерес, обладающего двумя или более необходимыми вирусными свойствами, включающими: (a) предоставление первого вирусного генома; и (b) создание сконструированного вирусного генома путем объединения по меньшей мере одного фрагмента первого вирусного генома по меньшей мере с одной молекулой восстанавливающей нуклеиновой кислоты для создания второго вирусного генома, содержащего по меньшей мере одну модификацию по сравнению с первым вирусным геномом; при этом второй вирусный геном, будучи введенным в клетку-хозяина, способен продуцировать вирусные частицы с двумя или более улучшенными вирусными свойствами.
В некоторых аспектах способ дополнительно содержит (с) повторение этапов (а)-(b) в одном или более повторениях.
В некоторых аспектах каждое улучшенное вирусное свойство выбрано из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунологического надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотической сенсибилизации бактерий, модуляции вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых аспектах улучшенное свойство или улучшенные свойства и улучшенное вирусное свойство или улучшенные вирусные свойства используются взаимозаменяемо.
В некоторых аспектах создание сконструированного вирусного генома на стадии (b) включает: (1) расщепление in vitro области первого вирусного генома с использованием эндонуклеазы; и (2) сборка по
- 3 038595 меньшей мере одного фрагмента расщепленного первого вирусного генома с по меньшей мере одной молекулой восстанавливающей нуклеиновой кислоты.
В некоторых аспектах первый вирусный геном выделяют из вирусных частиц.
В некоторых аспектах первый вирусный геном или по меньшей мере одна восстанавливающая молекула нуклеиновой кислоты синтезируется в условиях de novo.
В некоторых аспектах синтез de novo включает объединение химически синтезированных молекул нуклеиновой кислоты, ПЦР-амлифицированных последовательностей нуклеиновой кислоты, расщепленных фрагментов выделенных молекул нуклеиновой кислоты или любых их комбинаций.
В некоторых аспектах первый вирусный геном или по меньшей мере одну восстанавливающую молекулу нуклеиновой кислоты амплифицируют перед расщеплением in vitro.
В некоторых аспектах первый вирусный геном по меньшей мере 3 т.п.н., по меньшей мере 10 т.п.н., по меньшей мере 18 т.п.н., по меньшей мере 25 т.п.н. или по меньшей мере 30 т.п.н.
В некоторых аспектах сборку выполняют in vitro или in vivo.
В некоторых аспектах сборку выполняют in vitro со смесью, содержащей: (а) выделенную 5'-3'экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; (b) выделенную невязкую замещающую ДНК-полимеразу с 3'-экзонуклеазной активностью или смесь указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; (с) выделенную лигазу; и (d) смесь дНТФ в условиях, эффективных для вставки фрагмента в расщепленную вирусную нуклеиновую кислоту с образованием рекомбинантной нуклеиновой кислоты, содержащей сконструированный вирусный геном.
В некоторых аспектах эндонуклеаза представляет собой РНК-направляемую нуклеазу.
В некоторых аспектах способ дополнительно включает по меньшей мере одну гидовую РНК.
В некоторых аспектах нуклеаза, управляемая РНК, представляет собой Cas9 или фермент, полученный из Cas9, и в котором по меньшей мере одна гидовая РНК включает 1) химерную гРНК или 2) сгРНК и tracrPHK.
В некоторых аспектах эндонуклеазу инактивируют нагреваением или удаляют перед сборкой.
В некоторых аспектах система расщепления in vitro дополнительно содержит спермидин.
В некоторых аспектах способ дополнительно включает трансформирование сконструированного вирусного генома в клетку-хозяина.
В некоторых аспектах способ дополнительно включает использование упаковочного набора in vitro для упаковки сконструированного вирусного генома в вирусные частицы.
В некоторых вариантах реализации настоящее раскрытие представляет собой сконструированный вирус, полученный любым из способов, описанных в настоящем документе. В некоторых аспектах сконструированный вирус представляет собой любой из сконструированных вирусов, описанных в настоящем документе.
В некоторых вариантах реализации настоящее раскрытие представляет набор для конструирования молекул вирусной нуклеиновой кислоты, содержащий: (а) очищенную рекомбинантную РНКнаправляемую нуклеазу; (b) выделенную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; (с) выделенную невытесняющую ДНК-полимеразу с 3'-экзонуклеазной активностью или смесь указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; и (d) выделенную термостабильную лигазу.
В некоторых аспектах набор дополнительно содержит один или более из: (1) краудинг-агента; (2) смеси дНТФ; и (3) подходящего буфера.
В некоторых аспектах набор дополнительно содержит специально разработанные гидовые РНК.
В некоторых аспектах набор дополнительно содержит специально разработанные синтезированные молекулы нуклеиновой кислоты, предназначенные для использования в качестве вставленного фрагмента ДНК в реакции сборки.
В некоторых аспектах набор дополнительно содержит компетентные клетки-хозяева для трансформации.
В некоторых аспектах набор дополнительно содержит выделенные вирусные геномные нуклеиновые кислоты.
В некоторых вариантах реализации изобретение представляет собой систему сконструированной вирусной нуклеиновой кислоты in vitro, содержащую выделенную вирусную нуклеиновую кислоту, рекомбинантную РНК-направляемую нуклеазу, по меньшей мере одну гидовую РНК и фрагмент нуклеиновой кислоты, который должен быть вставлен в сайт расщепления выделенной нуклеиновой кислоты.
В некоторых аспектах система такова, что рекомбинантная РНК-направляемая нуклеаза и по меньшей мере одна гидовая РНК образуют комплекс, способный расщеплять выделенную вирусную нуклеиновую кислоту.
В некоторых аспектах система дополнительно содержит спермидин.
В некоторых аспектах система дополнительно содержит выделенную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; выделенную невытесняющую ДНК-полимеразу с 3'-экзонуклеазной активностью или смесь указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не
- 4 038595 обладает З'-экзонуклеазной активностью; выделенную лигазу; и смесь дНТФ, причем система находится в условиях, которые являются эффективными для вставки фрагмента нуклеиновой кислоты в выделенную вирусную нуклеиновую кислоту в месте расщепления нуклеазой, управляемой РНК, с образованием рекомбинантной вирусной нуклеиновой кислоты.
В некоторых аспектах система, описанная в настоящем документе, такова, что рекомбинантная вирусная нуклеиновая кислота способна продуцировать вирусные частицы, не встречающиеся в природе, по меньшей мере с двумя улучшенными вирусными свойствами по сравнению с вирусными частицами, полученными из несконструированной вирусной нуклеиновой кислоты. В некоторых примерах улучшенное вирусное свойство или свойства выбраны из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунологического надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотической сенсибилизации бактерий, модуляции вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых аспектах в системе, описанной в настоящем документе, нуклеаза, управляемая РНК, представляет собой Cas9 или фермент, полученный из Cas9. В некоторых аспектах РНК-направляемую нуклеазу инактивируют или удаляют перед сборкой.
В некоторых вариантах реализации настоящее раскрытие представляет способ конструирования последовательности нуклеиновой кислоты, включающий: (а) обеспечение нуклеиновой кислоты; (b) расщепление in vitro области нуклеиновой кислоты с использованием нуклеазы, управляемой РНК; и (с) сборку рекомбинантной нуклеиновой кислоты путем вставки фрагмента ДНК в расщепленную нуклеиновую кислоту, причем сборку проводят in vitro в одном сосуде со смесью компонентов, включающих: (i) выделенную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; (ii) выделенную невытесняющую ДНК-полимеразу с 3'-экзонуклеазной активностью или смесь указанной ДНКполимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; (iii) выделенную лигазу; и (iv) смесь дНТФ в условиях, эффективных для вставки фрагмента в расщепленную нуклеиновую кислоту с образованием рекомбинантной нуклеиновой кислоты.
В некоторых аспектах нуклеаза, управляемая РНК, представляет собой Cas9 или фермент, полученный из Cas9. В некоторых примерах нуклеазу, управляемую РНК, инактивируют воздействием тепла или удаляют до сборки.
В некоторых аспектах способ дополнительно включает: (d) трансформацию рекомбинантной нуклеиновой кислоты в клетку-хозяин.
В некоторых аспектах настоящее раскрытие относится к способу получения нуклеиновой кислоты, причем нуклеиновая кислота представляет собой плазмиду, выделенную из клетки-хозяина. В некоторых аспектах плазмида составляет по меньшей мере 5 т.п.н. В некоторых аспектах плазмида составляет по меньшей мере 6 т.п.н. В некоторых аспектах плазмида составляет по меньшей мере 10 т.п.н. В некоторых аспектах плазмида составляет по меньшей мере 15 т.п.н. В некоторых аспектах плазмида составляет по меньшей мере 20 т.п.н.
Краткое описание графических материалов
На фиг. 1А-1Е показана схема процесса in vitro для прямого конструирования вирусных геномов. А) Геномы выделяют из очищенных вирусных частиц с использованием способов, известных специалистам в данной области техники. Серыми линиями показан пример дцДНК вирусного генома. Светло-серыми линиями на концах генома обозначены прямые концевые повторы, обычно встречающиеся во многих вирусных геномах. Б) Вирусные геномы затем расщепляют на одном или нескольких участках местоположения, в частности, используя нуклеазу, управляемую РНК, такую как Cas9, в сочетании с очищенными нацеливающими РНК, такими как химерные гРНК, сгРНК и tracrPHK или только сгРНК. На иллюстрации изображена РНК-направляемая нуклеаза, нацеленная на определенные вирусные геномные локализации, в соответствии с указанной РНК. В) РНК-направляемую нуклеазу инактивируют с использованием способов, известных в данной области техники, включая, но без ограничений, воздействие тепла и/или удаление с использованием классической экстракции фенол-хлороформом. Г) Вставку ДНК или РНК выполняют с использованием способов, известных в данной области техники, включая, но без ограничений, синтез in vitro, амплификацию (ПЦР) или фермент-опосредуемое освобождение от плазмид, вирусов или бактериальной геномной ДНК (гДНК). На диаграмме изображены вновь созданные вставки (темно-серые линии) с областями гомологии, соответствующими вирусным последовательностям, фланкирующим сайт(ы) расщепления РНК-направляемой нуклеазой (серые концевые области). Д) Расщепленные вирусные геномы и очищенную вставку собирают in vitro с использованием методов, известных в данной области техники, включая, но без ограничений, метод сборки Gibson Assembly, SLIC (метод безлигазного клонирования, в присутствии белка RecA) и/или сборку Golden Gate. На иллюстрации показан собранный рекомбинантный геном, который теперь содержит новую последовательность вставки (темносерые линии) в нужной локализации. Е) Рекомбинантные вирусные геномы трансформируют непосредственно в клетки-хозяева с использованием методов, известных в данной области техники, включая, но без ограничений, электропорацию или химическую трансформацию. На фигуре показано восстановление функциональных вирусных частиц после трансформации инфекционного вирусного генома в восприим- 5 038595 чивые клетки-хозяева;
на фиг. 2А-2Е - конструирование in vitro вирусного генома. А) Очистка ~ 43 т.п.н. дцДНК вирусного генома LUZ19 непосредственно от вирусных частиц. Б) Сайтспецифическое расщепление очищенного вирусного генома в двух независимых локализациях для удаления фрагмента гена gp7 с использованием РНК-зависимой нуклеазы Cas9 и in vitro транскрибируемых гРНК. В) ПЦР использовали для амплификации гена gp7 из вируса ФИР??. Г) Метод сборки in vitro Gibson Assembly использовали для последовательной специфической интеграции ПЦР-амплифицированного фрагмента гена gp7 ΦKF77 в расщепленный геном LUZ19. Д) Инфекционные геномы, собранные in vitro, трансформировали непосредственно в клетки-хозяева для восстановления функциональных вирусных частиц, что подтверждается образованием бактерий. Е) Внутренние и внешние праймеры использовали в ПЦР для проверки того, что вирусы содержат новый фрагмент ДНК в правильном геномном сайте. Все тестируемые вирусные клоны были ПЦР-положительными для новой вставки фрагмента gp7 ΦKF77 (правые 7 полос);
на фиг. 3А-3Б - создание вируса с улучшенными вирусными свойствами после in vitro вирусного геномного конструирования. А) На диаграмме показаны геномы естественного вируса LUZ19 и сконструированного производного, несущего ген gp18 вируса LKD16 вместо естественной последовательности gp18 LUZ19. Черными стрелками обозначены открытые рамки считывания LUZ19, а серой стрелкой указан недавно встроенный ген gp18 LKD16. Б) Слева на диаграмме Венна показаны общие и отдельные бактерии-хозяева, инфицированные вирусами LUZ19 и LKD16. Были протестированы разнообразные коллекции из 282 клинических изолятов P.aeruginosa. Справа на диаграмме Венна показано, что сконструированный вирус LUZ19, содержащий ген gp18 LKD16, имеет расширенный круг хозяев, включая 3 из 6 штаммов, ранее зараженных только LKD16;
на фиг. 4А-4В - схемы, демонстрирующие процесс, используемый для идентификации и выбора генетических элементов и точечных мутаций, необходимых для расширения круга хозяев и разработки способности вирусов с широким кругом хозяев заражать полный круг хозяев рода вирусов А) Схематическое представление процесса, используемого для идентификации мутаций, ответственных за специфичность к кругу хозяев. Б) На схематическом представлении изображены модификации генома, необходимые для создания вируса LUZ19 с широким кругом хозяев (ШКХ-LUZ19); звездочки (*) определяют локализацию каждой точечной мутации, связанной с кругом хозяев. Метки gp13 C17Y, gp18 D36Y, gp38 D82G и 183S, и gp40 N253D описывают генные продукты и аминокислотную точечную мутацию, связанную с расширением круга хозяев LUZ19. РА7245, РА7255, РА7410, РА7427, РА7503 и РА7686 представляют собой клинические изоляты Р.aeruginosa, восприимчивые только к LKD16 и ШКХ-LUZ19; PA7649 представляют собой клинические изоляты P.aeruginosa, чувствительные только к ΦKMV и ШКХ-LUZ19. Клинические изоляты, инфицированные после добавления данной мутации, изображены выше данной мутации. В) Слева на диаграмме Венна показаны общие и отдельные бактерии-хозяева, инфицированные вирусами LUZ19, LKD16 и ΦΚΜν. Справа на диаграмме Венна показано, что сконструированный вирус ШКХ-LUZ19, содержащий описанные выше точечные мутации, способен заразить все 67 штаммов, восприимчивых к роду вирусов ΦΚΜν;
на фиг. 5А-5Д показано, что мутация белка Gp34 LUZ19 улучшает литическую активность. А) Белок Gp34 LUZ19 является членом комплекса трубок вируса (см. вставленное изображение). Б) Анализ бляшкообразования в мягком агаре для двух связанных фагов, экспрессирующих или Gp34 LUZ19 дикого типа или Gp34 с разницей в лейцине 55 (L55A) (фаг *). Снимки были сделаны в течение двух суток и было показано, что фаг, экспрессирующий мутацию L55 Gp34, имеет зоны повышенного лизиса. В) Анализ биопленки с окрашиванием кристаллическим фиолетовым, экстраполирующий биомассу биопленки в виде измерения включения кристаллического фиолетового. Фаг LUZ19*, экспрессирующий Gp34 L55Δ, был способен лучше разрушать биопленку P.aeruginosa, предварительно сформированную в течение 8 ч по сравнению с LUZ19 дикого типа. Гентамицин в десятикратном размере минимальной ингибирующей концентрации (МИК) использовали для полного удаления биопленки. Г) На иллюстрации показано расположение мутации gp34 по сравнению с геномом LUZ19 дикого типа. Д) На таблице продемонстрирована разница в величине поглощения и величине выхода фага между LUZ19 и LUZ19, экспрессирующим Gp34 L55Δ;
на фиг. 6А-6Е представлены схемы, демонстрирующие итеративное конструирование вируса с улучшением до двух независимых свойств. А) Схематическое представление LUZ19LKD16gp18 вирусной гДНК, в которой ген gp18 LUZ19 дикого типа заменен гомологом LKD16. Черным цветом обозначена последовательность генома LUZ19 дикого типа; серым цветом- gp18 от LKD16. Б) Восприимчивость лабораторных и МЛР клинических штаммов к очищенному исходному (LKD16 и LUZ19) и сконструированному вирусу LUZ19*LKD16gp18, демонстрирующему объединение круга хозяев. В) Схематическое представление вирусной гДНК LUZ19*LKD16gp18, в которой и лейцин, закодированный в позиции 55 Gp34, был удален, а gp18 LUZ19 заменен на gp18 вируса LKD16. Черным цветом обозначена геномная последовательность LUZ19 дикого типа; серым цветом - gp18 от LKD16; серая звезда обозначает gp34^eu55. Г) Восприимчивость лабораторных и МЛР клинических штаммов к очищенному исходному (LKD16, LUZ19 и LUZ19LKDi6gpi8, содержащим gp18 из вируса LKD16) и сконструированному вирусу (LUZ19,
- 6 038595 несущему делецию лейцина, закодированную в позиции 55 GP34 и LUZ19*LKD16gp18), демонстрирующему объединение круга хозяев у вирусов LUZ19LKD16gp18 и LUZ19*LKD16gp18. Д) Оценка литической активности фага дикого типа и сконструированного фага против бактерий, прикрепленных к монослоям кератиноцитов. Количество бактерий РАО1К и РА7245, прикрепленных к клеткам, отмечали как процент от общего количества бактерий, инкубированных с монослоями кератиноцитов. Данные демонстрируют улучшенную литическую активность вирусов LUZ19* и LUZ19*LKD16gp18. Е) Улучшенное раннее разрушение 8часовой биопленки РАО1К и РА7245 при помощи сконструированного фага по сравнению с исходными вирусами. Гентамицин использовали в десятикратном размере минимальной ингибирующей концентрации для полного удаления биопленки. Приведенные данные представляют собой три независимых эксперимента, выполненных в трех повторениях. Столбцы представляют собой среднее ± СОС; * Р <0,01; ** Р <0,001; *** р <0,0001;
на фиг. 7А-7Е показаны схемы, демонстрирующие второй пример итеративного конструирования вируса с улучшением до двух независимых свойств. А) Схематическое представление LUZ19, сконструированного для экспрессии различных генетически закодированных полезных нагрузок из улучшенного локуса gp49. Ген gp49 заменяли кассетой, содержащей ген интереса (ГИ), фланкированный основным промотором и терминатором капсида (gp32) (Pgp32 и Tgp32). Использовали биопленку, диспергирующую ГИ: ЭПС-деполимеразы (Рр15gp44 - хвостовой шип gp44 из сф15 Pseudomonas pudita; NTUgp34 - хвостовой шип gp34 из фага Klebsiella pneumoniae NTUH-K2044-K1-1 (NTU); LKAlgp49 - хвостовой шип gp49 из фага Р.aeruginosa LKA1), поверхностно-активные фенол-растворимые модулины из Staphylococcus epidermidis (PSMa) и Staphylococcus aureus (PSMa3 и PSMb2) и DspB-сурфактин (дисперсин Всурфактин) из Aggregatibacter actinomycetemcomitans. Б) Анализ дисперсии биопленки, демонстрирующий активность сконструированного фага LUZ19 против 24 ч биопленки PAOIK P.aeruginosa, обработанной 100 фагами в течение 3 ч. Гентамицин использовали в десятикратном размере минимальной ингибирующей концентрации (МИК). В) Схематическое представление ранее сконструированного фага ШКХ-LUZ19, дополнительно сконструированного для экспрессии ГИ из сконструированного локуса gp49. Г) Анализ дисперсии биопленки, демонстрирующий сконструированный ШКХ-LUZ19, дополнительно модифицировали для экспрессии ферментов и сурфактинов с активностью против 24 ч биопленки P.aeruginosa PAOIK, обработанной 100 фагами в течение 3 ч. Сконструированная полезная нагрузка: ЭПС-деполимераза Рр15gp44 и SePSMa. Гентамицин использовали в десятикратном размере МИК. Д) Восприимчивость лабораторных и клинических штаммов к очищенным исходным (LKD16 и LUZ19) и производным LUZ19, демонстрирующим объединение и сохранение круга хозяев при дальнейшей разработке для экспрессии фрагментов, диспергирующих биопленку. Е) На диаграмме Венна показано сохранение круга хозяев ШКХ-LUZ19 после добавления биопленки, диспергирующей полезную нагрузку Рр5gp44 и SePSMa;
на фиг. 8А-8В представлены схемы, демонстрирующие создание вируса, способного помешать клеткам-хозяевам получить резистентность к вирусу в сочетании с субингибирующей концентрацией антибиотика. А) Схематическое изображение LUZ19 дикого типа, сконструированного для экспрессии лизинов из фага или MS2 или PRR1. Б) и В) Анализ зависимости время - летальное действие, демонстрирующие сенсибилизацию P.aeruginosa PAOIK к субингибирующим концентрациям карбенициллина (Cb - 1/5 х МИК) при помощи LUZ19, экспрессирующих лизины из оцРНК бактериофага. Эти данные демонстрируют, что сконструированный бактериофаг, экспрессирующий ненативные лизины в сочетании с субингибирующими концентрациями антибиотиков, может препятствовать быстрому приобретению резистентности бактерий к единственному вирусу;
на фиг. 9А-9Г - схемы, демонстрирующие создание 2-го вируса, способного помешать клеткамхозяевам получить вирусную резистентность. А) Схематическое изображение LUZ19 дикого типа, сконструированного для экспрессии белка бактериоцина PyoS5 из сконструированного локуса gp49. Б) Анализы зависимости время - летальное действие, демонстрирующие, что рост штамма РА7416 XRSPA был первоначально ингибирован диким типом LUZ19, однако бактерии быстро избегали вируса, что приводило к повторному росту бактерий. Приблизительно 1 х 107 КОЕ добавляли на лунку. Высокую МИ (множественность инфицирования)=10 БОЕ/КОЕ и низкую МИ=0,01 БОЕ/КОЕ указанного вируса или носителя добавляли на 0 ч. В) Тесты на поражение, демонстрирующие, что LUZ19, кодирующий PyoS5, способен ингибировать рост и повторный рост штамма РА7416 XDRPA по сравнению с вирусом дикого типа. Приблизительно 1х107 КОЕ добавляли на лунку. В течение 0 ч добавляли высокую МИ=10 БОЕ/КОЕ и низкую MOI =.01 БОЕ/КОЕ указанного вируса или носителя. Г) Сравнение роста РА7416 через 24 ч в присутствии или LUZ19 дикого типа или LUZ19+pyoS5. На графике отображены данные для эксперимента с низким МИ;
на фиг. 10 - схематический чертеж системы, включающей редактирование целевого вирусного генома с фенотипическим скринингом бактериофагов для создания генетически сконструированного бактериофага с улучшением двух или более свойств. Система опирается на неоднократное повторение этапов скрининга и секвенирования мутантных или естественных вирусов с желаемыми фенотипическими признаками и интегрированием данных признаков в одно или более вирусных шасси на одном или бо- 7 038595 лее этапах конструирования. Данный процесс обеспечивает прямой и рациональный способ быстрой идентификации генетических элементов, лежащих в основе специфического фенотипического признака бактериофага, интегрирования множественных независимых мутаций или аллелей в один геном бактериофага и создания искусственного вируса, сочетающего два или более улучшенных признака;
на фиг. 11А-11Ж показано конструирование in vitro генома фага Е.coli M13. А) Схематическое изображение умеренного фага М13mp18 и М13пяприкя Е. coli. Б) Электрофорез в геле расщепленной кольцевой геномной ДНК М13 in vitro с использованием гРНК 1 и 2 в независимых реакциях с РНКнаправляемой эндонуклеазой Cas9. На диаграмме ниже на геле показана кольцевая и линейная природа нерасщепленных и дважды расщепленных геномов М13 соответственно. Эти данные показывают, что обе гРНК точно и полностью расщепляют дцДНК М13 в заданных локализациях. В) Гель-электрофорез расщепленной кольцевой геномной ДНК М13 in vitro с использованием как гРНК, так и РНКнаправляемой эндонуклеазы Cas9, в той же реакции (двойное расщепление). На диаграмме ниже на геле показана кольцевая и линейная природа нерасщепленных и дважды расщепленных геномов М13 соответственно. Г) Гель-электрофорез, визуализирующий ПЦР полученной вставки, содержащей флуоресцентный репортер паприка. Д) Трансформация расщепленной и собранной in vitro сконструированной гДНК М13паприка в клетки E.coli для восстановления функциональных вирусных частиц. Вирусные бляшки неотчетливы и скрыты, потому что М13 является умеренным бактериофагом, который не лизирует клетки-хозяева, что приводит к плохому образованию бляшек. В качестве положительного контроля использовали нерасщепленную гДНК М13. ГДНК М13, расщепленная Cas9, но собранная в отсутствие вставки (без вставки) демонстрирует как полноту расщепления, так и низкий уровень фона. Е) Проверка при помощи ПЦР бляшек сконструированного М13паприка. Прямые и обратные праймеры были разработаны вне областей гомологии вставки. Несконструированная гДНК М13 продуцировала 0,9 т.п.н. продукт и использовалась в качестве отрицательного контроля для реакций ПЦР. Ж) Флуоресцентные (нижние) и яркие (верхние) изображения исходной и сконструированной М13паприка во время образования бляшек;
на фиг. 12А-12Д - конструирование in vitro второго генома фага Е.coli. А) Схематическое представление фага Е.coli X AcII. Линейный фаговый геном имеет размер 48,5 т.п.н. Б) Гель-электрофорез расщепленной геномной ДНК λ in vitro с использованием гРНК 1 и 2 в независимых реакциях с РНКнаправляемой эндонуклеазой. На диаграмме ниже на геле показаны линейные нерасщепленные и ожидаемые продукты расщепления. Эти данные показывают, что обе гРНК точно и полностью расщепляют дцДНК λ в заданных локализациях. В) Гель-электрофорез дважды расщепленной геномной ДНК λ in vitro с использованием как гРНК, так и РНК-направляемой эндонуклеазы в той же реакции. На диаграмме ниже на геле показаны линейные нерасщепленные и ожидаемые продукты двойного расщепления. Г) На схеме показано использование фагового упаковочного буфера фага λ для упаковки генома дикого типа и рекомбинантного фага in vitro. Cas9 с дважды расщепленным и собранным геномом фага были упакованы in vitro в соответствии с протоколом изготовителя и покрыты Е.coli для восстановления недавно сконструированного фага λ ΔοΠ. Д) ПЦР-проверка гена AcII λ. Прямой праймер был расположен снаружи от области конструирования. Делеции положительных клонов имеют ожидаемый размер 300 п.о;
на фиг. 13А-13Г - конструирование in vitro последовательностей из цитомегаловируса человека (ЦМВ). А) Схематическое изображение вирусного генома ЦМВ длиной 235 т.п.н. Сверху геном в форме сигары представляет собой полноразмерный геном, а черный раздел обозначает область манипуляции. Небольшая белая секция означает 235 п.о. вставку, добавляемую с использованием метода инженерии in vitro, описанного в настоящем документе. Б) Гель-электрофорез с дважды расщепленной плазмидой in vitro, содержащей 17,8 т.п.н. области генома ЦМВ, с использованием двух гРНК и РНК-направляемой эндонуклеазы Cas9. На диаграмме ниже на геле показаны кольцевые нерасщепленные и линейные дважды расщепленные продукты. Эти данные показывают, что обе гРНК точно и полностью расщепляют последовательность дцДНК ЦМВ в заданной локализации. В) Гель-электрофорез, визуализирующий ПЦР созданной вставки, содержащей новую последовательность вставки RL13. Г) ПЦР-проверка сконструированной последовательности ЦМВ. Прямой праймер был расположен снаружи от области конструирования. Вставки положительных клонов имеют ожидаемый размер 500 п.о;
на фиг. 14А-14Е - быстрая идентификация концов фага. А) Выделение геномной ДНК из очищенных вирусных частиц. Б) Секвенирование нового поколения гДНК (MiSeq или PacBio) и автоматическое слияние высококачественных считываний ДНК в более длинные сборки для реконструирования исходной последовательности. В светло-сером цвете - ПТП - прямые терминальные повторы. Программное обеспечение автоматическоей сборки неправильно размещает ПТП терминально повторяющихся геномов во внутренней области вирусной последовательности. Геномные физические концы подтверждены целевым расщеплением Cas9 предсказанной последовательности. В) Прогнозирование in silico физических концов генома на основе идентификации областей секвенирования двойного охвата и поиска BLAST, который соответствует близкородственному терминально повторяющемуся геному. Физические концы подтверждаются при помощи расщепления эндонуклеазой Cas9 предсказанных физических концов. Г) После инактивации Cas9 фрагменты ДНК, соответствующие геномным физическим концам, очищают и секвенируют. Д) Точная сборка генома на основе последовательности физических концов. Е)
- 8 038595
Пример картирования геномных физических концов фагов LBL3 и 14-1 (терминально повторяющихся геномов) с использованием Cas9-напраβленного расщепления в определенном положении, предсказанного при помощи реанжировки генома in silico. Светлосерыми стрелками указано на очищенные и секвенированные фрагменты ДНК;
на фиг. 15А-15В - схематическое изображение конструирования и стратегия синтеза химерной огРНК. А) На иллюстрации показано расположение мотивов NGG РАМ (темно-серые подчеркнутые последовательности) и целевых сайтов огРНК (светлосерые последовательности), фланкирующих представляющий интерес ген (ГИ). Черные последовательности обозначают оставшиеся вирусные геномные последовательности. Б) Конструирование олигонуклеотидов, используемых в качестве матриц для транскрипции огРНК in vitro. Последовательности, составляющие промотор Т7, последовательность направляющей огРНК и консервативную область химерной огРНК, обозначены соответственно подчеркнутым темно-серым, светло-серым и черным текстом. В) Схема in vitro транскрибируемой химерной огРНК. Светло-серыми и черными последовательностями указаны нацеливающие и консервативные химерные области, составляющие каждую функциональную огРНК соответственно. Все Ns обозначают вариабельные последовательности, используемые для изменения целевой специфичности каждой огРНК.
Подробное описание иллюстративных вариантов реализации изобретения
Изобретение обеспечивает композиции и способы для конструирования in vitro и дополнительно относится к улучшению вирусных свойств. Изобретение дополнительно обеспечивает способ конструирования нуклеиновых кислот in vitro.
До того как будут описаны настоящие композиции и способы, следует понимать, что это раскрытие не ограничивается конкретными композициями, способами и описанными экспериментальными условиями, поскольку такие композиции, способы и условия могут варьироваться. Следует также понимать, что используемая в настоящем документе терминология предназначена только для описания конкретных вариантов реализации изобретения и не предназначена для ограничения, поскольку объем настоящего раскрытия будет ограничен только в прилагаемой формуле изобретения.
Если не указано иное, все технические и научные термины, используемые в настоящем документе, имеют то же значение, которое обычно понимается специалистом в данной области техники, к которому относится настоящее раскрытие. Хотя любые способы и материалы, аналогичные или эквивалентные описанным в настоящем документе, могут быть использованы в практике или тестировании раскрытия, ниже описаны предпочтительные способы и материалы. Определения, изложенные ниже, предназначены для понимания раскрытия, но ни в коем случае не должны считаться заменяющими понимание терминов, которыми обладают специалисты в данной области техники.
Как используется в данном описании и приложенной формуле изобретения, формы единственного числа включают ссылки на множественное число, если из контекста явно не следует иное. Так, например, ссылки на способ включают один или более способов и/или этапы, описанные в настоящем документе, которые станут очевидными для специалистов в данной области техники после прочтения настоящего раскрытия и т.д.
Используемые в настоящем документе термины около или приблизительно при обращении к любому численному значению обозначают значение плюс или минус 10% от указанного значения. Например, около 50°С (или приблизительно 50°С) охватывает диапазон температур от 45 до 55°С включительно. Аналогично, около 100 ммоль/л (или приблизительно 100 ммоль/л) охватывает диапазон концентраций от 90 до 110 ммоль/л включительно. В качестве альтернативы около или приблизительно может означать в пределах 5% от заявленного значения, или в некоторых случаях в пределах 2,5% от заявленного значения, или около может означать округление до ближайшей значащей цифры. Все диапазоны, предусмотренные в заявке, включают значения верхнего и нижнего концов диапазона.
Термины клетки, культуры клеток, клеточная линия, клетки рекомбинантного хозяина, клетки-реципиенты и клетки-хозяева, используемые в настоящем документе, включают первичные клетки-субъекты и любое их потомство независимо от количества пассажей. Следует понимать, что не все потомства точно идентичны исходной клетке (из-за преднамеренных или непреднамеренных мутаций или различий в окружающей среде); однако такое измененное потомство включено в эти термины, при условии, что потомство сохраняет те же функциональные свойства, что и у изначально трансформированной клетки.
Термин сборка или сборка, используемый в настоящем документе, относится к соединению молекул ДНК или РНК.
Термин восстанавливающая молекула нуклеиновой кислоты, используемый в настоящем документе, относится к молекуле нуклеиновой кислоты, которая может быть собрана с одним или более фрагментами ДНК или расщеплена, или отщеплена ДНК-плазмидой или молекулой нуклеиновой кислоты ДНК, с тем чтобы создать молекулу непрерывной последовательности нуклеиновой кислоты или закрытой плазмидной ДНК.
Термины синтез de novo, сборка de novo, химический синтез и синтез ДНК относятся к способам создания последовательностей нуклеиновых кислот без необходимости использования ранее существовавшей матрицы предшественника.
- 9 038595
В тех способах изобретения, которые выполняют in vitro, все белковые компоненты выделяют и/или практически очищают. Реакции сборки in vitro не проводят в живой клетке или с необработанным клеточным экстрактом; реакции проводят в бесклеточной среде.
Функциональная молекула РНК представляет собой молекулу РНК, которая может взаимодействовать с одним или более белками, или молекулами нуклеиновой кислоты для осуществления или участия в структурной, каталитической или регуляторной функции, которая влияет на экспрессию или активность гена, или продукта гена, отличного от гена, который продуцирует функциональную РНК. Функциональной РНК может быть, например, транспортной РНК (тРНК), рибосомальной РНК (рРНК), антисмысловой РНК (асРНК), микроРНК (микро РНК), короткой шпилечной РНК (кшРНК), малой интерферирующей РНК (миРНК), гидовой РНК (гРНК), crisp РНК (сгРНК), или трансактивирующей РНК (tracrPHK) системы CRISPR, малые ядрышковые РНК (мякРНК), РНК, взаимодействующие с PIWI, (пиРНК) или рибозимом.
Термин ген широко используется для обозначения любого сегмента молекулы нуклеиновой кислоты (обычно ДНК, но необязательно РНК), кодирующего полипептид или экспрессируемую РНК. Таким образом, гены содержат последовательности, кодирующие экспрессируемую РНК (которая может содержать полипептидные кодирующие последовательности или, например, функциональные РНК, такие как рибосомные РНК, тРНК, антисмысловые РНК, микроРНК, короткие шпилечные РНК, гРНК, сгРНК, tracrPHK, рибозимы и т.д.). Гены могут дополнительно содержать регуляторные последовательности, необходимые для их экспрессии или влияющие на их экспрессию, а также последовательности, связанные с белковой или РНК-кодирующей последовательностью в ее естественном состоянии, таком как, например, интронные последовательности, 5'- или 3'-нетранслируемые последовательности и т.д. В некоторых примерах ген может относиться только к кодирующей белок части молекулы ДНК или РНК, которая может содержать или не содержать интроны. Ген предпочтительно составляет более 50 нуклеотидов в длину, более предпочтительно более 100 нуклеотидов и может быть, например, от 50 нуклеотидов до 500000 нуклеотидов в длину, например от 100 нуклеотидов до 100000 нуклеотидов в длину или от около 200 нуклеотидов до около 50 000 нуклеотидов в длину, или от около 200 нуклеотидов до около 20 000 нуклеотидов в длину. Гены могут быть получены из различных источников, включая клонирование из источника, представляющего интерес, или путем синтеза из известной или предсказанной информации о последовательности.
Термин нуклеиновая кислота или молекула нуклеиновой кислоты относится к сегменту ДНК или РНК (например, мРНК), а также включает нуклеиновые кислоты, имеющие сконструированные остовы (например, пептидные нуклеиновые кислоты, закрытые нуклеиновые кислоты) или сконструированные или неестественные нуклеотидные основания. Молекулы нуклеиновой кислоты могут быть двухцепочечными или одноцепочечными; одноцепочечная нуклеиновая кислота, которая содержит ген или его часть, может быть кодирующей (смысловой) цепью или некодирующей (антисмысловой) цепью.
Термины кодирующая последовательность или кодирующая область, используемые в настоящем документе, относятся к областям последовательности нуклеиновой кислоты, которые могут быть транскрибированы для получения функциональной РНК или транскрипта РНК, которые могут быть переведены в полипептид, когда они находятся под контролем соответствующих последовательностей контроля экспрессии и в присутствии соответствующих клеточных механизмов или ферментов. Термин некодирующая последовательность или некодирующая область относится к областям последовательности нуклеиновой кислоты, которые не транскрибируются и не транслируются в аминокислоты (например, интроны, нетранслируемые области и т.д.) или не транскрибируются или не образуют по меньшей мере часть зрелой функциональной последовательности РНК.
Используемый в настоящем документе термин белок или полипептид предназначен для охвата отдельного полипептида, а также множественных полипептидов и относится к молекуле, состоящей из мономеров (аминокислот), линейно связанных амидными связями (также известные как пептидные связи). Термин полипептид относится к любой цепи или цепям из двух или более аминокислот и не относится к определенной длине продукта. Таким образом, пептиды, дипептиды, трипептиды, олигопептиды, белок, аминокислотная цепь или любой другой термин, используемый для обозначения цепи или цепей из двух или более аминокислот, включены в определение полипептид, и термин полипептид может использоваться вместо или взаимозаменяемо с любым из этих терминов.
Молекула нуклеиновой кислоты может быть получена из указанного источника, что включает выделение (полностью или частично) сегмента нуклеиновой кислоты из указанного источника. Молекула нуклеиновой кислоты также может быть получена из указанного источника путем, например, прямого клонирования, ПЦР-амплификации или искусственного синтеза из указанного полинуклеотидного источника или на основе последовательности, связанной с указанным полинуклеотидным источником. Гены или молекулы нуклеиновой кислоты, полученные из конкретного источника или вида, также включают гены или молекулы нуклеиновой кислоты, имеющие модификации последовательности относительно исходных молекул нуклеиновой кислоты. Например, ген или молекула нуклеиновой кислоты, полученные из источника (например, конкретный упоминаемый ген), могут включать одну или более мутаций относительно исходного гена или молекулы нуклеиновой кислоты, которые непреднамеренно
- 10 038595 или намеренно введены, и если одна или более мутаций, включая замены, делеции или вставки, преднамеренно введены, изменения последовательности могут быть введены случайной или целевой мутацией клеток или нуклеиновых кислот, путем амплификации или другими методами молекулярной биологии или путем химического синтеза или любой их комбинации. Ген или молекула нуклеиновой кислоты, которая получена из упомянутого гена или молекулы нуклеиновой кислоты, которая кодирует функциональную РНК или полипептид, может кодировать функциональную РНК или полипептид, имеющий по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90% или по меньшей мере 95% идентичности последовательности с эталонной или исходной функциональной РНК или полипептидом или с его функциональным фрагментом. Например, ген или молекула нуклеиновой кислоты, которая получена из упомянутого гена или молекулы нуклеиновой кислоты, которая кодирует функциональную РНК или полипептид, может кодировать функциональную РНК или полипептид, имеющий по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичности последовательности с эталонной или исходной функциональной РНК или полипептидом или с его функциональным фрагментом.
Используемую в настоящем документе выделенную нуклеиновую кислоту или белок удаляют из его естественной среды или окружения, в котором нуклеиновая кислота или белок существуют в природе. Например, выделенный белок или молекулу нуклеиновой кислоты удаляют из клетки или организма, с которым они связаны в своей естественной или природной среде. Выделенная нуклеиновая кислота или белок может быть в некоторых случаях частично или практически очищена, но для выделения не требуется определенный уровень очистки. Так, например, выделенная молекула нуклеиновой кислоты может быть последовательностью нуклеиновой кислоты, которая была вырезана из хромосомы, генома или эписомы, которая была встроена в природе.
Очищенная молекула нуклеиновой кислоты или нуклеотидная последовательность, или белковая или полипептидная последовательность, по существу, свободна от клеточного материала и клеточных компонентов. Например, очищенная молекула нуклеиновой кислоты или белка может быть свободна от химических веществ, если не считать буфер или растворитель. Существенно свободный не означает, что другие компоненты за пределами новых молекул нуклеиновой кислоты не поддаются определению.
Термины естественного происхождения и дикого типа относятся к форме, встречаемой в природе. Например, молекула нуклеиновой кислоты естественного происхождения или дикого типа, нуклеотидная последовательность или белок могут присутствовать и могут быть выделены из природного источника и ненамеренно модифицироваться при помощи человеческих манипуляций.
Термин экспрессия, используемый в настоящем документе, включает экспрессию гена, по меньшей мере, на уровне продуцирования РНК, а продукт экспрессии включает полученный продукт, например полипептид или функциональную РНК (например, рибосомальную РНК, тРНК, антисмысловую РНК, микроРНК, кшРНК, рибозим и т.д.) экспрессируемого гена. Термин повышенная экспрессия включает изменение в экспрессии генов посредством повышения продукции мРНК и/или увеличения экспрессии полипептида. Повышенное продуцирование, когда речь идет о количестве белка или количестве активного белка в результате экспрессии генов, скорости текучести белка, состояниях активации белка и т.п., включает увеличение количества полипептидной экспрессии на уровне ферментативной активности полипептида или их комбинации по сравнению с естественным продуцированием или ферментативной активностью полипептида.
Молекула экзогенной нуклеиновой кислоты или экзогенный ген относится к молекуле нуклеиновой кислоты или гену, который был введен (трансформирован) в клетку или вирус. Трансформированным организмом можно назвать рекомбинантную клетку или вирус, в который можно ввести дополнительный экзогенный ген(ы). Потомство клетки или вируса, трансформированного молекулой нуклеиновой кислоты, также упоминается как трансформированное или рекомбинантное, если оно унаследовало молекулу экзогенной нуклеиновой кислоты. Экзогенный ген может быть от другого вида (и, следовательно, гетерологичного) или от одного и того же вида (и, следовательно, гомологичного) по отношению к трансформируемому организму. Эндогенная молекула нуклеиновой кислоты, ген или белок представляет собой нативную молекулу нуклеиновой кислоты, ген или белок, когда она встречается в организме или естественным образом продуцируется организмом.
Кроме того, термин экзогенный, используемый в настоящем документе, в контексте гена или белка, относится к генам или белкам, которые не получают из видов организма-хозяина.
Термин трансген, используемый в настоящем документе, относится к экзогенному гену, т.е. к гену, введенному в микроорганизм или предшественник путем вмешательства человека.
Используемый в настоящем документе термин ортолог гена или белка относится к его функциональному эквиваленту у другого вида.
Номера доступа генов и белков, обычно представленные в настоящем документе в скобках после имени гена или вида, являются уникальными идентификаторами для записи последовательности, общедоступной на веб-сайте Национального центра биотехнологической информации (NCBI) (ncbi.nlm.nih.gov), поддерживаемого Национальным институтом здравоохранения Соединенных Штатов. Идентификационный номер последовательности GenInfo Identifier (GI) специфичен для нуклеотидной
- 11 038595 или аминокислотной последовательности. Если последовательность изменяется каким-либо образом, назначается новый номер GI. Инструмент История изменений последовательности доступен для отслеживания различных номеров GI, номеров версий и дат обновления для последовательностей, которые отображаются в определенной записи GenBank. Поиск и получение последовательностей нуклеиновых кислот или генов, или последовательностей белка на основе номеров доступа и номеров GI хорошо известны в данной области техники, например, в клеточной биологии, биохимии, молекулярной биологии и молекулярной генетике.
Используемые в настоящем документе термины процент идентичности или гомология в отношении нуклеиновых кислот или полипептидных последовательностей определяются как процент нуклеотидных или аминокислотных остатков в последовательности-кандидате, которые идентичны с известными полипептидами после выравнивания последовательностей для максимального процента идентичности и введения гэпов, если необходимо, для достижения максимального процента гомологии. N-концевая или С-концевая вставка, или делеция не должны истолковываться как влияющие на гомологию, а внутренние делеции и/или вставки в последовательность полипептида менее чем около 30, менее чем около 20 или менее чем около 10 аминокислотных остатков не должны быть истолкованы как влияющие на гомологию. Гомологию или идентичность на уровне нуклеотидов или аминокислотных последовательностей можно определить с помощью анализа BLAST (средство поиска основного локального выравнивания) с использованием алгоритма, используемого программами blastp, blastn, blastx, tblastn и tblastx (Altschul (1997), Nucleic Acids Res. 25, 3389-3402, и Karlin (1990), Proc. Natl. Acad. Sci. USA 87, 22642268), которые предназначены для поиска сходства последовательностей. Подход, используемый программой BLAST, заключается в том, чтобы сначала рассмотреть аналогичные сегменты с гэпами и без них между запрашиваемой последовательностью и последовательностью базы данных, затем оценить статистическую значимость всех идентифицируемых совпадений и, наконец, суммировать только те соответствия, которые удовлетворяют предварительно выбранному порогу значимости. Для обсуждения основных проблем поиска сходства баз данных последовательностей см. Altschul (1994), Nature Genetics 6, 119-129. Параметры поиска для гистограмм, описаний, выравниваний, ожиданий (т.е. порог статистической значимости для сопоставления отчетов по последовательностям базы данных), обрезание, матрица и фильтр (низкая сложность) могут быть в настройках по умолчанию. Матрица выравнивания весов по умолчанию, используемая blastp, blastx, tblastn и tblastx, представляет собой матрицу BLOSUM62 (Henikoff (1992), Proc. Natl. Acad. Sci. USA 89, 10915-10919), рекомендованную для запрашиваемых последовательностей длиной более 85 (нуклеотидных оснований или аминокислот).
Для blastn, предназначенного для сравнения нуклеотидных последовательностей, матрица подсчета определяется отношениями М (т.е. оценкой вознаграждения для пары сопоставимых остатков) к N (т.е. оценкой штрафа за несоответствующие остатки), где значения по умолчанию для М и N могут быть +5 и -4 соответственно. Четыре параметра blastn можно настроить следующим образом: Q=10 (штраф за создание гэпа); R=10 (штраф за продолжение гэпа); wink=1 (генерирует попадания слов в каждом просматриваемом в данный момент положении вдоль запроса); и gapw=16 (задает ширину окна, в которой создаются выравнивания гэпов). Эквивалентные параметры параметра Blastp для сравнения аминокислотных последовательностей могут быть: Q=9; R=2; wink=1; и gapw=32. Сравнение Bestfit между последовательностями, доступными в пакете GCG версии 10.0, может использовать параметры ДНК GAP=50 (штраф за создание гэпа) и LEN=3 (штраф за расширение гэпа), а эквивалентные настройки в сравнении с белками могут быть GAP=8 и LEN=2.
Таким образом, когда речь идет о последовательностях полипептида или нуклеиновой кислоты согласно настоящему изобретению включают идентичности последовательностей по меньшей мере 40%, по меньшей мере 45%, по меньшей мере 50%, по меньшей мере 55%), по меньшей мере 70%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80% или по меньшей мере 85%), например, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%), по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или около 100% идентичности последовательности с полноразмерным полипептидом или последовательностью нуклеиновой кислоты или их фрагментами, содержащими непрерывную последовательность по меньшей мере в 100, по меньшей мере в 125, по меньшей мере в 150 или более аминокислотных остатков всего белка; варианты таких последовательностей, например, в которых по меньшей мере один аминокислотный остаток был вставлен в N-и/или С-конец и/или в пределах раскрытой последовательности(ей), которые содержат(ит) вставку и замену. Рассмотренные варианты могут дополнительно или поочередно включать те, которые содержат предопределенные мутации, например, путем гомологичной рекомбинации или сайт-направленного или ПЦР-мутагенеза и соответствующих полипептидов или нуклеиновых кислот других видов, включая, но без ограничений, описанные в настоящем документе аллели или другие природные варианты семейства полипептидов или нуклеиновых кислот, которые содержат вставку и замену; и/или производные, в которых полипептид ковалентно модифицирован путем замены, химическим, ферментативным или другим подходящим способом с остатком, отличным от природной аминокислоты, которая содержит вставку и замену (например, детекти
- 12 038595 руемый фрагмент, такой как фермент).
Термин нативный, используемый в настоящем документе, для обозначения последовательностей нуклеиновых кислот или аминокислотных последовательностей, поскольку они естественно происходят в организме хозяина, в организме или вирусе. Термин ненативный, используемый в настоящем документе, для обозначения последовательностей нуклеиновых кислот или аминокислотных последовательностей, которые не встречаются естественным образом у хозяина, в организме или вирусе. Последовательность нуклеиновой кислоты или аминокислотная последовательность, которая была удалена из клетки или вируса, подвергнута лабораторной манипуляции и введена или повторно введена в клетку-хозяин или вирус, считается ненативной. Синтетические или частично синтетические гены, вводимые в клетку-хозяин или вирус, являются ненативными. Ненативные гены дополнительно включают гены, эндогенные к вирусу, функционально связанному с одной или более гетерологичными регуляторными последовательностями, которые были рекомбинированы в геном хозяина.
Рекомбинантная или сконструированная молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая была изменена путем манипулирования, осуществленным человеком. В качестве неограничивающих примеров рекомбинантная молекула нуклеиновой кислоты включает любую молекулу нуклеиновой кислоты, которая: 1) была частично или полностью синтезирована или модифицирована in vitro, например с использованием химических или ферментативных методик (например, с использованием синтеза химической нуклеиновой кислоты или с использованием ферментов для репликации, полимеризации, расщепления (экзонуклеолитического или эндонуклеолитического) лигирования, обратной транскрипции, транскрипции, модификации оснований (включая, например, метилирование), интеграции или рекомбинации (включая гомологичную и сайт-специфическую рекомбинацию) молекул нуклеиновых кислот); 2) включает соединенные нуклеотидные последовательности, которые не соединены в природе; 3) была сконструирована с использованием методик молекулярного клонирования, так что она не имеет одного или более нуклеотидов по отношению к естественной последовательности молекулы нуклеиновой кислоты; и/или 4) была подвергнута манипулированию с использованием методик молекулярного клонирования, так что она имеет одно или более изменений последовательности или перегруппировок по отношению к естественной последовательности нуклеиновой кислоты. В качестве неограничивающих примеров кДНК представляет собой рекомбинантную молекулу ДНК, как и любая молекула нуклеиновой кислоты, которая была получена полимеразной реакцией(иями) in vitro полимеразы или к которой присоединены линкеры или которые были интегрированы в вектор, такой как вектор клонирования или вектор экспрессии.
Используемый в настоящем документе термин рекомбинантный белок относится к белку, полученному при помощи генной инженерии.
При применении к организмам или вирусам термин рекомбинантный, сконструированный или генетически сконструированный относится к организмам или вирусам, на которых воздействовали путем вставки гетерологичной или экзогенной (например, ненативной) рекомбинантной последовательности нуклеиновой кислоты в организм или вирус и включает, без ограничений, нокауты генов, целевые мутации и замену гена, замену, делецию или вставку промотора или перенос молекулы нуклеиновой кислоты, например трансгена, синтетического гена, промотора или другой последовательности в организм или вирус. Рекомбинантные или генетически сконструированные организмы или вирусы также могут быть организмами или вирусами, в которые были введены конструкции для нокдауна гена. Такие конструкции включают, но без ограничений, одну или более гидовых РНК, РНКи, микроРНК, кшРНК, миРНК, антисмысловых и рибозимных конструкций. Также включены организмы или вирусы, чьи геномы были изменены действием нуклеаз Cas, мегануклеаз или цинковопальцевых нуклеаз. Молекула экзогенной или рекомбинантной нуклеиновой кислоты может быть интегрирована в рекомбинантный/генетически сконструированный вирус или геном организма, или в других случаях не интегрирована в рекомбинантный/генетически сконструированный вирус или геном организма. Используемый в настоящем документе термин рекомбинантный вирус или рекомбинантная клетка-хозяин включает потомство или производные рекомбинантного вируса согласно настоящему раскрытию. Поскольку определенные изменения могут произойти в последующих поколениях из-за мутации или воздействия, или влияния окружающей среды, такое потомство или производные могут фактически не совпадать с родительской клеткой, но все еще включены в объем термина, как он используется в настоящем документе.
Используемый в настоящем документе термин этап конструирования относится к выполнению любого способа инженерии, раскрытого в настоящем документе или известного в данной области техники. Например, и этап конструирования может представлять собой один раунд интересующего инженерного способа, такого как, например, один раунд описанного в настоящем изобретении способа конструирования in vitro, один ПЦР-опосредованный мутагенез или одна реакция лигирования, объединяющая две части ДНК вместе. Аналогичным образом, неоднократное повторение этапов конструирования означает выполнение способа конструирования два или более последовательных раз.
Термин гетерологичный при использовании в отношении полинуклеотида, гена, нуклеиновой кислоты, полипептида или фермента относится к полинуклеотиду, гену, нуклеиновой кислоте, полипептиду или ферменту, который не является производным от вида хозяина. Например, гетерологичный ген или
- 13 038595 гетерологичная последовательность нуклеиновой кислоты, как используется в настоящем документе, относится к последовательности гена или нуклеиновой кислоты от разных видов, чем к видам организмахозяина или вируса, в который он введен. Когда речь идет о регуляторной последовательности гена или к вспомогательной последовательности нуклеиновой кислоты, используемой для регуляции экспрессии генной последовательности (например, 5'-нетранслируемая область, 3'-нетранслируемая область, последовательность добавления поли-А, последовательность интрона, сайт сплайсинга, сайт связывания рибосом, внутренняя входная последовательность рибосом, область гомологии генома, сайт рекомбинации и т.д.) или последовательности нуклеиновой кислоты, кодирующей домен белка или последовательность локализации белка или белка, гетерологичная означает, что регуляторная или вспомогательная последовательность или последовательность, кодирующая белковый домен или последовательность локализации, из другого источника, чем ген, с которым регуляторная или вспомогательная последовательность нуклеиновой кислоты или последовательность нуклеиновой кислоты, кодирующая белковый домен или последовательность локализации, сопоставляются в геноме, хромосоме или эписоме. Таким образом, промотор, функционально связанный с геном, к которому он не функционально связан в своем естественном состоянии (например, в геноме генетически несконструированного организма или вируса), в настоящем документе упоминается как гетерологичный промотор, даже хотя промотор может быть получен из одного и того же вида (или, в некоторых случаях, одного и того же организма или вируса) в качестве гена, с которым он связан. Аналогично, когда речь идет о последовательности локализации белка или белкового домена сконструированного белка, гетерологичный означает, что последовательность локализации или белковый домен получают из белка, отличного от белка, в который он включен при помощи методов генной инженерии.
Регуляторная последовательность, регуляторный элемент или последовательность регуляторных элементов относится к нуклеотидной последовательности, расположенной выше (5'), в пределах или ниже (3') кодирующей последовательности. Транскрипция кодирующей последовательности и/или трансляция молекулы РНК в результате транскрипции кодирующей последовательности обычно зависит от наличия или отсутствия регуляторной последовательности. Данные последовательности регуляторных элементов могут содержать промоторы, цис-элементы, энхансеры, терминаторы или интроны. Регуляторные элементы могут быть выделены или идентифицированы из нетраслируемых областей (НТО) из конкретной полинуклеотидной последовательности. Любой из описанных в настоящем документе регуляторных элементов может присутствовать в химерном или гибридном регуляторном экспрессирующем элементе. Любой из описанных в настоящем документе регуляторных элементов может присутствовать в рекомбинантной конструкции согласно настоящему изобретению.
Термины промотор, область промотора или последовательность промотора относятся к последовательности нуклеиновой кислоты, способной связывать РНК-полимеразу с инициацией транскрипции гена в направлении от 5' к 3' (в прямом направлении). Ген находится под контролем или регулируется промотором, в том случае, когда связывание РНК-полимеразы с промотором является непосредственной причиной транскрипции указанного гена. Промотор или промоторная область обычно обеспечивает сайт распознавания для РНК-полимеразы и другие факторы, необходимые для правильной инициации транскрипции. Промотор может быть выделен из 5'-нетранслируемой области (5' НТО) геномной копии гена. Альтернативно, промотор может быть синтетически получен или сконструирован путем изменения известных элементов ДНК. Также рассмотрены химерные промоторы, которые объединяют последовательности одного промотора с последовательностями другого промотора. Промоторы могут быть определены по их профилю экспрессии гена, основанной, например, на метаболических, экологических или связанных с развитием условиях. Промотор может быть использован как регуляторный элемент для модуляции экспрессии функционально связанной транскрибируемой полинуклеотидной молекулы, например, кодирующей последовательности. Промоторы могут содержать, помимо последовательностей, распознаваемых РНК-полимеразой и, предпочтительно, другие факторы транскрипции, элементы регуляторной последовательности, такие как цис-элементы или энхансерные домены, которые влияют на транскрипцию функционально связанных генов. Вирусный промотор является нативным или ненативным промотором, который инициирует транскрипцию одного или более генов, расположенных в вирусном геноме.
Используемый в настоящем документе термин конститутивный промотор относится к промотору, который активен в большинстве условий окружающей среды и развития. Конститутивный промотор активен независимо от окружающей среды, такой как освещение и композиция культуральной питательной среды. В некоторых примерах конститутивный промотор активен в присутствии и в отсутствие питательного вещества. Например, конститутивный промотор может быть промотором, который является активным (опосредует транскрипцию гена, с которым он функционально связан), в условиях истощения азота, а также в условиях, когда азот не ограничен (условия насыщения азотом). Напротив, индуцируемый промотор является промотором, который активен в ответ на конкретные условия окружающей среды, такие как наличие или отсутствие питательного вещества или регулятора, наличие света и т.д.
Используемый в настоящем документе термин функционально связанный обозначает конфигурацию, в которой контрольная последовательность помещается в соответствующее положение относитель
- 14 038595 но кодирующей последовательности полинуклеотидной последовательности, так что контрольная последовательность направляет или регулирует экспрессию кодирующей последовательности полипептида и/или функциональной РНК). Таким образом, промотор находится в функциональной связи с последовательностью нуклеиновой кислоты, если он может опосредовать транскрипцию последовательности нуклеиновой кислоты. При введении в клетку-хозяина кассета экспрессии может приводить к транскрипции и/или трансляции закодированной РНК или полипептида в соответствующих условиях. Антисмысловые или смысловые конструкты, которые не транслируются или не могут быть транслированы, не исключены данным определением. В случае как экспрессии трансгенов, так и подавления эндогенных генов (например, антисмысловыми или РНКи) любой специалист определит, что вставленная полинуклеотидная последовательность не обязательно должна быть идентичной, но может быть только по существу идентичной последовательности гена, из которого она была получена. Как поясняется в настоящем документе, эти по существу идентичные варианты конкретно покрыты ссылкой на конкретную последовательность нуклеиновой кислоты.
Термин селективный маркер или селективный маркерный ген, используемый в настоящем документе, включает любой ген, который придает фенотип клетке, в которой он экспрессируется, для облегчения отбора клеток, которые трансфецированы или трансформированы конструкцией нуклеиновой кислоты согласно изобретению. Данный термин также может быть использован для обозначения генных продуктов, которые осуществляют указанные фенотипы. Неограничивающие примеры выбираемых маркеров включают: 1) гены, придающие устойчивость к антибиотикам, таким как амикацин (aphA6), ампициллин (ampR), бластицидин (bis, bsr, bsd), блеомицин или флеомицин (ZEOCIN™) (ble), хлорамфеникол (cat), эметин (RBS14p или cry 1-1), эритромицин (ermE), G418 (GENETICIN™) (neo), гентамицин (аас3 или аасС4), гигромицин В (aphIV, hph, hpt), канамицин (nptll), метотрексат (DHFR mtxR), пенициллин и другие β-лактамы (β-лактамазы), стрептомицин или спектиномицин (aadA, spec/strep) и тетрациклин (tetA, tetM, tetQ); 2) гены, придающие толерантность к гербицидам, таким как аминотриазол, амитрол, анримид, арилоксифеноксипропионаты, атразины, бипиридиуты, бромоксинил, циклогександиеноксима далапон, дикамба, дикфоп, дихлорфенилдиметилмочевина (ДКМ), дифунон, дикетонитрилы, диурон, флуридон, глюфозинат, глифосат, галогенированные гидробензонитрилы, галоксифоп, 4-гидроксипиридины, имидазолиноны, изоксасфлутол, изоксазолы, изоксазолидиноны, мирамид В, п-нитродифениловые эфиры, норфлуразон, оксадиазолы, м-феноксибензамиды, N-фениламиды, пиноксадин, ингибиторы протопорфириогеноксидазы, пиридазиноны, пиразолинаты, сульфонилмочевины, 1,2,4-триазолпиримидин, трикетоны или мочевина; ацетил-KoA-карбоксилаза (АККаза); синтаза ацетогидроксикислоты (ahas); ацетолактатсинтаза (a/s, csrl-1, csrl-2, imr1, imr2), аминогликозид-фосфотрансфераза (apt), антранилатсинтаза, бромоксинилнитрилаза (bxn), цитохром Р450-НАДФ-цитохром Р450-оксидоредуктаза, далапон-дегалогеназа (dehal), дигидроптероат-синтаза (sul), 5-енолпирувалшикимат-3-фосфатсинтаза класса I (EPSPS), класс II EPSPS (aroA), не I/II классов EPSPS, глутатионредуктаза, глифосат-ацетилтрансфераза (gat), глифосат-оксидоредуктаза (gox) гидроксифенилпируватдегидрогеназа, гидроксифенилпируватдиоксигеназа (hppd), изопренилпирофосфат-изомераза, ликопенциклаза, фосфинотрицин-ацетилтрансфераза (pat, bar), фитоэндезатураза (crtl), пренилтрансфераза, протопорфириноксидаза, полипептид psbA фотосистемы II (psbA) и эстераза SMM (SulE) супероксиддисмутаза (sod); 3) гены, которые могут быть использованы в ауксотрофных штаммах или для придания других метаболических эффектов, таких как arq7, his3, hisD, hisG, lysA, manA, metE, nit1, trpB, ura3, xylA, ген дигидрофолатредуктазы, манноза-6фосфат-изомеразы, ген нитратредуктазы или ген орнитиндекарбоксилазы; фактор негативного отбора, такой как тимидинкиназа; или факторы устойчивости к токсину, такие как ген устойчивости к дезоксиглюкозе.
Репортерный ген представляет собой ген, кодирующий белок, который обнаруживается или обладает активностью, которая продуцирует детектируемый продукт. Репортерный ген может кодировать визуальный маркер или фермент, который продуцирует детектируемый сигнал, такой как cat, lacZ, uidA, xylE, ген щелочной фосфатазы, ген α-амилазы, ген α-галактозидазы, ген β-глюкуронидазы, ген βлактамазы, гена пероксидазы хрена, ген люциферина/люциферазы, ген R-локуса, гена тирозиназы или ген, кодирующий флуоресцентный белок, включая, но без ограничений, синий, голубой, зеленый, красный, паприка или желтый флуоресцентный белок, фотоотверждаемый, фотографируемый или оптический флуоресцентный белок с подсветкой или любым из его вариантов, включая, без ограничений, оптимизированный по кодону, с быстрым сворачиванием, мономерный, с повышенной стабильностью и варианты с усиленной флуоресценцией.
Термин РНК-направляемая нуклеаза или РНК-направляемая эндонуклеаза, используемый в настоящем документе, относится к ферменту, расщепляющему нуклеиновую кислоту, который нацелен на целевой сайт расщепления при помощи одной или более гидовых РНК. Неограничивающие примеры РНК-направляемых нуклеаз включают Cas9, Cpf1, C2c1, C2c2 и С2с3.
Термин терминатор или терминаторная последовательность или терминатор транскрипции, используемый в настоящем документе, относится к регуляторной части генетической последовательности, которая вызывает прекращение транскрипции РНК-полимеразой.
- 15 038595
Термины введение в клетку-хозяин и трансформация, используемые в настоящем документе, относятся к введению одной или более экзогенных последовательностей нуклеиновых кислот или полинуклеотидов в клетку-хозяин или организм с использованием одного или более физических, химических или биологических методов. Физические и химические методы трансформации (т.е. трансфекция) включают в качестве неограничивающего примера электропорацию, бомбардировку частицами, химически-индуцированную компетентность и доставку липосом. Биологические методы трансформации (т.е. трансдукция) включают передачу ДНК с использованием вирусов или микроорганизмов (например, Agrobacterium).
Используемый в настоящем документе термин конструирование генома относится к определению желаемой последовательности нуклеиновой кислоты конечного генома, представляющего интерес. Конструирование может быть основано на базовых знаниях, литературных источниках, экспериментальных данных или любой их комбинации.
Используемый в настоящем документе термин рекомбинантный или сконструированный, когда речь идет о молекуле нуклеиновой кислоты, белке, вирусной частице или их комбинации, означает не имеющую природное происхождение молекулу нуклеиновой кислоты, белок, вирусную частицу или их комбинацию, полученную посредством манипуляции, осуществляемой человеком. В качестве неограничивающих примеров рекомбинантная или сконструированная молекула нуклеиновой кислоты включает любую молекулу нуклеиновой кислоты, которая: 1) была частично или полностью синтезирована или модифицирована in vitro, например, с использованием химических или ферментативных методик (например, с использованием синтеза химической нуклеиновой кислоты или с использованием ферментов для репликации, полимеризации, расщепления (экзонуклеолитического или эндонуклеолитического) лигирования, обратной транскрипции, транскрипции, модификации оснований (включая, например, метилирование), интеграции или рекомбинации (включая гомологичную и сайт-специфическую рекомбинацию) молекул нуклеиновых кислот); 2) включает соединенные нуклеотидные последовательности, которые не соединены в природе, 3) была сконструирована с использованием методик молекулярного клонирования, так что она не имеет одного или более нуклеотидов по отношению к естественной последовательности молекулы нуклеиновой кислоты; и/или 4) была подвергнута воздействию с использованием методик молекулярного клонирования, так что она имеет одно или более изменений последовательности или перегруппировок по отношению к естественной последовательности нуклеиновой кислоты. В качестве неограничивающих примеров кДНК представляет собой рекомбинантную молекулу ДНК, как и любая молекула нуклеиновой кислоты, которая была получена при помощи полимеразной реакции(ий) in vitro или к которой присоединены линкеры или которые были интегрированы в вектор, такой как вектор клонирования или вектор экспрессии. Рекомбинантная или сконструированная РНК или белок представляет собой рекомбинантную или сконструированную РНК или белок, которая транскрибируется или транслируется соответственно из рекомбинантной или сконструированной молекулы нуклеиновой кислоты. Рекомбинантная или сконструированная вирусная частица или вирус получают из сконструированной вирусной последовательности или вирусного генома.
Термин вирусный геном относится к полному генетическому комплементу, содержащемуся в одной или более молекулах ДНК или РНК в вирусной частице, включая гены и некодирующие последовательности. Термин сконструированный вирусный геном относится к не встречающему в природе вирусному геному, который является результатом манипуляции, осуществляемой человеком, и способен продуцировать вирусные частицы, не встречающиеся в природе, после введения в совместимую клеткухозяина.
Термин вирусная нуклеиновая кислота относится к нуклеиновой кислоте, содержащей последовательность, полученную из вирусного генома. Вирусная нуклеиновая кислота может содержать целый вирусный геном или часть вирусного генома. Вирусные нуклеиновые кислоты могут кодировать аминокислотные последовательности, содержащие вирусные белки. В некоторых случаях нативные, зрелые белки или полипептидные последовательности, кодируемые данной открытой рамкой считывания, не могут быть определены или охарактеризованы. Аминокислотные последовательности, представленные в настоящем документе, которые кодируются последовательностями вирусной нуклеиновой кислоты, которые могут содержать сайт, подходящий для мутации (такой как изменение, делеция или замена) или вставку гетерологичных последовательностей, могут быть раскрыты в настоящем документе как кодирующие аминокислотные последовательности, которые могут содержать весь или часть вирусного полипептида или белка.
Термины вирусная частица и вирион относятся к независимой форме, в которой существует вирус, когда он не находится внутри инфицированной клетки или в процессе заражения клетки. Данные вирусные частицы (вирионы) состоят или из генома ДНК, или из РНК, окруженного белковой оболочкой, называемой капсидой. Некоторые вирионы также имеют дополнительную липидную оболочку, как внутри, так и снаружи оболочки капсидного белка. Термины вирусная частица, вирион и вирус могут использоваться взаимозаменяемо.
Используемый в настоящем документе термин вирусное свойство относится к любому аспекту репликации вируса или жизненного цикла или к аспекту, который возникает в результате репликации
- 16 038595 вируса или жизненного цикла. Используемый в настоящем документе термин вирусное свойство часто относится к свойствам, которые могут быть изменены или сконструированы посредством вмешательства человека для достижения желаемого результата. Неограничивающие примеры вирусных свойств включают специфичность к кругу хозяев, вирусный литический цикл, адсорбцию, прикрепление, инъекцию, репликацию и сборку, лизис, величину выхода фага, ускользание от иммунологического надзора, иммунную стимуляцию, иммунную дезактивацию, дисперсию биопленки, устойчивость к бактериальному фагу, антибиотической сенсибилизации бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина. В некоторых аспектах улучшенное свойство или улучшенные свойства и улучшенное вирусное свойство или улучшенные вирусные свойства используются взаимозаменяемо.
Термины бактериофаг и фаг могут использоваться взаимозаменяемо и относятся к вирусу, который заражает бактерии.
Системы CRISPR.
CRISPR (короткие палиндромные повторы, регулярно расположенные группами) представляют собой локусы ДНК, содержащие короткие повторы последовательностей оснований. За каждым повтором следуют короткие сегменты спейсерной ДНК от предыдущих воздействий на мобильные генетические элементы. CRISPR обнаруживают в около 40% секвенированных геномов бактерий и 90% секвенированных архей. CRISPR часто ассоциируются с CRISPR-ассоциированными (cas) генами, которые кодируют белки, связанные с функцией CRISPR. Система CRISPR-Cas представляет собой прокариотическую иммунную систему, которая обеспечивает устойчивость к чужеродным генетическим элементам, таким как плазмиды и фаги, и обеспечивает форму приобретенного иммунитета. CRISPR-спейсеры кодируют малые стРНК последовательность которых специфически ориентирует эндонуклеазы Cas на целевые последовательности и разрезает эти экзогенные генетические элементы способом, аналогичным РНКи в эукариотических организмах.
Системы типа II CRISPR-Cas использовали для редактирования генов и регуляции генов у многих видов. Эти системы особенно полезны, потому что они требуют только одну эндонуклеазу Cas (Cas9) и нацеливающую сгРНК. В природных системах эндонуклеаза Cas9 требует две независимо транскрибируемые РНК для активности, однако эти две РНК также могут быть ковалентно связаны с образованием одной химерной гРНК. Обеспечивают белком Cas9 и соответствующими гРНК клетку, геном организма можно разрезать в любом необходимом месте. Системы CRISPR-Cas представляют собой РНКнаправляемую систему защиты, которая защищает от вирусов, плазмид и других мобильных генетических элементов. Данный защитный путь имеет три этапа. Во-первых, копия встраивающейся нуклеиновой кислоты интегрируется в массив CRISPR. Затем массив CRISPR транскрибируется в большой транскрипт CRISPR и затем процессируется в зрелые сгРНК. Затем сгРНК вводят в эффекторные комплексы, причем сгРНК направляет комплекс к встраивающейся нуклеиновой кислоте, а белки Cas деградируют данную нуклеиновую кислоту. Как указано выше, для нативной системы CRISPR-Cas II типа требуется как транс-активирующая сгРНК (tracrPHK), так и пре-crPHK для активации Cas9. TracrPHK является комплементарной к и комплементарной парами оснований с пре-crPHK, образующей дуплекс РНК. Он расщепляется РНКазой III, РНК-специфической рибонуклеазой, с образованием гибрида crPHK/tracrPHK. Этот гибрид выступает в качестве направляющего для эндонуклеазы Cas9, которая расщепляет встраивающуюся нуклеиновую кислоту, образующую двухцепочечный разрыв в встраивающейся ДНК для защиты клетки-хозяина. Cas9-опосредовαнное расщепление строго зависит от наличия мотива, смежного с протоспейсером, (РАМ) в целевой нуклеиновой кислоте. Возможность программировать Cas9 для расщепления определенных сайтах, определяемых гидовыми РНК, привела к принятию его в качестве универсальной платформы для конструирования генома и генной регуляции. Данный способ конструирования генома описан в публикации заявки на патент США № 2014/0068797, опубликованной 6 марта 2014 года, 2014/0170753, опубликованной 19 июня 2014 года и 2014/0273037 и 2014/0273226, обе из которых опубликованы 18 сентября 2014 года, все из которых включены в качестве ссылки.
Были описаны другие программируемые системы CRISPR-Cas, которые могут быть использованы для геномной инженерии, включая системы Cpf1, C2c1, С2с2 и С2сЗ. Система Cpf1 представляет собой систему CRISPR V типа и опосредует расщепление ДНК с липкими концами с помощью одной РНК, ориентированной на нацеливание (Zetsche et al., Cell (2015) 163, 1-13) (включен посредством ссылки). C2c1 и С2сЗ являются одновременно системами CRISPR V типа, тогда как С2с2 предлагается быть системой CRISPR VI типа (Shmakov et al., Molecular Cell (2015) 60, 1-13) (включен в качестве ссылки).
Сборка ДНК.
Существуют различные методы, известные в данной области техники для сборки ДНК во время генной инженерии. Двухстадийный метод на основе термоциклов использовали для сборки частей гена М.genitαlium, как описано в Gibson D.G. et al., Complete chemical synthesis, assembly, and cloning of a Mycoplasma genitalium genome. Science (2008) 319: 1215-1220 (включена в качестве ссылки) и публикации РСТ WO 2009/103027 (включены в качестве посредством ссылки). Другой подход описан Li M.Z. et al., Nature Meth. (2007) 4: 251-256 (включен посредством ссылки). Одностадийный способ сборки с исполь
- 17 038595 зованием 5' экзонуклеазы Т7 и одноцепочечного ДНК-связывающего белка раскрыт в публикации РСТ WO 2006/021944 (включена посредством ссылки). В настоящее время хорошо известны комбинаторные методики сборки химических соединений для использования при высокопроизводительном скрининге. Кроме того, в течение ряда лет практикуют методики перетасовки генов, в которых кодирующие последовательности случайным образом фрагментируют и повторно отжигают. Например, протоколы для создания библиотек фрагментов химерных генов описаны в Meyer M. и др. Combinatorial Recombination of Gene Fragments to Construct a Library of Chimeras Current Protocols in Protein Science (2006) 26.2.126.2.17; McKee A.E. et al., JBEI abstract. Методики сборки различных компонентов в полные или минимальные геномы были установлены. Например, публикация патента США 2000/0264688 (включена посредством ссылки), опубликованная 15 ноября 2007 г., описывает способы конструирования синтетического генома путем создания и сборки кассет, содержащих части генома. Поэтапный иерархический способ сборки нуклеиновых кислот описан в публикации патента США № 2007/004041 (включен посредством ссылки), опубликованной 4 января 2007 года.
Кроме того, метод одного сосуда для сборки ДНК описан в публикации заявки на патент США № 2010/0035768 и 2012/0053087, опубликованы 11 февраля 2010 года и 1 марта 2012 года соответственно, обе из которых включены посредством ссылки. Данный метод был назван методом сборки Gibson Assembly и позволяет успешно собрать несколько фрагментов ДНК, независимо от длины фрагмента или конечной совместимости. Реакция сборки Gibson Assembly проводится в одном сосуде в изотермических условиях с использованием трех ферментативных активностей: 5'-экзонуклеаза образует длинные липкие концы, полимераза заполняет промежутки отожженных одноцепочечных областей, а ДНК-лигаза лигирует разрывы отжигом и заполнением промежутков. Данный метод был широко принят и является основной рабочей лошадкой проектов в области синтетической биологии во всем мире. Применяя эту методологию, митохондриальный геном мыши размером 16,3 т.п.н. был собран из 600 перекрывающихся 60 мономеров. В комбинации со сборкой in vivo у дрожжей, метод сборки Gibson Assembly использовали для синтеза 1,1 млн пар оснований генома Mycoplasma mycoides. Синтезированный геном трансплантировали в клетку-реципиент М.capricolum, создавая новые самовоспроизводящиеся клетки М.mycoides. 5'экзонуклеазная активность возвращает обратно 5'-концевые последовательности и раскрывает комплементарную последовательность для отжига. Затем полимерная активность заполняет промежутки в отожженных областях. ДНК-лигаза затем заполняет одноцепочечные разрывы и ковалентно связывает фрагменты ДНК вместе. Перекрывающаяся последовательность смежных фрагментов намного длиннее, чем те, которые используются в сборке Golden Gate, и, следовательно, приводит к увеличению процента правильных сборок.
Вирусы.
Вирус представляет собой ультрамикроскопический и метаболически инертный инфекционный агент, который реплицируется только внутри клеток живых хозяев. Вирусы могут заражать все типы жизненных форм, включая животных, растения, грибы, водоросли, бактерии и археи. Хотя они не находятся внутри инфицированной клетки или в процессе заражения клетки, вирусы существуют в виде независимых частиц. Данные вирусные частицы (вирионы) состоят или из генома ДНК, или из РНК, окруженного белковой оболочкой, называемой капсидой. Некоторые вирионы также имеют дополнительную липидную оболочку, как внутри, так и снаружи оболочки капсидного белка.
Существует два цикла вирусной репликации, однако терминология варьирует между прокариотическими и эукариотическими вирусными полями. Скрытые или лизогенные вирусы объединяют вирусный генетический материал в геном клетки-хозяина или образуют эписомальный репликон. Когда клеткахозяин реплицируется, вирусный генетический материал также копируется и продолжает разделяться с геномом хозяина до начала вирусного продуцирования. Начало вирусного продуцирования и гибель клеток являются маркерами литического или вирулентного цикла. Во время литического цикла вирусный геном реплицируется отдельно от гена хозяина и захватывает механизмы репликации и трансляции клеток, чтобы создавать больше вирусов. После накопления достаточного количества вирусов специализированные вирусные белки растворяют клеточную стенку и/или мембрану хозяина. Клетка-хозяин лопается из-за высокого внутреннего осмотического давления, этот процесс называется лизисом. Это высвобождает потомство вирусов в среду, где они могут заражать другие клетки и повторять процесс. Вирулентные вирусы - это те, которые не входят в латентное или лизогенное состояние, но вместо этого реплицируются только путем захвата механизма клеток-хозяев (в отличие от умеренных вирусов, которые входят в латентное состояние).
Исследования вирусной мутации.
Вирусные мутационные исследования, используемые в настоящем документе, относятся к исследованиям быстрой эволюции, адаптации и/или случайному или направленному мутагенезу, и данные термины могут использоваться взаимозаменяемо.
Исследования в области эволюции и/или адаптации включают выбор вирусов по определенным признакам или при определенных условиях. Данные методы особенно полезны для вирусов из-за естественной высокой скорости мутаций, присущей вирусной репликации, что приводит к большому количеству вирусного разнообразия. Например, штаммы можно выращивать в условиях высокой температуры,
- 18 038595 чтобы наблюдать молекулярные изменения, которые способствуют выживанию и размножению в этих условиях. В качестве неограничивающих примеров можно выделить эволюцию или адаптацию эксперимента вируса или бактериофага для выбора вариантов с изменением круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммуннологического надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагу, антибиотической сенсибилизации бактерий, модуляцию факторов вирулентности, или направленного расщепления или редактирования гена хозяина. Неограничивающие примеры экспериментов по эволюции вируса или адаптации включают эксперименты по коинфекции, коэволюции или контрансформации. Коинфекция относится более чем к одному вирусу, заражающему один и тот же хозяин одновременно, что часто приводит к обмену генами между двумя или более вирусами. Коэволюция относится к исследованию, в котором рекомбинация между двумя или более вирусами или бактериофагами происходит в пермиссивном или непермиссивном хозяине, что приводит к сборке нового вируса или бактериофага с различными вирусными свойствами, такими как, например, более широким кругом хозяев. Котрансформация относится к тому, когда два оголенных генома трансформируются вместе в пермиссивном или непермиссивном штамме. Любое из этих исследований эволюции или адаптации может быть выполнено в пермиссивном (восприимчивом) или непермиссивном (резистентном) хозяине. Данные типы экспериментов часто включают передачу вируса несколько раз выбранному хозяину в отсутствии или присутствии одного, или более других выбранных вирусов. Вирусы будут получать мутации, которые приводят к множественным вариантам. На протяжении всего пассирования некоторые варианты будут обогащаться в зависимости от условий пассирования и отбора.
Мутагенез может быть выполнен любым способом, например инсерционным мутагенезом, химическим мутагенезом, γ-облучением или ультрафиолетовым облучением, или ПЦР-опосредуемым мутагенезом. Способы получения мутантов или варианты геномных последовательностей хорошо известны. Например, γ-облучение, УФ-облучение и обработка любым из большого числа возможных химических мутагенов (например, 5-бромдезоксиуридин, этилметан сульфонат (EMS), метилметансульфонат (MMS), диэтилсульфат (DES), нитрозогуанидин (NTG), соединения ICR и т.д.) или лечение соединениями, такими как эндеиновые антибиотики, которые вызывают разломы хромосом (например, блеомицин, адриамицин, неокарзиностатин) представляют собой методы, которые применяют для мутагенеза водорослей, грибов и хитридиомицетов (см., например, патент США 8232090, заявка на патент США 20120088831, заявка на патент США 20100285557, заявка на патент США 20120258498). В данной области техники известно большое количество химических мутагенов, включая, но без ограничений, интеркалирующие агенты, алкилирующие агенты, дезаминирующие агенты, аналоги оснований. Интеркалирующие агенты включают в качестве неограничивающих примеров производные акридина или производные фенантридина, такие как бромид этидия (также известный как 2,7-диамино-10-этил-6-фенилфенантридбромид или 3,8-диамино-5-этил-6-фенилфенантридинийбромид). Неограничивающие примеры алкилирующих агентов включают производные нитрозогуанидина (например, N-метил-N'-нитронитрозогуанидин), этилметансульфонат (EMS), этилэтансульфонат, диэтилсульфат (DES), метилметансульфонат (MMS), азотистую кислоту или HNO2, и азотистый иприт или соединения ICR. Неограничивающие примеры аналогов оснований, которые могут быть использованы в качестве мутагенов, включают соединение 5-бромурацил (также известный как дезоксинуклеозид 5-бромдезоксиуридин), 5-бромдезоксиуридин и 2аминопурин. Методы мутагенеза на основе ПЦР хорошо известны в данной области техники и часто включают условия реакции и/или ДНК-полимеразу, которая увеличивает частоту ошибок в течение ПЦРамплификации.
Мутагенез может дополнительно или альтернативно включать введение экзогенных молекул нуклеиновой кислоты непосредственно в вирусный геном или в клетку-хозяина для последующей рекомбинации в представляющий интерес вирусный геном. Например, экзогенная молекула нуклеиновой кислоты, введенная в клетку-хозяин, может интегрироваться в вирусный генетический локус путем случайной или целевой интеграции, влияя на экспрессию генов, в которые вставляются чужеродные ДНК-вставки или гены, которые являются проксимальными по отношению к чужеродной ДНК, вставленной в геном (например, патент США 7019122; патент США 8216844). Как правило, введенная молекула нуклеиновой кислоты содержит селектируемый маркерный ген для отбора трансформантов, которые интегрировали конструкт молекулы экзогенной нуклеиновой кислоты. Молекула экзогенной нуклеиновой кислоты в некоторых вариантах реализации изобретения может включать транспонируемый элемент или его компонент, такой как, например, инвертированные повторы, которые могут быть распознаны транспозазой и/или геном, кодирующим транспозазу, или молекула экзогенной нуклеиновой кислоты может быть основана, по меньшей мере, частично на вирусе, таком как интегрирующий вирус.
Для случайного инсерционного мутагенеза конструкция предпочтительно содержит селектируемый маркер, который может быть использован для выбора трансформантов, имеющих интегрированный конструкт, и необязательно также может служить маркером сегрегации и молекулярной меткой для выделения и идентификации гена, прерванного интегрированным селектируемым маркерным геном. Селективные маркеры не ограничиваются генами устойчивости к антибиотикам, но также включают любой ген,
- 19 038595 который может обеспечить преимущество роста вирусу (оба гена установленной и гипотетической функции). Альтернативно, специфический генетический локус может быть нацелен. Конструкция для разрушения гена может включать, например, селектируемый маркерный ген, фланкированный последовательностями из интересующего генетического локуса, например по меньшей мере часть гена, который кодирует регулятор, и, необязательно, дополнительные геномные последовательности, окружающие ген. Такие фланкирующие последовательности могут содержать, например, по меньшей мере 50 нуклеотидов, по меньшей мере 100 нуклеотидов, по меньшей мере 500 нуклеотидов или по меньшей мере 1 тысяча пар нуклеотидов геномной последовательности.
Сбор вирусных вариантов может быть создан любым из вышеперечисленных способов, другими способами, хорошо известными в данной области техники или любой их комбинацией. Затем набор вариантов можно скринировать для обеспечения необходимого фенотипа. Выделенные вирусы с желаемым фенотипом(ами) могут быть подвергнуты дополнительным этапам исследований мутаций. Выделенные вирусы, демонстрирующие желаемые свойства или фенотипы, могут быть дополнительно или альтернативно секвенированы для идентификации генетической мутации, ответственной за желаемое свойство или фенотип. Эти идентифицированные генетические поражения могут быть подтверждены повторением мутации в чистом эталонном фоне и тестированием желаемого свойства или фенотипа.
Вирусные полезные нагрузки.
Литические ферменты.
Литический фермент включает любой литический фермент бактериальной клеточной стенки, который убивает одну или более бактерий в подходящих условиях и в течение соответствующего периода времени. Примеры литических ферментов включают, без ограничений, различные амидазы клеточной стенки. Литическим ферментом может быть литический фермент бактериофага, который относится к литическому ферменту, экстрагированному или выделенному из бактериофага или синтезированного литического фермента с аналогичной структурой белка, которая поддерживает литическую функциональность фермента.
Литический фермент способен специфически расщеплять связи, которые присутствуют в пептидогликане бактериальных клеток, чтобы разрушить клеточную стенку бактерий. В настоящее время также постулируется, что пептидогликан бактериальной клеточной стенки очень консервативен среди большинства бактерий, и расщепление только нескольких связей может нарушить клеточную стенку бактерий. Примерами литических ферментов, которые расщепляют эти связи, представляют собой мурамидазы, глюкозаминидазы, эндопептидазы или N-ацетил-мурамоил-L-аланиновые амидазы. Fischetti et al. (1974) сообщили, что фермент лизин Cl стрептококкового бактериофага представляет собой амидазу. Garcia et al. (1987, 1990) сообщили, что лизин Cpl из S.pneumoniae из фага Ср-1 представляет собой лизоцим. Caldentey and Bamford (1992) сообщили, что литический фермент из фага φ6 Pseudomonas представляет собой эндопептидазу, разделяющей пептидный мост, образованный меламинопимилиновой кислотой и D-аланином. Т1 и Т6 литические ферменты фага Е.coli представляют собой амидазы, как и литический фермент из фага Listeria (ply) (Loessner et al., 1996). Существуют также другие литические ферменты, известные в данной области техники, которые способны расщеплять клеточную стенку бактерий.
Литический фермент, генетически кодируемый бактериофагом, содержит полипептид, способный убивать бактерию-хозяина, например, путем, по меньшей мере, разрушения клеточной стенки или ингибирования активности клеточной стенки против бактерий-хозяев. Полипептид может иметь последовательность, которая охватывает нативные литические ферменты и их варианты. Полипептид может быть выделен из множества источников, например из бактериофага (фага), или получен путем рекомбинантных или синтетических методов. Полипептид может, например, содержать холинсвязывающую часть на карбоксильной концевой стороне и может быть охарактеризован ферментативной активностью, способной расщеплять пептидогликан клеточной стенки (такой как активность амидазы действовать на амидные связи в пептидогликане) на аминоконцевой стороне. Были описаны литические ферменты, которые включают множественные активности ферментов, например два ферментативных домена, такие как лизин PlyGBS. Кроме того, описаны другие литические ферменты, содержащие только каталитический домен и домен, не связывающий клеточную стенку.
Полипептиды для подавления кворума.
Автоиндукторы представляют собой небольшие химические сигнальные молекулы, продуцируемые и используемые бактериями, участвующими в определении кворума. Чувство кворума позволяет бактериям ощущать друг друга посредством наличия аутоиндукторов и регулировать самые разнообразные поведения на уровне группы. Такое поведение включает симбиоз, вирулентность, подвижность, продуцирование антибиотиков и образование биопленки. Автоиндукторы входят в различные химические формы в зависимости от вида, но во многих случаях эффект, который у них есть, во многом аналогичен, что позволяет генетически сконструированным бактериофагам воздействовать на самые разнообразные бактерии, использующие подобные автоиндукторы. В целом, грамотрицательные бактерии используют AHL в качестве аутоиндукторов, а грамположительные бактерии используют процессированные олигопептиды для коммуникации, в то время как автоиндуктор 2 (AI-2) является универсальным для грамотрицательных и грамположительных бактерий.
- 20 038595
AHL, продуцируемые различными видами грамотрицательных бактерий, различаются по длине и составу ацильной боковой цепи, которая часто содержит от 4 до 20 атомов углерода. AHL способны диффундировать в и из клеток как с помощью пассивного транспорта, так и с помощью активных механизмов транспорта. Рецепторы для определения AHL включают ряд регуляторов транскрипции, таких как LuxR, которые функционируют как ДНК-связывающие факторы транскрипции, которые могут активировать разнообразную экспрессию генов, регулирующую поведение популяции бактерий.
Автоиндукторы могут быть ингибированы полипептидами, подавляющими кворум. Полипептиды для подавления кворума могут модифицировать или деградировать автоиндукторы, чтобы сделать их менее активными или неактивными. Определенные полипептиды для подавления кворума представляют собой ферменты, которые инактивируют автоиндуктор (например, путем модификации или деградации), такой как описанный в настоящем документе белок лактоназы AiiA, который расщепляет лактонные кольца из ацильных фрагментов AHL с широкой субстратной специфичностью для инактивации AHL из различных бактерий (Wang et al. (2004) J. Biol. Chem. 279 (14): 136.45-51).
Предлагаемый в настоящем документе способ конструирования in vitro может быть использован для получения синтетического бактериофага, сконструированного для кодирования, например, полипептида, подавляющего кворум, полученного из Pseudomonas aeruginosa. Полипептиды, подавляющие кворум, могут быть экспрессированы в виде свободных белков, которые высвобождаются в область, окружающую фаг и/или бактерии, например при фаговой инфекции и лизиса бактерий-хозяев. Не исключено также, что полипептиды, подавляющие кворум, также могут быть экспрессированы и активно секретированы из клетки бактериального хозяина с использованием способов, известных в данной области техники. Аналогичным образом, полипептиды, подавляющие кворум, могут быть трансляционно слиты с белком бактериофага, например капсидным, хвостовым или шейным белком.
Хвостовые волокна.
Раскрытие изобретения предусматривает в некоторых вариантах реализации изменение круга хозяев бактериофага при помощи сконструированного рекомбинантного бактериофага. В некоторых вариантах реализации изобретения изменение круга хозяев вируса включает конструирование вируса с гетерологичными, нативными, ненативными хвостовыми волокнами и любой их комбинацией. Специфичность клеток-хозяев бактериофага может зависеть от хвостовых волокон(а) вирусной частицы. Путем изменения (например, замены и/или мутации) хвостовых волокон или частей хвостовых волокон бактериофагахозяина круг хозяев может быть изменен (например, расширен).
Хвостовые волоконные белки обычно содержат детерминанты антигенности и детерминанты круга хозяев. Гетерологичное хвостовое волокно может быть закодировано набором геномных фрагментов, выделенных или синтезированных на основе генома одного типа бактериофага. Набор фрагментов гена хвостового волокна может содержать подмножества геномных фрагментов, выделенных или полученных на основе геномов нескольких бактериофагов. Например, консервативные области хвостового волокна могут быть закодированы геномными фрагментами, выделенными из генома шасси бактериофага, в то время как области детерминант круга хозяев могут быть закодированы геномными фрагментами, выделенными из генома другого типа бактериофага.
Антимикробные пептиды.
Раскрытие изобретения рассматривает в качестве неограничивающего примера бактериофаг, сконструированный для экспрессии антимикробного пептида, который необязательно секретируется клеткойхозяином. Например, сконструированные бактериофаги могут экспрессировать антимикробный агент, такой как антимикробный пептид (AMP) или антимикробный полипептид, включая, но без ограничений, естественные пептиды для предотвращения развития и/или распространения устойчивости бактерий-хозяев к бактериофагу и для обеспечения более быстрого и эффективного уничтожения бактерий при бактериальных инфекциях, таких как бактериальные инфекции, включающие более одного вида бактерий.
Бактериофаги обеспечивают аттрактивный противомикробный агент для устранения бактериальных инфекций из-за их усиления и механизма хозяина-хищника, например, путем распространения в бактериях-хозяевах, а затем уничтожения бактерий в форме лизиса, что приводит к высвобождению размноженных бактериофагов, которые впоследствии заражают и убивают окружающие бактерии тем же механизмом. Практическое использование бактериофага в устранении бактериальных инфекций обусловлено значительными ограничениями, такими как (i) очень узкий круг бактерий-хозяев как внутри, так и между видами, и (ii) очень быстрое развитие устойчивости к бактериофагу популяцией бактерии-хозяина. Таким образом, как это часто бывает во многих областях науки, теоретический результат трудно достичь в реальных жизненных ситуациях. Поэтому, в то время как бактериофаги кажутся полезными в качестве антимикробных агентов в теории, на практике они сдерживают антимикробные свойства, и их использование для устранения бактериальных инфекций очень трудно достичь из-за быстрого развития устойчивости хозяина к бактериофагу. Следовательно, бактериофаги были неэффективны при длительной элиминации бактерий-хозяев.
Соответственно, настоящее изобретение относится к сконструированному бактериофагу, кодирующему антимикробный агент, причем бактериофаг модифицирован или сконструирован для экспрессии антимикробного пептида (AMP), который необязательно секретируется клеткой-хозяином, по меньшей
- 21 038595 мере одну или любую комбинацию различных антимикробных агентов сконструированного бактериофага могут использовать отдельно или в любой комбинации для устранения или уничтожения бактериальной инфекции. В некоторых вариантах реализации изобретения сконструированный бактериофаг, кодирующий антимикробный агент, может быть использован с дополнительными агентами, такими как другой антимикробный агент сконструированного бактериофага, очищенный антимикробный пептид(ы) или низкомолекулярный антибиотик. Сконструированные бактериофаги, кодирующие антимикробные пептиды (или сконструированные бактериофаги, кодирующие AMP), могут кодировать любой антимикробный агент, известный специалисту в данной области техники.
В некоторых вариантах реализации аспектов изобретения сконструированный бактериофаг, кодирующий антимикробный агент, может экспрессировать и секретировать антимикробный агент, который представляет собой нуклеиновую кислоту, например антимикробный агент, который действует посредством сайлесинга генов общеизвестных бактериальных генов, известных обычным специалистам в данной области техники. Антимикробный агент на основе нуклеиновой кислоты включает, например, но без ограничений, молекулы, индуцирующие РНК-интерференцию (РНКи), например, но без ограничений, миРНК, дцРНК, мвРНК, кшРНК, микроРНК и их сконструированные версии, где ген молекулы РНК-интерференции подавляет экспрессию гена, экспрессированного и важного для жизнеспособности (т.е. выживания) бактерий. Антимикробный агент на основе нуклеиновой кислоты может представлять собой антисмысловую олигонуклеиновую кислоту или аналог нуклеиновой кислоты, например, но без ограничений, ДНК, РНК, пептид-нуклеиновую кислоту (ПНК), псевдокомплементарную ПНК (пк-ПНК), или закрытую нуклеиновую кислоту (ЗНК) и тому подобное. Альтернативно, антимикробным агентом на основе нуклеиновой кислоты может быть ДНК или РНК и аналоги нуклеиновых кислот, например ПНК, пкПНК и ЗНК. Нуклеиновая кислота может быть одно- или двухцепочечной и может быть выбрана из группы, включающей нуклеиновую кислоту, кодирующую представляющий интерес белок, олигонуклеотиды, ПНК и т.д. Такие ингибиторы нуклеиновой кислоты включают, например, последовательность нуклеиновой кислоты, кодирующую белок, который является транскрипционным репрессором, или антисмысловую молекулу, или рибозим, или небольшую ингибирующую последовательность нуклеиновой кислоты, такую как РНКи, кшРНКи, миРНК, микроРНКи (микроРНК), антисмысловой олигонуклеотид и т.д.
Антимикробные пептиды могут дополнительно или альтернативно быть антибактериальными ферментами. Иллюстративные антибактериальные активности могут включать, но без ограничений, литический фермент, ацилазу, аминопептидазу, амилазу, карбогидразу, карбоксипептидазу, каталазу, целлюлазу, хитиназу, кутиназу, циклодекстрингликозилтрансферазу, дезоксирибонуклеазу, эстеразу, альфагалактозидазу, β-галактозидазу, глюкоамилазу, α-глюкозидазу, β-глюкозидазу, галопероксидазу, инвертазу, лакказу, липазу, маннозидазу, оксидазу, пектинолитический фермент, пептидоглутаминазу, пероксидазу, фитазу, полифенолоксидазу, протеолитический фермент, рибонуклеазу, трансглутаминазу, ксиланазу, РНКазу, ДНКазу, лизостафин или порообразующие пептиды.
Антимикробные пептиды или антимикробные полипептиды могут непосредственно разрушать бактериальную мембрану путем связывания с отрицательно заряженной микробной мембраной и разрушения мембраны путем образования водных каналов, заставляя липидный бислой сворачиваться назад на себя или покрывая мембрану с образованием мицелл. В дополнение к их прямым бактерицидным эффектам любые антимикробные пептиды и полипептиды могут также активировать TLR-сигналинг и дополнительные иммунные ответы, служить в качестве хемоаттрактантов лейкоцитов, увеличивать бактерицидную опсонизацию путем вторжения фагоцитов, очищать жизненно важные питательные вещества, необходимые бактериям для роста и ингибировать бактериальные протеазы, или любую комбинацию его.
Биосурфактанты.
Образование бактериальной биопленки может приводить к локальным инфекциям, а также к тяжелому лечению, а иногда и к смертельным, системным инфекциям, таким как бактериемия (наличие бактерий в крови) и бактериальный сепсис (множественная органная недостаточность, вызванная распространением бактерий или их продуктов через кровоток). Внеклеточные вещества, которые составляют матрицу биопленки, могут действовать как барьер, который защищает и изолирует бактерии, находящиеся в биопленке от нормальных иммунологических защитных механизмов, таких как антитела и фагоциты, а также от антимикробных агентов, включая антибактериальные ферменты и антибиотики. Биопленка также способствует росту и распространению бактерий, обитающих в биопленке.
Изобретение относится к способам получения и композициям сконструированных вирусов, экспрессирующих дополнительный агент, используемый для облегчения удаления или ослабления биопленки, нанесенной на поверхность. Например, композиции могут включать биосурфактант. Типичные биосурфактанты включают, но без ограничений, гликолипиды, липопептиды, депсипептиды, фосфолипиды, замещенные жирные кислоты, липополисахариды, сурлактин, сурфактин, висконсин и рамнолипиды.
Вирусная инженерия.
Методы генетического конструирования вирусных частиц являются трудоемкими и длительными из-за отсутствия широко применимых и целевых методов конструирования in vitro. Современные методы in vivo могут занять недели или месяцы для создания модифицированных вирусов и вирусных векторов (Levin and Bull, Nat. Rev. Microbiol., 2004, февраль, 2 (2): 166-73, включены в настоящий документ по- 22 038595 средством ссылки). Кроме того, существует токсичность, связанная с манипуляцией вирусными геномами в клетках. До этого раскрытия усилия по разработке широко применимых методов для точной генной инженерии вирусов in vitro были в значительной степени безуспешными. В настоящем документе описан широко применимый процесс для быстрого создания вирусных геномов полностью in vitro.
Представленные в настоящем документе системы и методы генетического конструирования in vitro имеют несколько преимуществ по сравнению с существующими методами генной инженерии вирусов: 1) позволяют легко манипулировать токсичными генами/продуктами полностью in vitro; 2) быстрые, т.е. могут быть выполнены в течение дня по сравнению с неделями или месяцами для методов in vivo; 3) позволяют удерживать геномную модификацию большей части вирусного генома; 4) не требует рекомбинации сигнальных путей хозяина; 5) более прямой и менее подвержен ошибкам, чем предыдущие методы; и 6) применим к нескольким вирусам без изменений в протоколе.
Изобретение представляет собой способы расщепления, опосредуемой РНК-направляемой нуклеазой, и сборку in vitro сайт-специфических сконструированных целых геномов. Изобретение значительно увеличивает точность, простоту и скорость, с которой вирусные геномы могут быть генетически модифицированы. Кроме того, данный способ преодолевает сложившуюся сложность манипулирования часто ядовитыми вирусными геномами вируса внутри клеток-хозяев. Также данный подход, выполняемый полностью в условиях in vitro, устраняет потребность в генетически приемлемом штамме хозяина для конструирования, что препятствует манипулированию многими важными и интересными вирусами архей, прокариот и эукариот. Данный подход не усиливает манипуляции вирусными геномами и поэтому позволяет сохранять большинство модификаций вирусного генома, таких как метилирование. Хорошо известно, что модификации генома могут иметь глубокое влияние на пригодность вирусов, и поэтому сохранение данных модификаций генома дает четкое преимущество перед другими инженерными методами. Кроме того, этот метод отличается от других методов, относящихся к конструированию генома РНК-направляемой нуклеазой in vivo, поскольку он не сосредоточен на использовании РНКнаправляемой нуклеазы, такой как Cas9 и гРНК для редактирования эукариотического генома, но вместо этого относится к преодолению известных проблем вирусной инженерии целиком в условиях in vitro.
В некоторых аспектах, описанные в настоящем документе новые способы могут включать модификацию вирусной нуклеиновой кислоты или вирусного генома, например, используя РНК-направляемую нуклеазу и сборку, описанную в настоящем документе, и введение сконструированной вирусной нуклеиновой кислоты или сконструированного вирусного генома непосредственно в хозяин, который будет продуцировать сконструированные вирусные частицы или сконструированные вирусы, которые содержат сконструированную вирусную нуклеиновую кислоту или сконструированный вирусный геном. Например, в некоторых аспектах способы включают конструирование вирусной нуклеиновой кислоты или вирусного генома без введения сконструированной вирусной нуклеиновой кислоты или сконструированного вирусного генома в клонирующем хозяине для амплификации сконструированной вирусной нуклеиновой кислоты или сконструированного вирусного генома, например, посредством репликации в векторе. Например, в некоторых способах сконструированная вирусная нуклеиновая кислота или сконструированный вирусный геном не вводятся в дрожжи, Е.coli или другие известные клонирующие хозяева, такие как, но без ограничений, Bacillus или Vibrio, до введения сконструированной вирусной нуклеиновой кислоты или сконструированного вирусного генома в клетку-хозяина, которая будет продуцировать сконструированные вирусные частицы или сконструированные вирусы.
Новые способы, предложенные в настоящем документе, позволяют проводить целенаправленную модификацию двух, трех, четырех, пяти или более сайтов в вирусном геноме. Способы могут быть выполнены целиком в условиях in vitro, что позволяет производить вирусные геномы, измененные в нескольких сайтах, что не достигается с использованием обычных методов конструирования.
Приведенные в настоящем документе сконструированные вирусы, содержащие сконструированную вирусную нуклеиновую кислоту и/или сконструированные вирусные геномы, которые имеют две, три, четыре, пять или более модификаций в отношении несконструированной вирусной нуклеиновой кислоты или несконструированного вирусного генома. Две или более модификаций могут быть вставкой, делецией, заменой или любой их комбинацией. Две или более модификаций могут приводить к одному, двум или более улучшенным вирусным свойствам, таким как любое раскрытое в настоящем документе. Сконструированные вирусы можно получать полностью посредством методов конструирования в условиях in vitro, раскрытых в настоящем документе. Способы конструирования in vitro, описанные в настоящем документе, приводят к целенаправленным модификациям, в отличие от классического или случайного мутагенеза. В отличие от модификаций, получаемых классическим или случайным мутагенезом, целевые модификации могут быть удобно скринированы для использования в стандартных молекулярногенетических лабораторных методах, таких как ПЦР и/или секвенирование до любых анализов фенотипа.
Также в настоящем документе раскрыта система получения синтетических вирусов с улучшенными вирусными свойствами (например, см., фиг. 10). Система включает идентификацию последовательностей нуклеиновых кислот, ответственных за обеспечение требуемого свойства, и затем включение этих изменений последовательности в выбранный вирусный геном для получения вирусных частиц с улучшенными вирусными свойствами. Последовательности нуклеиновой кислоты, способные придавать желаемое
- 23 038595 вирусное свойство, могут быть идентифицированы с помощью фундаментальных научных знаний, поиска литературы, эмпирического тестирования, исследований мутаций или любой их комбинации. Исследования мутаций могут включать эволюционные исследования, исследования адаптации, исследования мутагенеза и/или другие экспериментальные подходы, хорошо известные в данной области техники. Исследования мутагенеза могут включать ультрафиолетовый (УФ), химический и/или инсерционный мутагенез. Инсерционный мутагенез может включать транспозон и/или селективный маркер инсерционного мутагенеза. Эксперименты по мутации, используемые для идентификации интересующих последовательностей нуклеиновых кислот, могут быть выполнены с использованием вируса или вирусного генома вируса, который станет отправной точкой для конструирования in vitro. Дополнительно или альтернативно вместо выбранного вируса или вирусного генома, связанный или гетерологичный вирус, или вирусный геном может быть использован в исследовании мутаций с целью идентификации последовательностей рекомбинантных нуклеиновых кислот для включения в первоначально выбранный вирус или вирусный геном для придания дополнительных свойств выбранного вируса.
Желаемые свойства могут включать одно или более из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунологического надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагу, антибиотической сенсибилизации бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина, других необходимых свойств, которые могут быть хорошо известны специалисту в данной области техники или в любой их комбинации. Идентифицированные последовательности нуклеиновых кислот, обладающие необходимым свойством, могут быть включены в выбранный вирусный геном, используя описанный в настоящем документе метод конструирования in vitro для включения одного или более изменений в один вирусный геном в течение одного или более циклов повторного конструирования и тестирования до тех пор, пока не будет подвержден желаемый набор одного или более улучшенных вирусных свойств. Конечный вирусный геном, представляющий интерес, может представлять собой комбинацию естественных и синтезированных молекул нуклеиновых кислот или может быть полностью синтезирован de novo с использованием способов, описанных в настоящем документе, и/или известных в данной области техники. Получение вирусов или вирусных частиц с улучшенными вирусными свойствами может включать введение сконструированного вирусного генома, представляющего интерес, в совместимую клетку, причем геном активируется, тем самым создавая вирусные частицы или вирусы. Для получения молекулы нуклеиновой кислоты, идентифицированной для придания желаемого свойства для включения в выбранный вирусный геном, последовательность, представляющая интерес, может быть выделена или амплифицирована из вирусного генома, из которого она была идентифицирована путем расщепления, ПЦР-амплификации, синтеза, других методов известных в данной области техники, или в любой их комбинации. Синтезированную последовательность нуклеиновой кислоты можно химически синтезировать или собрать из химически синтезированных перекрывающихся олигонуклеотидов. Дополнительно или альтернативно, молекула нуклеиновой кислоты, которая должна быть включена в выбранный вирусный геном для того, чтобы придать желаемый фенотип, может быть комбинацией последовательностей естественных и синтезированных нуклеиновых кислот. В зависимости от конструкции молекулы нуклеиновой кислоты, которая должна быть включена в выбранный вирусный геном, полученный сконструированный вирусный геном может содержать последовательности нуклеиновых кислот, замененные альтернативными последовательностями или любой их комбинацией для придания необходимого вирусного свойства. Способы конструирования молекул нуклеиновой кислоты для того, чтобы изменить последовательность таким образом, что последовательности выделяют, удаляют, заменяют или любую их комбинацию хорошо известную специалистам в данной области техники. Сконструированные вирусные геномы, получаемые при помощи системы и методами, описанными в настоящем документе, могут быть использованы для получения вирусов или вирусных частиц с улучшенными вирусными свойствами. Получение вирусов или вирусных частиц с улучшенными вирусными свойствами может включать введение сконструированного вирусного генома в совместимую клетку, причем геном активируется, тем самым создавая вирусные частицы или вирусы. Введение сконструированного генома в клетку может быть осуществлено путем электропорации, трансформации, конъюгации, контакта клетки с предварительно упакованными вирусными геномами и т.д. или другими способами, хорошо известными в данной области техники.
Изобретение дополнительно относится к открытию способа для конструирования нуклеиновой кислоты in vitro с использованием РНК-направляемой эндонуклеазы. Настоящее раскрытие дополнительно относится к улучшению вирусных свойств при помощи генной инженерии in vitro вирусных нуклеиновых кислот. В частности, раскрытие относится к расщеплению in vitro последовательностей вирусов с использованием эндонуклеаз, таких как РНК-направляемая эндонуклеаза, например, Cas9, с последующей сборкой рекомбинантной нуклеиновой кислоты путем вставки фрагмента(ов) ДНК или РНК в расщепленный вирусный геном.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro вирусной нуклеиновой кислоты, включающий выделение вирусной нуклеиновой кислоты; расщепление in vitro области вирусной нуклеиновой кислоты с использованием РНК-направляемой нуклеазы; и сборку
- 24 038595 рекомбинантной нуклеиновой кислоты путем вставки фрагмента ДНК или РНК в расщепленную вирусную нуклеиновую кислоту. В некоторых примерах расщепление in vitro представляет собой ферментативное расщепление, основанное на РНК. В некоторых примерах ферментативное расщепление выполняют при помощи РНК-направляемой нуклеазы. В некоторых примерах РНК-направляемая нуклеаза представляет собой Cas9, фермент, полученный из Cas9, фермент, связанный с Cas9, или любую очищенную программируемую РНК-направляемую нуклеазу. В некоторых примерах расщепление дополнительно включает нацеливающие РНК. В некоторых примерах система расщепления дополнительно содержит спермидин. В некоторых примерах нацеливающие РНК представляют собой гРНК, сгРНК и/или tracrPHK. В некоторых примерах после расщепления РНК-направляемую нуклеазу инактивируют стандартными методами, такими как воздействие тепла и/или удалением стандартными методами, такими как, например, фенольно-хлороформной экстракцией. В некоторых примерах нагревание в процессе активации достигают путем воздействия на раствор, содержащий белок, нагревая, например, по меньшей мере на 80°С.
Любая программируемая РНК-направляемая нуклеаза может быть использована в способах и композициях настоящего изобретения, например Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (также известна как Csn1 и Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, Cpf1, C2c1, C2c2, С2сЗ или их гомологи, или их сконструированные варианты. Любую программируемую систему CRISPR можно использовать в способах и композициях в настоящем документе, включая тип I, тип II, тип III, тип IV, тип V, тип VI или любую их комбинацию. РНК-направляемая нуклеаза может быть белком Cas9, таким как белок Cas9 из Staphylococcus pyogenes, S.thermophilus, S.pneumonia, S.aureus или Neisseria meningitidis, в виде неограничивающих примеров. Также рассматриваются белки Cas9, представленные в виде SEQ ID NO: 1-256 и 795-1346 в публикации заявки на патент США № US 2014/0068797, включенной в настоящий документ посредством ссылки, и химерных белков Cas9, которые могут объединять домены из более чем одного белка Cas9, а также варианты и мутанты идентифицированных белков Cas9. В дополнение к Cas9, специалист в данной области техники легко узнает, что любой известный функциональный эквивалент будет достаточным альтернативным примером.
Вирусные частицы могут быть архей-, прокариот- или эукариот- специфическими вирусами. Например, вирус может быть таким, который может заразить Pseudomonas aeruginosa, Е.coli или Homo sapiens. В некоторых примерах вирус может быть таким, который заражает виды возбудителей, такие как те, что относятся к роду Acinetobacter, Clostridium, Enterobacter, Enterococcus, Escherichia, Klebsiella, Mycobacterium, Neisseria, Pseudomonas, Salmonella, Staphylococcus или Streptococcus. В некоторых примерах вирус может инфицировать виды архей, такие как те, что относятся к роду Acidianus, Aeropyrum, Haloarcula, Haloferax, Halorulbum, Methanobacterium, Pyrobaculum, Pyrococcus, Stygiolobus, Sulfolobus или Thermoproteus. В некоторых примерах вирус может инфицировать эукариотические хозяева, такие как люди, млекопитающие, животные, растения, водоросли или грибы. Вирусная нуклеиновая кислота может представлять собой ДНК или РНК. В некоторых примерах вирусная нуклеиновая кислота состоит из цельного вирусного генома, части вирусного генома, или одного или более вирусных генов. В некоторых примерах часть вирусного генома субклонируется в плазмиду до конструирования.
Вирусная нуклеиновая кислота может быть одиночной или двойной (или более) расщепленной РНК-направляемой нуклеазой, такой как Cas9, в сочетании с нацеливающей(ими) РНК in vitro для удаления одного или более нуклеотидов, одного гена, множества генов или любого размера геномной области или открытой ДНК для вставки новой последовательности. В дополнение к Cas9 специалисту в данной области техники понятно, что любая программируемая РНК-направляемая нуклеаза или другой механизм расщепления ДНК, пригодный для ДНК, будет достаточным и будет функционально эквивалентным. Множественные расщепления могут быть выполнены одновременно; однако было обнаружено, что последовательное расщепление РНК-направляемой Cas9 может повысить эффективность. Кроме того, спермидин может быть добавлен в реакционную смесь для увеличения диссоциации Cas9 от ДНК, что позволяет увеличить доступность Cas9 для ферментативной активности. Вирусная последовательность, удаленная расщеплением Cas9, не рекомбинируется обратно в геном, потому что Cas9 представляет собой тупой режущий фермент и фрагменты не содержат гомологии с сайтом встраивания. Кроме того, дезактивация теплом Cas9 обеспечивает непосредственный переход от расщепления к реакциям сборки, упрощая протокол.
Используемый в настоящем документе термин нацеливающие РНК или направляющие РНК относится к CRISPR РНК (сгРНК), транс-активирующим сгРНК (сгРНК), модифицированным химерным гидовым РНК (гРНК), включающим как сгРНК, так и tracrPHK, или одиночные гРНК, совместимые с выбранной системой CRISPR. CRISPR РНК (сгРНК) транскрибируют из локуса CRISPR, включают в эффекторные комплексы и направляют комплекс к последовательностям встраивающейся нуклеиновой кислоты, что приводит к расщеплению нуклеиновой кислоты, опосредованному РНК-направляемой нуклеазой. ТгасгРНК являются комплементарными с и комплементарной парами оснований с pre-сгРНК, образующими дуплекс РНК, необходимый для Cas9-опосредованного расщепления. Гибридные гРНК
- 25 038595 представляют собой химерные РНК, которые связывают нацеливающую сгРНК с tracrPHK, что позволяет использовать одну РНК для Cas9-опосредованного расщепления. Cas9-опосредованное расщепление могут проводить как с транскрибированой in vitro смесью crPHK-tracrPHK или с химерной гРНК.
Вставка ДНК или РНК может быть получена любыми способами, известными в данной области техники, а именно путем синтеза in vitro, химического синтеза, синтеза de novo, сборки de novo, амплификации (ПЦР), фермент-опосредуемого освобождения от плазмид, вирусов или бактерий, или любой их комбинации. В одном аспекте вставка ДНК или РНК создается сборкой олигонуклеотидов или ПЦР с праймерами, содержащими перекрывающиеся последовательности с сайтом встраивания. Вставка ДНК или РНК может быть комбинацией естественных и синтезированных нуклеиновых кислот, или полученных полностью естественным или синтетическим путем.
Сборка вставки ДНК или РНК и расщепленной вирусной нуклеиновой кислоты может быть проведена любым известным в данной области техники способом, таким как реакции клонирования in vitro или любым из ранее обсуждавшихся способов. В одном аспекте сборка вставки ДНК или РНК в расщепленный вирусный геном выполняют с использованием метода сборки Gibson Assembly. В одном аспекте сборку вставки ДНК или РНК в расщепленный вирусный геном выполняют in vivo с использованием механизмов рекомбинации клеток-хозяев. Сборка вставки ДНК или РНК может приводить к вставке, делеции, замене или любой их комбинации последовательности нуклеиновой кислоты. Процесс конструирования последовательности ДНК или РНК такой, что сборка в расщепленную вирусную нуклеиновую кислоту приводит к вставке, делеции, замене или любой их комбинации нуклеиновых кислот, представляющих интерес, хорошо известны в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro вирусной последовательности, включающий выделение вирусной нуклеиновой кислоты; расщепления in vitro области вирусной нуклеиновой кислоты с использованием РНК-направляемой нуклеазы; и сборку рекомбинантной нуклеиновой кислоты путем вставки фрагмента ДНК или РНК в расщепленную вирусную нуклеиновую кислоту. В некоторых примерах сборку проводят in vitro в одном сосуде со смесью компонентов, включающих: (а) выделенную не термостабильную 5'-3'-экзонуклеазу, которая не обладает 3'экзонуклеазной активностью; (b) краудинг-агент; (с) выделенную термостабильную невытесняющую ДНК-полимеразу с 3'-экзонуклеазной активностью или смесью указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; (d) выделенную термостабильную лигазу; (е) смесь дНТФ; и (f) подходящий буфер в условиях, эффективных для вставки фрагмента в расщепленную вирусную нуклеиновую кислоту с образованием рекомбинантной нуклеиновой кислоты. В некоторых аспектах экзонуклеаза представляет собой экзонуклеазу Т5, и приведение в контакт происходит в изотермических условиях, и/или краудинг-агент представляет собой ПЭГ, и/или невытесняющая ДНК-полимераза представляет собой ДНК-полимеразу Phusion™ или ДНК-полимеразу VENT® и/или лигазу представляет собой Taq-лигазу. В некоторых примерах сборку in vitro выполняют при помощи одноступенчатой или изотермической сборки методом Gibson Assembly. В некоторых примерах сборку in vitro выполняют при помощи двухступенчатой сборки методом Gibson Assembly. В некоторых примерах расщепленная нуклеиновая кислота и фрагмент ДНК или РНК могут быть собраны in vitro лигированием тупых концов с использованием фермента лигазы.
В некоторых аспектах настоящее раскрытие обеспечивает метод in vitro для конструирования вирусной последовательности, включающий этап сборки. В некоторых примерах сборку выполняют in vivo в совместимой клетке-хозяине с использованием механизма рекомбинации клеток-хозяев. Хотя рекомбинантная нуклеиновая кислота может быть собрана целиком в условиях in vitro с использованием очищенных ферментов, как описано в настоящем документе, этот процесс также может быть осуществлен с использованием естественных или сконструированных рекомбинантных сигнальных путей в чувствительном штамме хозяина. В некоторых случаях совместимыми клетками-хозяевами могут быть S.cerevisiae, Е.coli, P.aeruginosa, В.subtilis, V.natrigens или другие организмы, доступные в данной области техники. Трансформация очищенных и обработанных in vitro вирусных геномов вместе с фрагментом вставки восстановления, содержащим концевые области гомологии, достаточна для того, чтобы некоторые клетки-хозяева собирали рекомбинантный вирусный геном in vivo. Фрагменты вставки восстановления могут быть синтезированы или амплифицированы стандартными методами, известными в данной области техники, или могут находиться внутри плазмид, стабильно реплицирующихся в выбранной клетке-хозяине. Данный способ, вероятно, будет иметь более низкую эффективность по сравнению со сборкой in vitro из-за клеток-хозяев, имеющих как гомологичные, так и не гомологичные пути восстановления ДНК, задача совместной доставки достаточного количества вставки и расщепленного генома в клетку-хозяина и более низкой эффективности большинства гомологичных сигнальных путей рекомбинации хозяина. Поскольку только расщепленнные геномы не образуют функциональных вирусных частиц и в последующем бляшек без опосредованной хозяином рекомбинации, бляшки, полученные после трансформации и выращивания, могут быть скринированы с помощью ПЦР для данной вставки, чтобы подтвердить корректную сборку желаемой сконструированной вирусной нуклеиновой кислоты.
В некоторых аспектах настоящее раскрытие обеспечивает метод in vitro для конструирования вирусной последовательности, содержащей РНК-направляемую нуклеазу. В некоторых примерах РНК- 26 038595 направляемая нуклеаза представляет собой Cas9 II типа. В некоторых примерах РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9. В некоторых примерах РНКнаправляемая нуклеаза представляет собой выделенный рекомбинантный фермент Cas9 или Cas9. В некоторых примерах существует по меньшей мере одна нацеливающая РНК. В некоторых примерах существует две нацеливающие РНК. В некоторых примерах нацеливающая РНК представляет собой химерную гидовую РНК (гРНК) или набор сгРНК и tracrPHK. В некоторых примерах в реакции расщепления in vitro использует две гРНК. В некоторых примерах в реакции расщепления in vitro использует два набора сгРНК и tracrPHK, чтобы, например, одновременно нацеливать на две последовательности.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro вирусной последовательности, включающий стадию расщепления in vitro. В некоторых примерах после расщепления РНК-направляемую нуклеазу инактивируют при помощи стандартных методов, таких как воздействие теплом, например, по меньшей мере на 80°. В некоторых примерах после расщепления РНКнаправляемую нуклеазу удаляют фенольно-хлороформной экстракцией. В некоторых примерах, после расщепления, РНК-направляемую нуклеазу удаляют другими способами экстракции, хорошо известными в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ in vitro для конструирования вирусной последовательности, которая приводит к созданию сконструированной вирусной нуклеиновой кислоты. В некоторых примерах сконструированную вирусную нуклеиновую кислоту затем трансформируют в клетку-хозяин. В некоторых примерах клетка-хозяин представляет собой Е.coli, P.aeruginosa, S.cerevisiae, V.natriegens, В.subtilis или другой организм, хорошо известный в данной области техники. В некоторых примерах трансформацию выполняют путем теплового шока, электропорации, биолистики, бомбардировки частиц, конъюгации, трансдукции, липофекции или другого известного метода, хорошо известного в данной области техники. В некоторых примерах сконструированную вирусную нуклеиновую кислоту трансформируют в клетку-хозяина и затем снова выделяют после репликации. В некоторых примерах выделенную сконструированную вирусную нуклеиновую кислоту используют в качестве исходной вирусной нуклеиновой кислоты для другого цикла конструирования in vitro, который в настоящем документе называется итеративное конструирование in vitro. В некоторых примерах представлен один цикл итеративного конструирования in vitro. В других примерах представлен по меньшей мере один цикл итеративного конструирования in vitro. В других примерах существует два или более циклов итеративного инженерии in vitro.
В некоторых аспектах настоящее раскрытие обеспечивает способ in vitro конструирования вирусной последовательности, который приводит к созданию сконструированной вирусной нуклеиновой кислоты. В некоторых примерах сконструированную вирусную нуклеиновую кислоту упаковывают в вирусные частицы с использованием набора для упаковки in vitro, который может быть коммерчески доступен. В некоторых примерах комплект для упаковки in vitro представляет собой набор Maxplax lambda packaging extract.
В некоторых аспектах настоящее раскрытие обеспечивает способ in vitro для конструирования вирусной последовательности, который приводит к образованию рекомбинантной сконструированной вирусной нуклеиновой кислоте. В некоторых примерах сконструированная вирусная нуклеиновая кислота улучшает или изменяет свойство вируса по сравнению с контрольным и/или несконструированным вирусом. В некоторых примерах улучшенное или измененное вирусное свойство представляет собой свойство, такое как круг хозяев, вирусный литический цикл, адсорбция, прикрепление, инъекция, репликация и сборка, лизис, величина выхода фага, ускользание от иммунологического надзора, иммунная стимуляция, иммунная дезактивация, дисперсия биопленки, устойчивость к бактериальному фагу, антибиотическая сенсибилизация бактерий, модуляция факторов вирулентности, направленное расщепление или редактирование геном хозяина или любая их комбинация. В некоторых примерах улучшение свойства может быть увеличением, уменьшением или изменением свойства. Например, улучшенное вирусное свойство может быть расширенным или уменьшенным кругом хозяев, измененным вирусным литическим циклом, увеличенной или уменьшенной адсорбцией в клетке-хозяине, увеличенным или уменьшенным прикреплением к клетке-хозяина, увеличенным или уменьшенным инъекцией, увеличенной или уменьшенной или измененной репликацией и сборкой, повышенным или сниженным лизисом, увеличенной или уменьшенной величиной выхода фага, увеличенным или уменьшенным или измененным ускользанием от иммунного надзора, увеличенной или уменьшенной или измененной иммунной стимуляцией, увеличенной или уменьшенной или измененной иммунной дезактивацией, увеличенной или уменьшенной или измененной дисперсией биопленки, увеличенной или уменьшенной или измененной устойчивости бактерий к фагу, повышенной или уменьшенной или измененной антибиотической сенсибилизацией бактерий, увеличенной или уменьшенной или измененной модуляцией факторов вирулентности, увеличением или уменьшением или изменением направленного расщеплениея или редактирования генома или любой их комбинации.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, увеличенный круг хозяев. Круг хозяев представляет собой количество типов клеток, штаммов или видов хозя
- 27 038595 ев, которые вирус может заразить. Увеличение круга хозяев представляет собой расширение абсолютного числа различных типов клеток, штаммов или видов, которые вирус способен инфицировать по сравнению с контрольным и/или несконструированным вирусом. В некоторых примерах увеличенный круг хозяев представляет собой увеличение количества бактериальных штаммов или вариантов внутри бактериальных видов, которые вирус способен инфицировать. Увеличение в круге хозяев может быть увеличением по меньшей мере одного или более штаммов, типов клеток или видов. Круг хозяев могут анализировать, например, стандартным анализом бляшкообразования, который хорошо известен в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ для конструрования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, вирусный литический цикл. Вирусный литический цикл представляет собой один из двух циклов вирусной репликации, другой является лизогенным циклом. Литический цикл приводит к разрушению инфицированной клетки и инфицированной клеточной мембраны. Литический цикл состоит из шести этапов, каждый из которых может быть индивидуально сконструирован. Шесть этапов вирусного литического цикла представляют собой адсорбцию, прикрепление, инъекцию, репликацию и сборку, лизис и величину выхода фага.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, адсорбция. Адсорбция представляет собой действие вируса, контактирующего с клеткой-хозяином. Вирусная адсорбция характеризуется как сродство вируса к данной клетке-хозяину и может быть проанализировано с помощью стандартных анализов адсорбции, например, описанных Хайманом и Абедоном (Methods in Molecular Biology, 2009). Кроме того, или, альтернативно, вирусная адсорбция может быть определена другими стандартными анализами аффинности, широко используемыми в биохимии для анализа взаимодействий рецептор-лиганд.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, прикрепление. Вирусное прикрепление - это когда вирус сильно прикрепляется к клетке-хозяина. Вирусное прикрепление является необратимым взаимодействием между вирусом и рецептором клетки-хозяина.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, инъекция. Введение относится к инъекции вирусного генома, и когда вирус вставляет свой генетический материал в клетку-хозяина. В качестве примера можно привести инъекцию вирусного генома путем измерения оттока ионов калия (Cady et al., J. Bacteriol., 2012, 194 (21): 5728-38; Leavitt et al., PLoS ONE, 2013 8 (8): E70936, которые включены в настоящее описание посредством ссылки во всей их полноте).
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, репликация и сборка. Вирусная репликация и сборка относятся к созданию новых вирусов в клетке-хозяине. После инъекции вирусного генома механизм клеток-хозяев захватывается и вирусные гены транскрибируются, вирусные белки транслируются, а вирусные частицы представляют собой сборку, содержащую реплицированные вирусные геномы. Вирусная репликация и сборка в конечном итоге приводят к лизису клеток-хозяев, поэтому репликацию и сборку можно анализировать, контролируя скорость роста вируса стандартным анализом бляшкообразования или анализом бляшкообразования в двойном агаровом слое. Скорости вирусной репликации могут дополнительно или альтернативно определяться путем измерения величины выхода фага в стандартном анализе бляшкообразования, кривой одиночного цикла размножения или других стандартных анализах на репликативную способность вируса, которые хорошо известны в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, лизис. Лизис относится к лизису клеток-хозяев. После репликации и сборки новых вирусных частиц образуется фермент, который разрушает стенку клетки-хозяина и/или клеточную мембрану изнутри и позволяет вводить жидкость, что в конечном итоге приводит к лизису клеток-хозяев. Способность увеличивать или ингибировать вирулентную репликацию вируса может увеличивать или уменьшать время, необходимое для того, чтобы данный вирус убивал клетку-хозяина путем лизиса. Вирусную вирулентность можно исследовать, анализируя время между заражением и лизисами клеток-хозяев, контролируя скорость роста вируса стандартным анализом бляшкообразования или анализом бляшкообразования в двойном агаровом слое. Кроме того, или альтернативно, усиленный бактериальный лизис сконструированного вируса по сравнению с контрольным и/или несконструированным вирусом может быть определен при помощи колониеобразующих единиц (КОЕ) после анализа, количества или диаметра бляшкообразующих единиц (БОЕ) или после анализа бляшкообразования, из анализа биопленки или других стандартных анализов, которые хорошо известны в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ модификации вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, величина
- 28 038595 выхода фага. Величина выхода фага относится к числу вирусов, продуцируемых зараженной клеткой.
Величина выхода фага может быть проанализирована стандартными анализами величины выхода фага, такими как те, которые описаны Эллисом и Делбрейком (J. Gen. Physiol. 1939 Jan 20; 22(3): 365-384, включенный в настоящий документ посредством ссылки) и Delbriick (Delbriick J. Gen. Physiol, 1940, 23;
643, включенный в настоящий документ посредством ссылки)
В некоторых аспектах настоящее раскрытие обеспечивает способ модификации вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, ускользание от иммунного надзора. Ускользание от иммунного надзора представляет собой способность вируса избегать клиренса врожденной или адаптивной иммунной системы. Ускользание от иммунного надзора может быть проанализировано путем изучения уровня или скорости нейтрализации продуцирования антител. Кроме того, или, альтернативно, ускользание от иммунного надзора можно измерить, анализируя период полужизни или времени пребывания данного вируса внутри животного.
В некоторых аспектах настоящее раскрытие обеспечивает собой способ модификации вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, иммунная стимуляция. Иммунная стимуляция представляет собой способность вируса индуцировать иммунный ответ, который обычно не ассоциируется с вирусом дикого типа или несконструированным вирусом. Это может быть проанализировано путем анализа иммунных факторов, продуцируемых в присутствии вируса, с использованием стандартных наборов ИФА, проточной цитометрии, гистологии или других стандартных иммунологических анализов, известных специалистам в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ модификации вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, иммунная дезактивация. Иммунная дезактивация представляет собой способность вируса уменьшать иммунный ответ, обычно связанный с вирусом дикого типа или несконструированным вирусом. Это может быть проанализировано путем анализа иммунных факторов, продуцируемых в присутствии вируса, с использованием стандартных наборов ИФА, проточной цитометрии, гистологии или других стандартных иммунологических анализов, известных специалистам в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ модификации вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, дисперсия биопленки. Дисперсия биопленки представляет собой способность деградировать, ослаблять или увеличивать проницаемость биопленки. Мероприятия, которые могут приводить к дисперсии биопленки, включают, но без ограничений, деградацию экзополисахарида (ЭПС), модуляцию молекул бактериального чувства кворума, и деградацию внеклеточной ДНК или РНК в биопленке или месте бактериальной инфекции. Деградация экзополисахарида представляет собой способность вируса продуцировать белок или фермент, способный разрушать или диссоциировать высокомолекулярные соединения, секретируемые микроорганизмами в их среду для формирования структурной целостности биопленок. ЭПСдеградирующая активность может включать, но без ограничений, поверхностно-активные вещества, гликозидазы и протеазы. Их активность может быть измерена с использованием стандартных биохимических анализов, известных специалистам в данной области техники. Модуляция молекул бактериального чувства кворума также может приводить к дисперсии биопленки. Известно, что молекулы бактериального чувства кворума являются высококонсервативными регуляторами вирулентности у ряда патогенных бактерий человека. Были идентифицированы белки с ферментативной активностью, способные разрушать молекулы бактериального чувства кворума, и их активность измеряли при помощи различных анализов микробных репортеров, биохимических репортерных анализов или путем анализа продуктов расщепления с использованием TLC (Rajesh and Rai, Microbiological Research, July-August 2014, Volume 169, Issues 7-8, Pages 561-569, включенные в настоящий документ посредством ссылки). Деградация внеклеточной ДНК или РНК в биопленке или месте бактериальной инфекции также может привести к дисперсии биопленки. Активность вирусной закодированной ДНКазы или РНКазы может быть измерена с помощью имеющихся в продаже наборов, известных специалистам в данной области техники, таких как те, что доступны от Jena Bioscience или Thermofisher в качестве неограничивающих примеров. Предотвращение, проникновение, разрушение или дисперсия биопленки также может быть оценена путем количественной оценки биопленки, присутствующей после обработки, и сравнения ее с контрольным условием. Измерения биопленки хорошо известны в данной области техники и включают в качестве неограничивающего примера окрашивание биопленки красителем, таким как кристаллический фиолетовый, и количественное определение поглощения на спектрофотометре.
В некоторых примерах настоящее раскрытие обеспечивает способ модификации вирусной нуклеиновой кислоты, который приводит к улучшенному вирусному свойству, такому как, например, устойчивость бактериального фага. Фаг или бактериофаг представляют собой термины, которые можно использовать взаимозаменяемо и которые относятся к вирусам, которые заражают бактерии. Бактериальная устойчивость к фагу относится к появлению бактериофаг-устойчивых бактерий из популяции, обработанной или подверженной воздействию конкретного вируса. Это происходит либо посредством случайных мутаций внутри бактерий, либо из-за того, что некоторые бактерии внутри популяции не способны заразиться вирусом. Когда данные резистентные бактерии распространяются, новая популяция устойчива к
- 29 038595 вирусу или бактериофагу, изначально подвергаемому воздействию. Неограничивающим примером оценки устойчивости бактерий является отслеживание скорости роста бактерий после вирусной обработки, поскольку количество резистентных бактерий непосредственно влияет на скорость повторного роста популяции. Бактериофаг может быть модифицирован таким образом, чтобы бактерии не могли получить вирусную резистентность по меньшей мере тремя способами, включая 1) ингибирование известных систем устойчивости к вирусам, 2) кодирование вторичного токсина и/или 3) увеличение вирулентности за счет увеличения литической способности. Бактериофаг может избегать или ингибировать известные системы устойчивости к вирусам посредством экспрессии известных или синтетических ингибирующих белков, как один пример. Активность данных ингибирующих белков можно контролировать с помощью классического метода титрования на двухслойной бляшке и/или анализа эффективности культивирования. Системы устойчивости к вирусам могут включать, но без ограничений, системы CRISPR-Cas и рестрикции-модификации. Предотвращение устойчивости к вирусам также может быть достигнуто путем экспрессии вторичных токсинов, таких как бактерицидные полезные нагрузки. Активность данных вторичных токсинов не зависит от естественной литической активности данного вируса и может быть измерена анализом кривой роста/гибели. Кроме того, или альтернативно, генетически закодированный токсический белок может быть очищен и охарактеризован с использованием установленных биохимических и/или фенотипических анализов, обычно используемых для характеристики белковых токсинов и которые хорошо известны специалисту в данной области техники.
В некоторых примерах настоящее раскрытие обеспечивает способ модификации вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, антибиотическая сенсибилизация бактерий. Антибиотическая сенсибилизация бактерий относится к способности вируса экспрессировать генетически закодированную полезную нагрузку, чтобы сделать инфицированные или соседние клетки более чувствительными к антимикробному агенту. Полезная нагрузка может быть генетически закодирована на вирусе или бактериофаге, а затем экспрессирована внутри клеткихозяина. Экспрессированная полезная нагрузка может быть необязательно секретирована клеткойхозяином или высвобождена при лизисе клеток-хозяев. Активность антибиотической сенсибилизации бактерий можно наблюдать при помощи тестирования синергии, используя, например, хорошо известный метод микроразведений с использованием серийных разведений.
В некоторых примерах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, модуляция факторов вирулентности. Модуляция факторов вирулентности относится к вирусным генетически закодированным белкам или соединениям, способным модулировать экспрессию или активность известных факторов вирулентности. Неограничивающими примерами модуляторов факторов вирулентности являются факторы транскрипции, антитела и белки иммунитета. Экспрессию или активность факторов вирулентности и модуляторов фактора вирулентности можно наблюдать, например, на животных моделях, биохимических тестах или репортерных анализах.
В некоторых примерах настоящее раскрытие обеспечивает способ конструирования вирусной нуклеиновой кислоты, который приводит к улучшению вирусного свойства, такого как, например, направленное расщепление или редактирование генома хозяина. Расщепление или редактирование целевого генома хозяина относится к способности вируса генетически кодировать специфичную для последовательности нуклеазу, способную целенаправленно расщеплять геном в данном генетическом локусе, и, необязательно, редактировать, например, путем вставки восстанавливающей молекулы ДНК. Активность целевого расщепления можно наблюдать путем секвенирования, определения количества жизнеспособных микроорганизмов, подтверждения интеграции новой последовательности и/или других стандартных методов, известных специалистам в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro вирусной последовательности, включающий этап расщепления in vitro. В некоторых примерах расщепленную вирусную нуклеиновую кислоту выделяют и секвенируют вместо использования в реакции сборки in vitro или in vivo. В некоторых примерах результаты секвенирования из фрагмента вирусной нуклеиновой кислоты используют для определения концов вирусных геномов. В некоторых примерах скорректированные последовательности вирусного генома используют для планирования и разработки дальнейших подходов и этапов конструирования in vitro.
В некоторых аспектах настоящее изобретение относится к способу конструирования in vitro вирусной последовательности, включающей выделение вирусной нуклеиновой кислоты. В некоторых примерах вирусная нуклеиновая кислота представляет собой полный вирусный геном. В некоторых примерах полный вирусный геном выделяют из вирусной частицы. В некоторых примерах вирусная нуклеиновая кислота представляет собой часть вирусного генома. В некоторых примерах вирусная нуклеиновая кислота представляет собой часть вирусного генома, содержащегося в плазмиде. В некоторых примерах плазмиду, содержащую часть вирусного генома, выделяют из клетки-хозяина. В некоторых примерах часть вирусного генома клонировали в плазмиду, трансформировали в клетку-хозяина и изолировали перед конструированием in vitro. В некоторых примерах вирусную нуклеиновую кислоту синтезируют de novo. Синтез de novo может включать синтез олигонуклеотидов и сбор их in vitro или in vivo с использо- 30 038595 ванием стандартных методов, известных в данной области техники. В некоторых примерах вирусную нуклеиновую кислоту амплифицируют перед расщеплением, таким как, например, с ПЦРамплификацией.
В некоторых аспектах настоящее раскрытие обеспечивает набор для конструирования вирусной последовательности, включающий: (а) выделенную нетермостабильную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; (b) краудинг-агент; (с) выделенную термостабильную непересекающаяся ДНК-полимеразу с 3'-экзонуклеазной активностью или смесь указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; (d) выделенную термостабильную лигазу; (е) смесь дНТФ; (f) подходящий буфер; и (g) очищенную рекомбинантную РНКнаправляемую нуклеазу. В некоторых примерах РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9. В некоторых примерах набор дополнительно содержит специально разработанные нацеливающие РНК. В некоторых примерах нацеливающие РНК представляют собой химерные гРНК или сгРНК и tracrPHK. В некоторых примерах набор дополнительно содержит специально разработанные синтезированные молекулы нуклеиновой кислоты, предназначенные для использования в качестве вставленного фрагмента ДНК в реакции сборки. В некоторых примерах набор дополнительно содержит компетентные клетки-хозяева. В некоторых примерах набор дополнительно содержит выделенные вирусные нуклеиновые кислоты.
В некоторых аспектах настоящее раскрытие обеспечивает систему для конструирования in vitro вирусной нуклеиновой кислоты, содержащей выделенную вирусную нуклеиновую кислоту, рекомбинантную РНК-направляемую нуклеазу, по меньшей мере одну нацеливающую РНК и фрагмент ДНК или РНК, которые будут собраны в выделенную вирусную нуклеиновую кислоту в сайте расщепления. В некоторых примерах выделенная вирусная нуклеиновая кислота представляет собой полный геном, выделенный из вирусных частиц. В некоторых примерах выделенная вирусная нуклеиновая кислота представляет собой часть вирусного генома, который субклонируется в плазмиду и выделяется из клеткихозяина. В некоторых примерах РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9. В некоторых примерах нацеливающая РНК представляет собой сгРНК и tracrPHK. В некоторых примерах нацеливающая РНК представляет собой химерную гидовую РНК (гРНК). В некоторых примерах существует две нацеливающие РНК или гРНК. В некоторых примерах имеется два набора сгРНК и tracrPHK.
В некоторых аспектах изобретение обеспечивает систему сконструированной вирусной нуклеиновой кислоты in vitro, содержащую выделенную вирусную нуклеиновую кислоту, рекомбинантную РНКнаправляемую нуклеазу, по меньшей мере одну нацеливающую РНК и фрагмент нуклеиновой кислоты, который должен быть вставлен в сайт расщепления выделенной нуклеиновой кислоты. В некоторых примерах система такова, что рекомбинантная РНК-направляемая нуклеаза и по меньшей мере одна нацеливающая РНК образуют комплекс, способный расщеплять выделенную вирусную нуклеиновую кислоту. В некоторых примерах система дополнительно содержит спермидин. В некоторых примерах система дополнительно содержит выделенную нетермостабильную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; краудинг-агент; выделенную термостабильную невытесняющую ДНКполимеразу с 3'-экзонуклеазной активностью или смесью указанной ДНК-полимеразы со второй ДНКполимеразой, которая не обладает 3'-экзонуклеазной активностью; выделенную термостабильную лигазу; смесь дНТФ; и подходящий буфер, в котором система находится в условиях, эффективных для вставки фрагмента нуклеиновой кислоты в выделенную вирусную нуклеиновую кислоту в месте расщепления РНК-направлямой нуклеазы с образованием рекомбинантной вирусной нуклеиновой кислоты.
В некоторых аспектах система, описанная в настоящем документе, такова, что рекомбинантная вирусная нуклеиновая кислота способна продуцировать не встречающиеся в природе вирусные частицы по меньшей мере с одним улучшенным вирусным свойством по сравнению с эталонной и/или несконструированной вирусной нуклеиновой кислотой. В некоторых примерах улучшенное вирусное свойство выбирают из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотикочувстительности бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых аспектах в системе, описанной в настоящем документе, РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9. В некоторых примерах РНК-направляемую нуклеазу инактивируют или удаляют после расщепления.
Способ, описанный в настоящем документе, может быть использован в нескольких других вирусных геномах и вирусных векторных конструкциях, используемых для модификации геномов РНК путем прямого редактирования генома РНК или ДНК-матрицы, который затем будет транскрибироваться in vitro в вирусную РНК, используемую для конструирования и непосредственного изменения вирусов как прокариотов, так и эукариотов, и используется для непосредственной модификации вирусных геномов, используемых для отображения фагов, фаговой терапии, вирусной диагностики или разработки/производства вакцин.
- 31 038595
В некоторых аспектах настоящее раскрытие обеспечивает рекомбинантную вирусную нуклеиновую кислоту, вырабатываемую любым из способов, описанных в настоящем документе. В некоторых примерах рекомбинантная вирусная нуклеиновая кислота способна продуцировать не встречающиеся в природе вирусные частицы по меньшей мере с одним улучшенным вирусным свойством по сравнению с несконструированной вирусной нуклеиновой кислотой. В некоторых примерах улучшенное вирусное свойство выбрано из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотикочувстительности бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых аспектах настоящее раскрытие обеспечивает сконструированную вирусную композицию, содержащую рекомбинантную нуклеиновую кислоту, способную продуцировать не встречающиеся в природе вирусные частицы по меньшей мере с одним улучшенным вирусным свойством по сравнению с несконструированной вирусной нуклеиновой кислотой. В некоторых примерах улучшенное вирусное свойство выбирают из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотикочувстительности бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина. В некоторых примерах сконструированную вирусную нуклеиновую кислоту в соответствии с настоящим изобретением получают любым из этапов, описанных в настоящем документе, способов.
Данный способ может быть использован для изменения нуклеотида, гена или цельной геномной области. Например, как описано в приведенных ниже примерах, данный способ, как было показано, заменяет ген gp18 LKD16 на LUZ19, что приводит к улучшению чувствительности к кругу вирусных хозяев. Кроме того, данный способ может быть использован для вставки единственной мутации в комплекс трубок вируса для улучшения репликации вируса. Данный способ также может быть использован для конструирования антимикробных пептидов; пиоцинов; ЭПС-деполимераз; белков, ингибирующих CRISPR/Cas; хвостовых волокон из бактериофага; репортерных генов (т.е. Lux, GFP); генов для подавления кворума; нуклеаз; нуклеаз TALEN; белков системы CRISPR типа I, типа II, типа III, типа IV, типа V и типа VI (т.е. Cas9); CRISPR РНК, факторов транскрипции и иммуномодулирующих факторов человека в бактериофаге для улучшения активности бактериофага в бактериофаговой терапии или связанных с ним применениях. Данные элементы могут быть функционально связаны с нативными или гетерологичными регуляторными элементами, такими как нативный промотор, гетерологичный промотор, индуцируемый промотор или любой их комбинацией.
В некоторых вариантах реализации настоящее изобретение относится к сконструированному вирусу, содержащему сконструированную вирусную нуклеиновую кислоту, способную при введении в клетку-хозяина продуцировать вирусные частицы, не встречающиеся в природе, с двумя или более улучшенными вирусными свойствами по сравнению с несконструированной вирусной нуклеиновой кислотой. В некоторых аспектах полученные вирусные частицы имеют по меньшей мере три улучшенных вирусных свойства. В некоторых аспектах каждое улучшенное вирусное свойство выбрано из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотиокочувстительности бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых вариантах реализации настоящее изобретение относится к сконструированному вирусу, содержащему сконструированную вирусную нуклеиновую кислоту. В некоторых аспектах сконструированная вирусная нуклеиновая кислота представляет собой сконструированный вирусный геном. В некоторых аспектах сконструированный вирусный геном представляет собой сконструированный геном бактериофага. В некоторых аспектах у сконструированного бактериофага по меньшей мере одним из улучшенных вирусных свойств является круг хозяев.
В некоторых вариантах реализации настоящее раскрытие обеспечивает сконструированный вирус с двумя или более улучшенными вирусными свойствами, который содержит сконструированную вирусную нуклеиновую кислоту. В некоторых аспектах каждое улучшенное вирусное свойство является результатом по меньшей мере одной модификации в сконструированной вирусной нуклеиновой кислоте. В некоторых аспектах по меньшей мере одно улучшенное вирусное свойство является результатом по меньшей мере двух модификаций в сконструированной вирусной нуклеиновой кислоте. В некоторых аспектах модификации, содержащиеся в сконструированной вирусной нуклеиновой кислоте, являются результатом одного этапа конструирования. В некоторых аспектах модификации, содержащиеся в сконструированной вирусной нуклеиновой кислоте, являются результатом неоднократно повторяемых этапов конструирования.
В некоторых вариантах реализации настоящее раскрытие обеспечивает сконструированный вирус с
- 32 038595 двумя или более улучшенными вирусными свойствами, который содержит сконструированную вирусную нуклеиновую кислоту.
В некоторых аспектах по меньшей мере одна из модификаций находится в последовательности нуклеиновой кислоты, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, 100% или полную идентичность с последовательностью, содержащейся в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 50 или SEQ ID NO: 25.
В некоторых аспектах по меньшей мере одна из модификаций находится в последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 5, SEQ ID NO: 48 или SEQ ID NO: 49.
В некоторых аспектах сконструированный вирусный геном содержит все или часть вирусного генома, имеющего по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит весь или часть гетерологичного гена gp18. В некоторых аспектах гетерологичный ген gp18 имеет по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 26. В некоторых аспектах гетерологичный ген gp18 кодирует аминокислотную последовательность с по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полной идентичностью с SEQ ID NO: 38.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит весь или часть сконструированного гена gp34. В некоторых аспектах сконструированный ген gp34 кодирует аминокислотную последовательность, содержащую мутацию в положении, соответствующем положению 55 аминокислоты SEQ ID NO: 5. В некоторых аспектах гетерологичный ген gp34 имеет по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 4.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в одной или более последовательностях, имеющих по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 50.
В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в каждой последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 1, последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 2, последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 3 и последовательности, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 50. В некоторых аспектах модификации включают замену G на А в положении, соответствующем положению 50 нуклеиновой кислоты SEQ ID NO: 1, замену G на Т в положении, соответствующем положению 160 нуклеиновой кислоты SEQ ID NO: 50, замену А на G в положении, соответствующем положению 245 нуклеиновой кислоты SEQ ID NO: 2, замену AT на ТС в положениях, соответствующим положениям нуклеиновой кислоты 247-248 SEQ ID NO: 2 и замену А на G в положении, соответствующем положению 757 нуклеиновой кислоты SEQ ID NO: 3.
- 33 038595
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в одной или более последовательностях нуклеиновой кислоты, кодирующих аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 и SEQ ID NO: 48.
В некоторых аспектах сконструированный вирусный геном содержит модификацию последовательности нуклеиновой кислоты, кодирующей каждую из аминокислотной последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 34, аминокислотной последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 35, аминокислотной последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 36, и аминокислотной последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 48. В некоторых аспектах модификации включают замену С на Y в положении, соответствующем аминокислотному положению 17 SEQ ID NO: 34, замену D на Y в положении, соответствующем аминокислотному положению 36 SEQ ID NO: 48, замену D на G в положении, соответствующем аминокислотной позиции 82 SEQ ID NO: 35, замену I на S в положении, соответствующем аминокислотному положению 83 SEQ ID NO: 35 и замену N на D в положении, соответствующем аминокислотному положению 253 SEQ ID NO: 36.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 25. В некоторых аспектах модификация представляет собой введение молекулы гетерологичной нуклеиновой кислоты в последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 25 или замену последовательности, содержащейся в последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 25 с гетерологичной молекулой нуклеиновой кислоты. В некоторых аспектах гетерологичная молекула нуклеиновой кислоты содержит гетерологичную последовательность нуклеиновой кислоты, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 и SEQ ID NO: 20.
В некоторых аспектах сконструированный вирусный геном содержит весь или часть вирусного генома, имеющего по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с геномом LUZ19. В некоторых аспектах сконструированный вирусный геном дополнительно содержит модификацию в последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 49. В некоторых аспектах модификация представляет собой введение гетероличной молекулы нуклеиновой кислоты в последовательность нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по
- 34 038595 меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 49 или замену последовательности нуклеиновой кислоты, содержащейся в последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 49 с гетерологичной молекулой нуклеиновой кислоты. В некоторых аспектах гетерологичная молекула нуклеиновой кислоты содержит гетерологичную последовательность нуклеиновой кислоты, кодирующую аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 46 и SEQ ID NO: 47.
В некоторых аспектах сконструированная вирусная нуклеиновая кислота содержит гетерологичную последовательность нуклеиновой кислоты, функционально связанную с промотором, содержащим последовательность нуклеиновой кислоты, содержащуюся в SEQ ID NO: 21 или ее часть.
В некоторых аспектах сконструированная вирусная нуклеиновая кислота содержит гетерологичную последовательность нуклеиновой кислоты, функционально связанную с терминатором, содержащим последовательность нуклеиновой кислоты, содержащуюся в SEQ ID NO: 22, или ее часть.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более необходимыми вирусными свойствами, включающий: (а) обеспечение первого вирусного генома; и (b) конструирование второго вирусного генома путем объединения по меньшей мере одного фрагмента первого вирусного генома с по меньшей мере одной молекулой восстанавливающей нуклеиновой кислоты, так что полученный второй вирусный геном содержит по меньшей мере одну модификацию по сравнению с первым вирусным геномом и при этом при введении в клетку-хозяина второй вирусный геном способен продуцировать вирусные частицы с двумя или более улучшенными вирусными свойствами. В некоторых аспектах способ, описанный в настоящем документе, дополнительно включает (с) повторение этапов (а)-(b) в одном или более циклах. В некоторых аспектах каждое улучшенное вирусное свойство выбрано из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотиокочувствительности бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более необходимыми вирусными свойствами, описанными в настоящем документе. В некоторых аспектах конструирование второго вирусного генома на стадии (b) дополнительно включает: (1) расщепление in vitro области первого вирусного генома с использованием эндонуклеазы; и (2) сборку по меньшей мере одного фрагмента расщепленного первого вирусного генома по меньшей мере с одной молекулой восстанавливающей нуклеиновой кислоты. В некоторых аспектах первый вирусный геном выделяется из вирусных частиц. В некоторых аспектах первый вирусный геном или по меньшей мере одну восстанавливающую молекулу нуклеиновой кислоты синтезируют de novo. В некоторых аспектах синтез de novo включает объединение химически синтезированных молекул нуклеиновой кислоты, последовательностей нуклеиновой кислоты с амплифицированной ПЦР, расщепленных фрагментов выделенных молекул нуклеиновой кислоты или любой их комбинации. В некоторых аспектах первый вирусный геном или по меньшей мере одну восстанавливающую молекулу нуклеиновой кислоты амплифицируют перед расщеплением in vitro.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более желательными вирусными свойствами, описанными в настоящем документе. В некоторых аспектах первый вирусный геном составляет по меньшей мере 18 т.п.н. В некоторых аспектах первый вирусный геном составляет от по меньшей мере 2 т.п.н. до по меньшей мере 4 млн п.н. В некоторых аспектах первый вирусный геном составляет от по меньшей мере 18 т.п.н. до по меньшей мере 4 млн п.н. В некоторых аспектах первый вирусный геном составляет по меньшей мере 5 т.п.н., по меньшей мере 10 т.п.н., по меньшей мере 15 т.п.н., по меньшей мере 18 т.п.н., по меньшей мере 20 т.п.н., по меньшей мере 25 т.п.н., по меньшей мере 30 т.п.н., по меньшей мере 35 т.п.н., по меньшей мере 40 т.п.н., по меньшей мере 45 т.п.н., по меньшей мере 50 т.п.н., по меньшей мере 55 т.п.н., по меньшей мере 60 т.п.н., по меньшей мере 65 т.п.н., по меньшей мере 70 т.п.н., по меньшей мере 75 т.п.н., по меньшей мере 80 т.п.н., по меньшей мере 85 т.п.н., по меньшей мере 90 т.п.н., по меньшей мере 100 т.п.н., по по меньшей мере 125 т.п.н., по меньшей мере 150 т.п.н., по меньшей мере 175 т.п.н., по меньшей мере 200 т.п.н., по меньшей мере 250 т.п.н., по меньшей мере 300 т.п.н., по меньшей мере 400 т.п.н., по меньшей мере 500 т.п.н., по меньшей мере 600 т.п.н., по меньшей мере 700 т.п.н., по меньшей мере 800 т.п.н., по меньшей мере 900 т.п.н., по меньшей мере 1 млн
- 35 038595
п.н., по меньшей мере 1,5 млн п.н., по меньшей мере 2 млн п.н., по меньшей мере 2,5 млн п.н., по меньшей мере 3 млн п.н. или по меньшей мере 3,5 млн п.н.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более желательными вирусными свойствами, описанными в настоящем документе. В некоторых аспектах сборку выполняют in vitro или in vivo. В некоторых аспектах сборку выполняют in vitro при помощи смеси, содержащей: (а) выделенную нетермостабильную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; (b) краудинг-агент; (с) выделенную термостабильную невытесняющую ДНК-полимеразу с 3'экзонуклеазной активностью или смесь указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; (d) выделенную термостабильную лигазу; (е) смесь дНТФ; и (f) подходящий буфер в условиях, эффективных для вставки фрагмента в расщепленную вирусную нуклеиновую кислоту с образованием рекомбинантной нуклеиновой кислоты, содержащей сконструированный вирусный геном.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более желательными вирусными свойствами, описанными в настоящем документе. В некоторых аспектах сборку выполняют in vitro или in vivo. В некоторых аспектах сборку выполняют in vivo в клетке-хозяина.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более желательными вирусными свойствами, описанными в настоящем документе. В некоторых аспектах эндонуклеаза представляет собой РНК-направляемую нуклеазу. В некоторых аспектах способ дополнительно включает одну или две направляющие РНК. В некоторых аспектах РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9. В некоторых аспектах направляющие РНК включают: 1) химерную гРНК или; 2) сгРНК и tracrPHK.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более желательными вирусными свойствами, описанными в настоящем документе. В некоторых аспектах эндонуклеазу инактивируют нагреванием или удаляют. В некоторых аспектах система расщепления in vitro дополнительно содержит спермидин.
В некоторых вариантах реализации настоящее раскрытие обеспечивает способ получения сконструированного вируса, представляющего интерес, обладающего двумя или более желательными вирусными свойствами, описанными в настоящем документе. В некоторых аспектах способ дополнительно включает трансформацию сконструированного вирусного генома в клетку-хозяина. В некоторых аспектах способ дополнительно включает использование упаковочного набора in vitro для упаковки сконструированного вирусного генома в вирусные частицы.
В некоторых вариантах реализации настоящее раскрытие обеспечивает сконструированный вирус, полученный любым из способов, описанных в настоящем документе.
В некоторых вариантах реализации настоящее раскрытие обеспечивает композиции любого из сконструированных вирусов, описанных в настоящем документе, получаемых любым из способов конструирования, описанных в настоящем документе.
В некоторых вариантах реализации настоящее раскрытие обеспечивает набор для конструирования молекул вирусной нуклеиновой кислоты, включающий очищенную рекомбинантную РНК-направляемую нуклеазу; выделенную нетермостабильную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; краудинг-агент; выделенную термостабильную невытесняющую ДНК-полимеразу с 3'экзонуклеазной активностью или смесь указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; выделенную термостабильную лигазу; смесь дНТФ; и подходящий буфер. В некоторых аспектах набор дополнительно содержит специально разработанные гидовые РНК. В некоторых аспектах набор дополнительно содержит специально разработанные синтезированные молекулы нуклеиновой кислоты, предназначенные для использования в качестве вставленного фрагмента ДНК в реакции сборки. В некоторых аспектах набор дополнительно содержит компетентные клетки-хозяева для трансформации. В некоторых аспектах набор дополнительно содержит выделенные вирусные геномные нуклеиновые кислоты.
В некоторых аспектах настоящее раскрытие обеспечивает систему сконструированной вирусной нуклеиновой кислоты in vitro, содержащую выделенную вирусную нуклеиновую кислоту, нуклеазу, рекомбинантную РНК-направляемую нуклеазу, по меньшей мере одну нацеливающую РНК и фрагмент нуклеиновой кислоты, который должен быть вставлен в сайт расщепления выделенной нуклеиновой кислоты. В некоторых примерах система такова, что рекомбинантная РНК-направляемая нуклеаза и по меньшей мере одна нацеливающая РНК образуют комплекс, способный расщеплять выделенную вирусную нуклеиновую кислоту. В некоторых примерах система дополнительно содержит спермидин. В некоторых примерах система дополнительно содержит выделенную нетермостабильную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; краудинг-агент; выделенную термостабильную невытесняющую ДНК-полимеразу с 3'-экзонуклеазной активностью или смесью указанной ДНК-полиме- 36 038595 разы со второй ДНК-полимеразой, которая не обладает З'-экзонуклеазной активностью; выделенную термостабильную лигазу; смесь дНТФ; и подходящий буфер, в котором система находится в условиях, эффективных для вставки фрагмента нуклеиновой кислоты в выделенную вирусную нуклеиновую кислоту в месте расщепления РНК-направлямой нуклеазы с образованием рекомбинантной вирусной нуклеиновой кислоты.
В некоторых аспектах система, описанная в настоящем документе, такова, что рекомбинантная вирусная нуклеиновая кислота способна продуцировать вирусные частицы, не встречающиеся в природе, по меньшей мере с одним улучшенным вирусным свойством по сравнению с несконструированной вирусной нуклеиновой кислотой. В некоторых примерах улучшенное вирусное свойство выбирают из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагам, антибиотикочувствительности бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина.
В некоторых аспектах в системе, описанной в данном документе, РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9. В некоторых примерах РНК-направляемую нуклеазу инактивируют или удаляют после расщепления.
В некоторых аспектах способ, описанный в настоящем документе, используют в качестве способа коррекции ошибок для коррекции последовательностей в выделенных нуклеиновых кислотах. Стандартные методы коррекции ошибок основаны на ПЦР, имеют две неотъемлемые проблемы: 1) ПЦР может вводить дополнительные нежелательные мутации в нуклеиновую кислоту; и 2) ПЦР в этом контексте имеет ограничение по размеру приблизительно 5 т.п.н. Поэтому стандартные методы коррекции ошибок на основе ПЦР не могут быть надежно выполнены на плазмидах размером более 5 т.п.н., либо в результате мутаций, вызванных ПЦР, либо в случае невозможности усиления. Описанный в настоящем документе способ конструирования in vitro последовательности нуклеиновой кислоты обходит необходимость ПЦР-амплификации, которая устраняет ограничение по размеру и исключает возможность возникновения мутаций, вызванных ПЦР.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro последовательности нуклеиновой кислоты, включающей выделение нуклеиновой кислоты; расщепление in vitro области нуклеиновой кислоты с использованием РНК-направляемой нуклеазы; и сборку рекомбинантной нуклеиновой кислоты путем вставки фрагмента ДНК или РНК в расщепленную нуклеиновую кислоту. В одном аспекте расщепление in vitro представляет собой ферментативное расщепление, основанное на РНК. В другом аспекте ферментативное расщепление проводят с использованием Cas9 или фермента, полученного из Cas9. В дополнительном аспекте расщепление дополнительно включает нацеливающие РНК. В другом аспекте система расщепления дополнительно содержит спермидин. В конкретном аспекте нацеливающие РНК представляют собой гРНК, сгРНК и/или tracrPHK. В дополнительном аспекте после расщепления РНК-направляемую нуклеазу инактивируют стандартными методами, таким как воздействием тепла, например, такими как по меньшей мере 80°C. Дополнительно или альтернативно, РНКнаправляемую нуклеазу удаляют стандартными способами, такими как, например, фенольно-хлороформной экстракцией.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro последовательности нуклеиновой кислоты, включающий выделение нуклеиновой кислоты; расщепления in vitro области нуклеиновой кислоты с использованием РНК-направляемой нуклеазы; и сборку рекомбинантной нуклеиновой кислоты путем вставки фрагмента ДНК или РНК в расщепленную нуклеиновую кислоту. В некоторых примерах сборку проводят in vitro в одном сосуде со смесью компонентов, включающих: (а) выделенную нетермостабильную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью; (b) краудинг-агент; (с) выделенную термостабильную невытесняющую ДНК-полимеразу с 3'экзонуклеазной активностью или смесью указанной ДНК-полимеразы со второй ДНК-полимеразой, которая не обладает 3'-экзонуклеазной активностью; (d) выделенную термостабильную лигазу; (е) смесь дНТФ; и (f) подходящий буфер в условиях, эффективных для вставки фрагмента в расщепленную вирусную нуклеиновую кислоту с образованием рекомбинантной нуклеиновой кислоты. В некоторых аспектах экзонуклеаза представляет собой экзонуклеазу Т5, и приведение в контакт происходит в изотермических условиях, и/или краудинг-агент представляет собой ПЭГ, и/или невытесняющая ДНК-полимераза представляет собой ДНК-полимеразу Phusion™ или ДНК-полимеразу VENT® и/или лигаза представляет собой Taq-лигазу. В некоторых примерах сборку in vitro выполняют при помощи одноступенчатой или изотермической сборки методом Gibson Assembly. В некоторых примерах сборку in vitro выполняют при помощи двухступенчатой сборки методом Gibson Assembly.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro последовательности нуклеиновой кислоты, содержащей РНК-направляемую нуклеазу. В некоторых примерах РНК-направляемая нуклеаза представляет собой Cas9 II типа. В некоторых примерах РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9. В некоторых примерах РНКнаправляемая нуклеаза представляет собой выделенный рекомбинантный фермент Cas9 или Cas9. В не- 37 038595 которых примерах существует по меньшей мере одна нацеливающая РНК. В некоторых примерах существуют две нацеливающие РНК. В некоторых примерах нацеливающая РНК представляет собой химерную гидовую РНК (гРНК) или набор сгРНК и tracrPHK. В некоторых примерах в реакции расщепления in vitro используют две гРНК. В некоторых примерах в реакции расщепления in vitro используют два набора сгРНК и tracrPHK.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro последовательности нуклеиновой кислоты, включающий этап расщепления in vitro. В некоторых примерах после расщепления РНК-направляемую нуклеазу инактивируют стандартными методами, такими как воздействие теплом, таким как, например, по меньшей мере 80°. В некоторых примерах после расщепления РНКнаправляемую нуклеазу удаляют фенольно-хлороформной экстракцией. В некоторых примерах после расщепления РНК-направляемую нуклеазу удаляют другими способами экстракции, хорошо известными в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro последовательности нуклеиновой кислоты, приводящей к образованию сконструированной нуклеиновой кислоты. В некоторых примерах сконструированную нуклеиновую кислоту затем трансформируют в клеткухозяин. В некоторых примерах клетка-хозяин представляет собой Е.coli, Р.aeruginosa, S.cerevisiae, V.natriegens, В.subtilis или другой микроорганизм, хорошо известный в данной области техники. В некоторых примерах трансформацию выполняют путем теплового шока, электропорации, биолистики, бомбардировки частиц, конъюгации, трансдукции, липофекции или другого известного метода, хорошо известного в данной области техники.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro последовательности нуклеиновой кислоты, содержащей выделенную нуклеиновую кислоту. В некоторых примерах нуклеиновая кислота представляет собой полный геном, выделенный из клетки-хозяина. В некоторых примерах клетка-хозяин представляет собой Е.coli, S.cerevisiae, В.subtilis, V.natriegens, P.aeruginosa или другой известный микроорганизм. В некоторых примерах нуклеиновая кислота представляет собой плазмиду. В некоторых примерах плазмиду выделяют из клетки-хозяина. В некоторых примерах нуклеиновую кислоту, представляющую интерес, клонировали в плазмиду, трансформировали в клетку-хозяин и выделяли до конструирования по способу, описанному в настоящем документе.
В некоторых аспектах настоящее раскрытие обеспечивает способ конструирования in vitro последовательности нуклеиновой кислоты, включающей выделение нуклеиновой кислоты. В некоторых примерах выделенная нуклеиновая кислота представляет собой геном или плазмиду. В некоторых примерах выделенный геном или плазмида составляет по меньшей мере 6 т.п.н., по меньшей мере 7 т.п.н., по меньшей мере 8 т.п.н., по меньшей мере 9 т.п.н., по меньшей мере 10 т.п.н., по меньшей мере 12 т.п.н., по меньшей мере 15 т.п.н., по меньшей мере 20 т.п.н., по меньшей мере 25 т.п.н. или по меньшей мере 28 т.п.н. В некоторых примерах выделенный геном или плазмида составляет от 6 т.п.н. до 1 млн п.н. В некоторых примерах выделенный геном или плазмида составляет: от 6 до 10 т.п.н., от 8 до 15 т.п.н., от 12 до 20 т.п.н., от 15 до 22 т.п.н., от 20 до 25 т.п.н., от 22 до 28 т.п.н., от 25 до 30 т.п.н., от 25 до 50 т.п.н. или от 40 до 100 т.п.н.
Дополнительно или, альтернативно, к любому из вышеописанных вариантов реализации раскрытие включает следующие варианты реализации изобретения.
Вариант реализации изобретения 1 представляет собой сконструированный вирус, содержащий сконструированную вирусную нуклеиновую кислоту, способную при введении в клетку-хозяина продуцировать не встречающиеся в природе вирусные частицы с двумя или более, или, возможно, тремя или более улучшенными вирусными свойствами по сравнению с вирусными частицами, продуцируемыми при введении несконструированной вирусной нуклеиновой кислоты в клетку-хозяина.
Вариант реализации изобретения 2 представляет собой сконструированный вирус согласно варианту реализации изобретения 1, при этом каждое улучшенное вирусное свойство выбрано из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагу, антибиотической сенсибилизации бактерий, модуляции факторов вирулентности и направленного расщепления и редактирования генома хозяина.
Вариант реализации изобретения 3 представляет собой сконструированный вирус согласно варианту реализации изобретения 1 или 2, причем вирусная нуклеиновая кислота представляет собой одну или более из следующих вирусных нуклеиновых кислот: вирусный геном, фрагмент вирусного генома, генома бактериофага, фрагмент генома бактериофага, геном литического бактериофага, фрагмент генома литического бактериофага или любую их комбинацию.
Вариант реализации изобретения 4 представляет собой сконструированный вирус любого из вариантов реализации изобретения 1-3, причем сконструированная вирусная нуклеиновая кислота представляет собой геном бактериофага и необязательно при этом по меньшей мере одно из улучшенных вирусных свойств представляет собой круг хозяев.
Вариант реализации изобретения 5 представляет собой сконструированный вирус любого из вари- 38 038595 антов реализации изобретения 1-4, причем выполняется по меньшей мере одно из следующего: 1) каждое улучшенное вирусное свойство является результатом по меньшей мере одной модификации в сконструированной вирусной нуклеиновой кислоте; 2) по меньшей мере одно улучшенное вирусное свойство является результатом по меньшей мере двух модификаций в сконструированной вирусной нуклеиновой кислоте; 3) модификации, содержащиеся в вирусной нуклеиновой кислоте, являются результатом одного этапа конструирования, 4) модификации, содержащиеся в сконструированной вирусной нуклеиновой кислоте, являются результатом итерации этапов конструирования или 5) любой их комбинации.
Вариант реализации изобретения 6 представляет собой сконструированный вирус любого из вариантов реализации изобретения 1-5, в котором по меньшей мере одна из модификаций находится внутри:
1) последовательности нуклеиновой кислоты, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, содержащейся в SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 50 или SEQ ID NO: 25, или
2) последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 5, SEQ ID NO: 48 или SEQ ID NO: 49, или
3) любой их комбинации.
Вариант реализации изобретения 7 представляет собой сконструированный вирус согласно любому из вариантов реализации изобретения 1-6, причем сконструированная вирусная нуклеиновая кислота содержит сконструированный вирусный геном, содержащий весь или часть вирусного генома, имеющего по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с геномом LUZ19.
Вариант реализации изобретения 8 представляет собой сконструированный вирус любого из вариантов реализации изобретения 1-7, причем сконструированный вирусный геном дополнительно содержит по меньшей мере одно из следующего:
1) весь или часть гетерологичного гена gp18 и, необязательно, в котором гетерологичный ген gp18 имеет по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 26;
2) весь или часть гетерологичного гена gp18 и, необязательно, в котором гетерологичный ген gp18 кодирует аминокислотную последовательность с по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полной идентичностью с SEQ ID NO: 38;
3) весь или часть сконструированного гена gp34 и, необязательно, в котором гетерологичный ген gp34 кодирует аминокислотную последовательность, содержащую мутацию в положении, соответствующем положению аминокислоты SEQ ID NO: 5, или необязательно, в котором гетерологичный ген gp34 имеет по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 4;
4) модификацию в одной или более последовательностях, имеющих по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 50, и, необязательно, модификацию в каждой последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 1, последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность SEQ ID NO: 2, последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 3, и последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 50, и, необязательно, в которой модификации включают замену G на А в положении, соответствующем положению 50 нуклеиновой кислоты SEQ ID NO: 1, замену G на Т в положении, соответствующем по- 39 038595 ложению 160 нуклеиновой кислоты SEQ ID NO: 50, замену А на G в положении, соответствующем положению 245 нуклеиновой кислоты SEQ ID NO: 2, замену AT на ТС в положениях, соответствующих положениям нуклеиновой кислоты 247-248 SEQ ID NO: 2 и замену А на G в положении, соответствующем положению 757 нуклеиновой кислоты SEQ ID NO: 3;
5) модификацию в одной или более последовательностях нуклеиновой кислоты, кодирующих аминокислотную последовательность, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность последовательности, выбранной из группы, состоящей из SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 и SEQ ID NO: 48, и, необязательно, модификацию последовательности нуклеиновой кислоты, кодирующей каждую из аминокислотной последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 34, аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 35, аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 36 и аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 48, и, необязательно, в которой модификации включают замену С на Y в положении, соответствующем аминокислотному положению 17 SEQ ID NO: 34, замену D на Y в положении, соответствующем аминокислотному положению 36 SEQ ID NO: 48, D на G в положении, соответствующем аминокислотному положению 82 SEQ ID NO: 35, замену I на S в положении, соответствующем аминокислотному положению 83 SEQ ID NO: 35, и замену N на D в положении, соответствующем аминокислотному положению 2 53 SEQ ID NO: 36;
6) модификацию в последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 25, и, необязательно, в которой модификация представляет собой введение гетерологичной молекулы нуклеиновой кислоты в последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 25 или замену последовательности, содержащейся в последовательности, имеющей по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 25 с гетерологичной молекулой нуклеиновой кислоты, и, необязательно, в которой гетерологичная молекула нуклеиновой кислоты содержит последовательность гетерологичной нуклеиновой кислоты, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 и SEQ ID NO: 20;
7) модификацию в последовательности нуклеиновой кислоты, кодирующую аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 49 и, необязательно, в которой модификация представляет собой введение гетерологичной молекулы нуклеиновой кислоты в последовательность нуклеиновой кислоты, кодирующую аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 49 или заменой последовательности нуклеиновой кислоты, содержащейся в последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 85%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с SEQ ID NO: 49 с гетерологичной молекулой нуклеиновой кислоты, и, необязательно, в которой гетерологичная молекула нуклеиновой кислоты содержит гетерологичную последовательность нуклеиновой кислоты, кодирующую аминокислотную последовательность, имеющую по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%,
- 40 038595 по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95, 100% или полную идентичность с последовательностью, выбранной из группы, состоящей из
SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 44,
SEQ ID NO: 45, SEQ ID NO: 46 и SEQ ID NO: 47,
8) любую их комбинацию.
Вариант реализации изобретения 9 представляет собой сконструированный вирус по любому из вариантов реализации изобретения 1-8, причем сконструированная вирусная нуклеиновая кислота содержит гетерологичную последовательность нуклеиновой кислоты, функционально связанную с 1) промотором, содержащим последовательность нуклеиновой кислоты, содержащуюся в SEQ ID NO: 21, или ее часть, 2) терминатором, содержащим последовательность нуклеиновой кислоты, содержащуюся в SEQ ID NO: 22, или ее часть, или 3) любую их комбинацию.
Вариант реализации изобретения 10 представляет собой способ получения сконструированного вируса, имеющего два или более желательных вирусных свойства, включающий: (а) обеспечение первого вирусного генома; и (b) создание сконструированного вирусного генома путем объединения по меньшей мере одного фрагмента первого вирусного генома с по меньшей мере одной молекулой восстанавливающей нуклеиновой кислоты для получения второго вирусного генома, содержащего по меньшей мере одну модификацию по сравнению с первым вирусным геномом; при этом второй вирусный геном, будучи введенным в клетку-хозяин, способен продуцировать вирусные частицы с двумя или более улучшенными вирусными свойствами и необязательно (с) повторять этапы (а)-(b) в одной или более итерациях.
Вариант реализации изобретения 11 представляет собой вариант реализации изобретения 10, в котором каждое улучшенное вирусное свойство выбрано из группы, состоящей из круга хозяев, вирусного литического цикла, адсорбции, прикрепления, инъекции, репликации и сборки, лизиса, величины выхода фага, ускользания от иммунного надзора, иммунной стимуляции, иммунной дезактивации, дисперсии биопленки, устойчивости бактерий к фагу, антибиотической сенсибилизации бактерий, модуляции факторов вирулентности и направленного расщепления или редактирования генома хозяина.
Вариант реализации изобретения 12 представляет собой способ согласно варианту реализации изобретения 10 или 11, в котором создание сконструированного вирусного генома на стадии (b) включает: (1) расщепление in vitro области первого вирусного генома с использованием эндонуклеазы; и (2) сборку по меньшей мере одного фрагмента расщепленного первого вирусного генома по меньшей мере с одной молекулой восстанавливающей нуклеиновой кислоты.
Вариант реализации изобретения 13 представляет собой способ согласно любому из вариантов реализации изобретения 10-12, в котором выполняется по меньшей мере один из следующих элементов: 1) первый вирусный геном выделяют из вирусных частиц, 2) первую вирусную и/или по меньшей мере одну восстанавливающую молекулу нуклеиновой кислоты синтезируют de novo и, необязательно, в котором синтез de novo включает объединение химически синтезированных молекул нуклеиновой кислоты, ПЦР-амплифицированных последовательностей нуклеиновых кислот, расщепленных фрагментов изолированных молекул нуклеиновой кислоты или любой их комбинации, 3) первый вирусный геном и/или по меньшей мере одну восстанавливающую молекулу нуклеиновой кислоты амплифицируют перед расщеплением in vitro или 4) любую их комбинацию.
Вариант реализации изобретения 14 представляет собой способ согласно любому из вариантов реализации изобретения 10-13, причем первый вирусный геном составляет по меньшей мере одно из следующего:
1) по меньшей мере 3 т.п.н., по меньшей мере 10 т.п.н., по меньшей мере 18 т.п.н., по меньшей мере 25 т.п.н. или по меньшей мере 30 т.п.н.;
2) по меньшей мере 18 т.п.н.;
3) от по меньшей мере 2 т.п.н. до по меньшей мере 4 млн п.н.;
4) от по меньшей мере 18 т.п.н. до по меньшей мере 4 млн п.н.; или
5) по меньшей мере 5 т.п.н., по меньшей мер, 10 т.п.н., по меньшей мере 15 т.п.н., по меньшей мере 18 т.п.н., по меньшей мере 20 т.п.н., по меньшей мере 25 т.п.н., по меньшей мере 30 т.п.н., по меньшей мере 35 т.п.н., по меньшей мере 40 т.п.н., по меньшей мере 45 Kb, по меньшей мере 50 т.п.н., по меньшей мере 55 т.п.н., по меньшей мере 60 т.п.н., по меньшей мере 65 т.п.н., по меньшей мере 70 т.п.н., по меньшей мере 75 т.п.н., по меньшей мере 80 т.п.н., по меньшей мере 85 т.п.н., по меньшей мере 90 т.п.н., по меньшей мере 100 т.п.н., по меньшей мере 125 т.п.н., по меньшей мере 150 т.п.н., по меньшей мере 175 т.п.н., по меньшей мере 200 т.п.н., по меньшей мере 250 т.п.н., по меньшей мере 300 т.п.н., по меньшей мере 400 т.п.н., по меньшей мере 500 т.п.н., по меньшей мере 600 т.п.н., по меньшей мере 700 т.п.н., по меньшей мере 800 т.п.н., по меньшей мере 900 т.п.н., по меньшей мере 1 млн п.н., по меньшей мере 1,5 млн п.н., по меньшей мере 2 млн п.н., по меньшей мере 2,5 млн п.н., по меньшей мере 3 млн п.н. или по меньшей мере 3,5 млн п.н.
Вариант реализации 15 представляет собой способ соглано любому из вариантов реализации изобретения 10-14, в котором сборку выполняют in vitro и, необязательно, в котором сборку выполняют in vitro с помощью смеси, содержащей: (а) выделенную 5'-3'-экзонуклеазу, которая не обладает 3'экзонуклеазной активностью, которая необязательно не термостабильна; (b) необязательно краудинг- 41 038595 агент; (с) выделенную невытесняющую ДНК-полимеразу с З'-экзонуклеазной активностью, которая, необязательно, является термостабильной, или смесь указанной ДНК-полимеразы со второй ДНКполимеразой, которая не обладает 3'-экзонуклеазной активностью; (d) выделенную лигазу, которая, необязательно, является термостабильной; (е) смесь дНТФ; и (f) необязательно подходящий буфер в условиях, эффективных для вставки фрагмента в расщепленную вирусную нуклеиновую кислоту с образованием рекомбинантной нуклеиновой кислоты, содержащей сконструированный вирусный геном.
Вариант реализации изобретения 16 представляет собой способ согласно любому из вариантов реализации изобретения 10-14, в котором сборку выполняют in vivo и, необязательно, в которой сборку in vivo выполняют в клетке-хозяине.
Вариант реализации изобретения 17 представляет собой способ согласно любому из вариантов реализации изобретения 10-16, в котором выполняется по меньшей мере один из следующих элементов: 1) эндонуклеаза представляет собой РНК-направляемую нуклеазу; 2) способ дополнительно включает по меньшей мере одну направляющую РНК; 3) РНК-направляемая нуклеаза представляет собой Cas9 или фермент, полученный из Cas9, и при этом по меньшей мере одна направляющая РНК содержит: (а) химерную гРНК; или (б) сгРНК и tracrPHK; 4) эндонуклеазу подвергают инактивации теплом или удалению перед сборкой; 5) система расщепления in vitro дополнительно содержит спермидин; 6) способ дополнительно включает трансформацию сконструированного вирусного генома в клетку-хозяина; 7) способ дополнительно включает использование упаковочного набора in vitro для упаковки сконструированного вирусного генома в вирусные частицы; или 8) любую их комбинацию.
Вариант реализации изобретения 18 представляет собой модифированный вирус, полученный способом согласно любому из вариантов реализации изобретения 10-17, и необязательно, в котором сконструированный вирус представляет собой сконструированные вирусы согласно любому из вариантов реализации изобретения 1-9.
Вариант реализации изобретения 19 представляет собой набор для сконструированных молекул нуклеиновых кислот, которые являются необязательно молекулами вирусной нуклеиновой кислоты, которые включают: (а) очищенную рекомбинантную РНК-направляемую нуклеазу; (b) выделенную 5'-3'экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью, которая необязательно нетермостабильна; (с) выделенную невытесняющую ДНК-полимеразу с 3'-экзонуклеазной активностью, которая необязательно является термостабильной, или смесь указанной ДНК-полимеразы со второй ДНКполимеразой, которая не обладает 3'-экзонуклеазной активностью; (d) выделенную лигазу, которая необязательно является термостабильной; и необязательно дополнительно включает любое из следующего: 1) краудинг-агент, 2) смесь дНТФ, 3) подходящий буфер, 4) специально разработанные направляющие РНК, 5) специально разработанные синтезированные молекулы нуклеиновой кислоты, предназначенные для использования в качестве вставленного фрагмента ДНК в реакции сборки, 6) компетентные клеткихозяева для трансформации, 7) выделенную вирусную геномную нуклеиновую кислоту или 8) любую их комбинацию.
Вариант реализации изобретения 20 представляет собой способ модификации последовательности нуклеиновой кислоты, включающий: (а) предоставление нуклеиновой кислоты; (b) расщепление in vitro области нуклеиновой кислоты с использованием РНК-направляемой нуклеазы; и (с) сборку рекомбинантной нуклеиновой кислоты путем вставки фрагмента ДНК в расщепленную нуклеиновую кислоту, причем сборку проводят in vitro в одном сосуде со смесью компонентов, включающих: (i) выделенную 5'-3'-экзонуклеазу, которая не обладает 3'-экзонуклеазной активностью, которая необязательно не термостабильна; (ii) выделенную невытесняющую ДНК-полимеразу с 3'-экзонуклеазной активностью, которая необязательно является термостабильной, или смесь указанной ДНК-полимеразы со второй ДНКполимеразой, которая не обладает 3'-экзонуклеазной активностью; (iii) изолированную лигазу, которая необязательно является термостабильной; (iv) смесь дНТФ в условиях, которые являются эффективными для вставки фрагмента в расщепленную нуклеиновую кислоту с образованием рекомбинантной нуклеиновой кислоты и, необязательно, в которой сборка in vitro дополнительно содержит (v) краудинг-агент или (vi) подходящий буфер.
Вариант реализации изобретения 21 представляет собой способ согласно варианту реализации изобретения 20, в котором, по меньшей мере, выполняется один из следующих элементов: 1) РНКнаправляемая нуклеаза представляе собой Cas9 или фермент, полученный из Cas9; 2) РНК-направляемая нуклеаза подвергается инактивации теплом или удалению перед сборкой; 3) способ дополнительно включает трансформацию рекомбинантной нуклеиновой кислоты в клетку-хозяина; 4) нуклеиновая кислота представляет собой плазмиду, выделенную из клетки-хозяина, и необязательно, при этом плазмида составляет по меньшей мере 6 т.п.н., по меньшей мере 10 т.п.н., по меньшей мере 15 т.п.н. или по меньшей мере 20 т.п.н. или 5) любую их комбинацию.
Раскрытие во всех его аспектах проиллюстрировано дополнительно в следующих примерах. Однако примеры не ограничивают объем настоящего раскрытия, который определен прилагаемой формулой изобретения. Обсуждение общих способов, приведенных в настоящем документе, предназначено только для иллюстративных целей. Другие альтернативные способы и варианты реализации настоящего изобретения будут очевидны специалистам в данной области техники после рассмотрения настоящего описания
- 42 038595 и должны быть включены в сущность и сферу действия настоящей заявки.
Примеры
Пример I.
Модификация вирусного генома in vitro.
т.п.н. дцДНК вирусного генома (номер доступа NC_010326.1) было выделено из вирусных частиц, например, с использованием набора для выделения ДНК фагов Norgen Biotek или любых других способов, известных специалистам в данной области техники (фиг. 2А). Сайт-специфическое расщепление выполняли с использованием РНК-направляемой нуклеазы Cas9 и транскрибируемых in vitro гРНК в двух независимых местах. Нерасщепленная геномная ДНК размером 43 т.п.н. мигрирует значительно меньше, чем самая большая маркерная полоса ДНК (10 т.п.н.). Расщепление линейного генома дает фрагменты трех размеров: ~ 39 т.п.н., ~ 4,3 т.п.н. и ~ 200 п.о. Нацеливающие гРНК использовали в избытке и блокировали фрагмент в 200 п.о. (фиг. 2Б). Фрагмент gp7 из ФКР77 был ПЦР-амплифицирован (фиг. 2В) с использованием праймеров, содержащих 5'-хвосты с гомологией 100 п.о. к областям, непосредственно расположенным в прямом и обратном направлении от сайтов расщепления LUZ19. Метод сборки Gibson Assembly был использован для бесшовной вставки ПЦР-амплифицированного фрагмента gp7 ФКР77 (SEQ ID NO: 8) в расщепленный геном LUZ19 для замены нативной области gp7 (SEQ ID NO: 23) (фиг. 2Г). Наблюдали небольшой фон, так как Cas9-расщепление приводит к двухцепочечному разрыву ДНК с тупыми концами, который не имеет гомологии, необходимой для сборки методом Gibson Assembly in vitro. Отредактированные in vitro геномы трансформировали непосредственно в клеткихозяева, чтобы получить функциональные вирусные частицы (фиг. 2Д). Вставку фрагмента гена ФКР77 в восстановленные вирусы проверяли с использованием ПЦР с праймерами, внутренними и внешними по отношению к области модификации. Неотредактированную геномную ДНК LUZ19 использовали как отрицательный контроль, тогда как все экспериментальные вирусы содержали новый фрагмент гена ФКР7 7 (последние 7 полос).
Эти данные представляют собой пример применения in vitro вирусной инженерии для редактирования генома литического фага P.aeruginosa. Сконструированный фаг, такой как LUZ19, не может быть получен стандартными методами из-за эффектов токсичности в гетерологичных бактериальных хозяевах, таких как E.coli, отсутствия селективных маркеров, подходящих для вирулентных вирусов, и отсутствия уникальных сайтов для стандартных ферментов рестрикции в геноме LUZ19. Поэтому эти данные демонстрируют, как описанный в настоящем документе, способ модификации in vitro позволяет осуществлять прямое и быстрое конструирование других генетически несовместимых вирусных геномов.
Для трансформаций в P.aeruginosa были получены химически компетентные клетки P.aeruginosa, как описано в Irani and Rowe (Irani V.R. & Rowe J.J. BioTechniques 1997, 22, 54-56). По существу, 3 мл стартовой культуры клеток P.Aeruginosa разбавляли в 400 мл свежей LB (среда Лурия-Бертани). Культуру выращивали при 37°C при встряхивании (220 об/мин) до ОП600=0,6, если не указано иное. Клетки охлаждали в течение 10 мин на льду, переносили в 500 мл колбу для центрифугирования и осаждали в центрифуге с охлаждением (4°C) при 5000 g в течение 20 мин. Бактериальный осадок промывали 100 мл ледяного 150 ммоль/л MgCl2 перед разделением на две 50 мл конические пробирки и осаждали при 5000 g в центрифуге с охлаждением (4°C). Клетки промывали еще один раз с использованием 30 мл 150 ммоль/л MgCl2 перед центрифугированием и ресуспендировали в 15 мл холодного 150 ммоль/л MgCl2. Клеточную суспензию инкубировали на льду в течение 1 ч перед центрифугированием при 4°C и ресуспендировали в 4 мл охлажденного 150 ммоль/л MgCl2. Аликвоты в 200 мкл помещали в отдельные 1,5 мл микроцентрифужные пробирки и выдерживали на льду в течение 2 сут. Очищенную ДНК добавляли к каждой аликвоте клеток, кратковременно встряхивали и инкубировали на льду еще 1 ч. Клетки подвергали тепловому шоку при 50°C в течение 3 мин и помещали непосредственно на лед в течение 5 мин до культивирования. Каждую трансформацию добавляли к 4 мл 50°C агара для верхнего слоя LB и помещали на предварительно нагретую чашку Петри с LB. Чашки Петри переворачивали и инкубировали при 37°C, чтобы обеспечить образование бактерий.
Пример II.
Сконструированный вирус с расширенным кругом хозяев.
Большая клиническая библиотека (282 штамма Р.aeruginosa) была подвергнута скринингу на предмет чувствительности к фагам LUZ19 и LKD16 с использованием анализа бляшкообразования в двойном агаровом слое. Шестьдесят шесть штаммов были инфицированы хотя бы одним из двух вирусов, причем 18 и 6 штаммов были инфицированы исключительно LUZ19 и LKD16 соответственно. Таким образом, LUZ19 был выбран в качестве шасси для тестирования генетических элементов LKD16, ответственных за расширение круга хозяев. Сравнительная геномика между двумя вирусами показала, что продукт гена 18 LKD16 (gp18) имел отличную последовательность от гомолога gp18 LUZ19, указывая на то, что он может отвечать за определение круга хозяев. Вирусный геном был выделен из вирусных частиц LUZ19, как описано выше. Сайтспецифическое расщепление проводили с использованием РНК-зависимой нуклеазы и транскрибируемых in vitro гРНК для экспрессии гена gp18 LUG19. Gp18 из LKD16 был амплифицирован ПЦР с гомологичными концами LUZ19 для интеграции. Метод сборки Gibson Assembly использова
- 43 038595 ли для бесшовной вставки ПЦР-амплифицированного gp18 LKD16 (SEQ ID NO: 7) в расщепленный геном LUZ19, чтобы заменить нативную последовательность gp18 (SEQ ID NO: 50). Сконструированные in vitro геномы трансформировали непосредственно в клетки-хозяева, чтобы получить функциональные вирусные частицы. Сконструированный вирус LUZ19, содержащий ген gp18 LKD16, смог заразить все штаммы, обычно инфицированные фагом LUZ19, а также 3 штамма, ранее инфицированные только LKD16, демонстрируя расширение круга хозяев (фиг. 3Б и 6Б). Это демонстрирует, что gp18 является генетическим элементом, ответственным за различающийся круг хозяев LKD16, и что сконструированный вирус LUZ19, несущий данный ген, лучше способен реплицировать в большем количестве штаммов хозяина.
Эти данные демонстрируют реализацию способа конструирования in vitro, описанного в настоящем документе, в отношении генетически неприемлемого вирусного генома, который приводит к улучшению вирусного свойства расширенного круга хозяев. Способность рационально модифицировать бактериофаг с расширенным кругом хозяев является большой ценностью при разработке вирусов для уничтожения бактерий.
Пример III.
Сконструированный вирус с кругом хозяев рода вирусов LUZ19 и/или производное LUZ19 использовали в качестве исходного материала для экспериментов по эволюции или коинфекции для определения целей для объединения круга хозяев рода вирусов ΦKMV в один репрезентативный вирус. Эксперименты по котрансформации или коинфекции выполняли либо в пермиссивном (РАО1К), либо в непермиссивном (устойчивом) хозяине (РА7410 или РА7649) (фиг. 4А). Как коинфекцию, так и котрансформацию выполняли в присутствии LKD16 или ΦKMV соответственно. Круг хозяев тестировали с применением анализа бляшкообразования в двойном агаровом слое на указанных бактериальных штаммах. После скрининга на расширенный круг хозяев в интересующем штамме усовершенствованный фаг пассировали 3-5 раз альтернативно через пермиссивные и селективные штаммы (штамм, который инфицирован только LUZ19-PA7632). Усовершенствованный фаг амплифицировали в PAOIK, гДНК очищали и секвенировали. Сравнительную геномику между LUZ19 и усовершенствованным LUZ19, способным заражать штаммы, ранее чувствительные только к LKD16 или ΦKMV, использовали для определения точечной мутации, ответственной за расширение круга хозяев (фиг. 4Б).
Большую клиническую библиотеку (282 штамма Р.aeruginosa) подвергали скринингу на предмет восприимчивости к роду вирусов ΦKMV с использованием анализа бляшкообразования в двойном агаровом слое. Три фага (LUZ19, LKD16 и ΦKMV) отображали различающийся круг хозяев и были способны заразить 67 штаммов, при этом LUZ19 заразил большинство клинических штаммов (фиг. 4В). Шесть клинических штаммов (РА7245, РА7255, РА7427, РА7503, РА7686 и РА7410) восприимчивы только к LKD16, и один клинический штамм восприимчив только к ΦKMV (PA7649). Таким образом, LUZ19 был выбран в качестве шасси для экспериментов по эволюции/коинфекции/котрансформации для получения варианта, который способен инфицировать все клинические штаммы, чувствительные к роду ΦKMV. Сравнительной геномикой показано, что для того, чтобы LUZ19 заразил штаммы, восприимчивые только к LKD16 или ΦKMV, необходимо было указать несколько точечных мутаций: (i) gp13 C17Y (положение 50 SEQ ID NO: 1) необходимо для инфицирования РА7427; (ii) gp18 D36Y (положение 106 SEQ ID NO: 50) необходимо для инфицирования РА7245, РА7503 и РА7686; gp38 D82G и 183S (положение 245 и 247248 SEQ ID NO: 2 соответственно) позволяет инфицировать РА7410 и РА7649; (iv) gp40 N253D (положение 757 SEQ ID NO: 3) позволяет инфицировать РА7255 (фиг. 4Б). Итеративное конструирование вышеупомянутых мутаций в шасси LUZ19 с использованием способа конструирования in vitro, описанного в настоящем документе, дало LUZ19 с широким кругом хозяев (ШКХ-LUZ19), способному заражать все клинические штаммы, восприимчивые к фактору рода ФКМВ (фиг. 4В).
Эти данные представляют собой пример использования способа конструирования in vitro, описанного в настоящем документе, для объединения круга хозяев рода вируса в один вирусный геном путем первой идентификации генетических мутаций, ответственных за различия в круге хозяев после эволюционных экспериментов, скрининга, секвенирования, сравнительной геномики, и любой их комбинации.
Пример IV.
Улучшенная вирусная репликация улучшает раннее разрушение биопленки.
В другом примере вирусная эволюция и сравнительная геномика показали, что усовершенстованный фаг LUZ19 с мутацией L55 в пределах хвостового трубчатого белка В (Gp34) реплицируется с большей скоростью из-за увеличенного выхода фага (фиг. 5Б). Чтобы подтвердить, что мутация Gp34 L55Δ улучшила вирусные свойства, вирусный геном LUZ19 выделяли из вирусных частиц. Сайтспецифическое расщепление выполняли с использованием РНК-зависимой нуклеазы и транскрибируемых in vitro гРНК для удаления гена gp34 (SEQ ID NO: 4). Ген gp34 L55Δ, который несет делецию кодона лейцина в аминокислотном положении 55 (Gp34 L55Δ, положение 163-165 SEQ ID NO:4), ПЦРамплифицировали из усовершенствованного фага LUZ19. Метод сборки Gibson Assembly использовали для вставки ПЦР-амплифицированного гена gp34 L55Δ в расщепленный геном LUZ19. Трансформированные in vitro геномы трансформировали непосредственно в клетки-хозяева, чтобы получить функцио
- 44 038595 нальные вирусные частицы.
Сконструированный вирус LUZ19, содержащий Gp34 L55Δ, способен рассеять и лизировать бактерии. Анализ бляшкообразования в двойном агаровом слое использовали для того, чтобы показать, что у фага LUZ19, несущего мутацию gp34 L55Δ5 (фаг*), была большая область очистки (прозрачное пятно), чем LUZ19 дикого типа. Были сделаны снимки и области очистки измеряли в течение двух суток (фиг. 5Б). Расширяющийся диаметр лизиса указывает на то, что вирусы, несущие мутации Gp34 L55Δ, лучше способны рассеивать и лизировать бактерии. Анализом биопленки с окрашиванием кристаллическим фиолетовым измеряют накопление биопленки в виде измерения включения кристаллического фиолетового (фиг. 5В). Образцы, обработанные вирусами, содержащими мутации gp34 L55Δ, имели значительное уменьшение биопленки по сравнению с вирусами с геном gp34 дикого типа. На иллюстрации показано расположение мутации gp34 (звездочка) по сравнению с геномом LUZ19 дикого типа (фиг. 5Г). Стандартные анализы, известные в данной области техники, должны были измерять адсорбцию вируса, латентный период и величину выхода фага как у дикого типа, так и мутантов gp34 L55Δ. Эти данные указывают на то, что вирусы, содержащие мутацию gp34 L55Δ, имели значительно увеличенный выход фага (фиг. 5Д).
Эти данные обеспечивают пример использования способа конструирования in vitro, описанного в настоящем документе, для создания вируса с улучшенными вирусными свойствами повышенного бактериального лизиса, выхода фага, репликации и раннего разрушения биопленки.
Пример V.
Вирус, полученный путем итеративного конструирования, с ранним разрушением биопленки и расширенным кругом хозяев.
Расширенный круг хозяев LUZ19LKD16gp18 рекомбинантного вирусного генома, созданный в примере II, был выделен из вирусных частиц. Для удаления gp34 (SEQ ID NO: 4) с использованием РНКзависимой нуклеазы и транскрибируемых in vitro гРНК выполняли сайтспецифическое расщепление. Мутацию gp34 ΔLeu55, повышающую литическую активность, (положение 163-165 SEQ ID NO: 4), описанную в примере IV, затем ПЦР-амплифицировали и собирали в расщепленный вирусный геном LUZ19LKD16gp18 с применением метода сборки Gibson Assembly. Геномы, полученные путем итеративного конструирования in vitro, трансформировали непосредственно в клетки-хозяева для получения функциональных вирусных частиц, т.е. сконструированный вирус LUZ19, содержащий как ген gp18 LKD16, так и мутацию gp34 ΔLeu55 (LUZ19* K ·. .-^).
Вирус LUZ19*LKD16gp18 анализировали на улучшенные вирусные свойства, используя анализы бляшкообразования в двойном агаровом слое, биопленки и анализы на прикрепление кератиноцитов человека in vitro. На фиг. 6Г показано, что у LUZ19*LKDi6gpi8 увеличен круг хозяев. LUZ19*LKDi6gpi8 по сравнению с нативным LUZ19 для способности разрушать предварительно сформированные МЛР биопленки P.aeruginosa. В частности, LUZ19*LKD16gp18 и LUZ19 дикого типа инкубировали с биопленкой P.aeruginosa, и разрушение измеряли с использованием кристаллического фиолетового. На фиг. 6Д показано, что LUZ19*LKD16gp18 обладает повышенной способностью разрушать предварительно сформированные МЛР биопленки P.aeruginosa по сравнению с LUZ19 дикого типа. Вирус LUZ19*LKD16gp18 анализировали на эффективность фаговой терапии против бактерий, прикрепленных к кератиноцитам человека. В частности, P.aeruginosa прикрепляли к монослою клеток НаСаТ. Затем клетки инкубировали с LUZ19*LKD16gp18 или LUZ19 дикого типа. Результаты показали, что фаг LUZ19*LKD16gp18 лучше способен устранять множественную лекарственную устойчивость (IVIDR) Клетки P.aeruginosa прикрепляли к кератиноцитам человека (см. фиг. 6Е).
Эти данные приводят пример того, как способ конструирования in vitro, описанный в настоящем документе, использовали в системе для итеративного конструирования бактериофага с несколькими независимыми улучшенными вирусными свойствами, такими как расширенный круг хозяев и увеличенный выход фага. Важно отметить, что данные этапы конструирования не могут быть выполнены как напрямую, так и с использованием стандартных методов. Кроме того, эти данные демонстрируют, что способ конструирования in vitro, описанный в настоящем документе, использовали последовательно в итерационных циклах конструирования, что является важным свойством для применений в синтетической биологии.
Пример VI.
Вирусы, полученные путем итеративного конструирования, с биофильм-диспергирующей полезной нагрузкой, и расширенный круг хозяев, охватывающий полный вирусный род.
Любые экзополисахариды (ЭПС) деполимеразы или фенол-растворимые модулины (PSM) клонировали в LUZ19 путем замены gp49 (SEQ ID NO: 25) с использованием способа конструирования in vitro, описанного в настоящем документе, для определения их способности диспергировать зрелую биопленку (фиг. 7). Чтобы сконструировать LUZ19 и WHR LUZ19 для экспрессии внеклеточной деполимеразы или поверхностно-активных полипептидов, gp49 (SEQ ID NO: 25) LUZ19 или WHR LUZ19 удаляли путем расщепления с использованием РНК-зависимой нуклеазы, в этом случае Cas9 и in vitro транскрибируемые гРНК и затем заменяли на ген интереса (ГИ), фланкированный основным промотором капсида Pgp32
- 45 038595 (SEQ ID NO: 21) и терминатором Tgp32 (SEQ ID NO: 22) с использованием метода сборки Gibson Assembly (фиг. 7А и 7В). В случае LUZ19 дикого типа, ГИ представляют собой ЭПС-деполимеразы (Рр15gp44 хвостовой шип gp44 из Φ15 Pseudomonas pudita (SEQ ID NO: 14); NTUgp34 - хвостовой шип gp34 из фага NTU Klebsiella pneumoniae (SEQ ID NO: 13); LKAlgp49 - хвостовой шип gp49 фага из LKA1 P.aeruginosa (SEQ ID NO: 12)), поверхностно-активные фенол-растворимые модулины из Staphylococcus epidermidis (PSMa, SEQ ID NO: 18) и Staphylococcus aureus (PSMa3 (SEQ ID NO: 16) и PSMb2 (SEQ ID NO: 17)) и DspB-сурфактин из Aggregatibacter actinomycetemcomitans (SEQ ID NO: 15) (фиг. 7Б). В случае ШКХLUZ19, ГИ представлял собой ЭПС-деполимеразу Pp15gp44 (SEQ ID NO: 14) и сурфактин SePSMa (SEQ ID NO:18) (фиг. 7Г). Сконструированный фаг амплифицировали в соответствующей клетке-хозяина, выделяли и проверяли путем секвенирования.
Способность сконструированного фага к диспергированию зрелой биопленки была протестирована на 24-часовой биопленке, выращенной в устройстве МВЕС, с использованием 100 фагов на лунку в течение 3 ч. Вкратце, ночные культуры P.aeruginosa разбавляли (1:100) в минимальной среде М63, дополненной сульфатом магния (1 мМ), глюкозой (0,2%) и казаминокислотами (0,5%), а затем добавляли в стерильные микротитрационные планшеты (150 мкл на лунку). Крышку с заглушками вставляли в планшет для микротитрования. После 24 ч инкубации при 37°C крышку с заглушками перемещали на микротитрационные планшеты (150 мкл на лунку). Крышку с заглушками вставляли в планшет для микротитрования. После 24 ч инкубации при 37°C крышку с заглушками перемещали на микротитрационный планшет, содержащий 160 мкл полной MG63, содержащей 100 фагов на лунку. После 3 ч инкубации при 37°C крышку с заглушками промывали 3 раза в воде, сушили и окрашивали 200 мкл 0,5% кристаллического фиолетового. Затем планшеты промывали водой для удаления несвязанного кристаллического фиолетового и сушили. Краситель растворяли в 200 мкл 30% уксусной кислоты и измеряли оптическую плотность при ОП=550 нм.
DspB, который является поверхностно активным против биопленок Е.coli, служил в качестве отрицательного контроля, поскольку он не имеет активности против P.aeruginosa. Две полезные нагрузки (Рр15gp44 и SePSMa) показали заметную активность против биопленки (фиг. 7Б). Примечательно, что PSM, которые являются сурфактинами с известной антибиопленочной активностью у грамположительных бактерий, никогда ранее не демонстрировали, что они диспергируют биопленку P.aeruginosa. Данные полезные нагрузки были сконструированы в ШКХ-LUZ19, чтобы определить, может ли фаг с широким кругом хозяев быть дополнительно модифицирован с целью придания ему способности диспергировать биопленку. Результаты показывают, что ШКХ-LUZ19, кодирующие Рр15gp44 или SePSMa, поддерживают их биофильм-диспергирующую активность (фиг. 7Г) и способность инфицировать все клинические штаммы, восприимчивые к роду вирусов O-KMV (фиг. 7Д, 7Е).
Эти данные представляют собой пример того, как способ конструирования in vitro, описанный в настоящем документе, может использоваться в системе для итеративного конструирования бактериофага с несколькими независимыми улучшенными вирусными свойствами, такими как неограничивающие свойства дисперсии биопленки и круг хозяев.
Пример VII.
Сконструированные вирусы, экспрессирующие антибиотическую сенсибилизирующую полезную нагрузку.
С использованием способа конструирования in vitro, описанного в настоящем документе, LUZ19 был сконструирован для экспрессии лизинов из оцРНК-вирусов PRR1 и MS2. Лизины как из PRR1 (SEQ ID NO: 20), так и из MS2 (SEQ ID NO: 19) оцРНК-фага были встроены в локус gp49 LUZ19 (SEQ ID NO: 25), фланкированный основным капсидным промотором Pgp32 (SEQ ID NO: 21) и терминатором Tgp32 (SEQ ID NO: 22), чтобы определить их способность ингибировать появление бактерий, устойчивых к фагу (фиг. 8А). Эти лизины ингибируют образование новых клеточных стенок путем связывания и инактивации ферментов, важных для синтеза клеточной стенки, и предположительно сенсибилизируют бактерии к другим антимикробным препаратам, особенно к нацеленным на клеточные стенки антибиотикам, таким как карбенициллин.
Конструкт получали, как описано выше, с использованием способа конструирования in vitro, описанного в настоящем документе. Сконструированный фаг амплифицировали в соответствующей клеткехозяина, выделяли и проверяли путем секвенирования. Способность сконструированного фага ингибировать появление бактерий, устойчивых к фаговой терапии, в присутствии карбенициллина при 1/5 х МИК тестировали в стандартном анализе зависимости время - летальное действие (фиг. 8Б, 8В). Результаты показывают, что сконструированные LUZ19, экспрессирующие лизины из оцРНК фага в сочетании с карбенициллином в субингибирующих концентрациях (1/5 х МИК) предотвращают повторный рост бактерий после фаговой терапии.
Эти данные представляют собой пример использования способа конструирования in vitro, описанного в настоящем документе, для создания вируса с улучшенными вирусными свойствами, в частности в данном случае, предотвращения развития устойчивости к фагу у бактерий.
- 46 038595
Пример VIII.
Сконструированный вирус, экспрессирующий видоспецифическую противомикробную белковую нагрузку.
Используя способ конструирования in vitro, описанный в настоящем документе, LUZ19 был сконструирован для экспрессии антимикробного белка PyoS5, продуцируемого P.aeruginosa. Бактериоцин PyoS5 является видоспецифическим антимикробным белком, продуцируемым одним штаммом P.aeruginosa, чтобы препятствовать росту конкурирующих штаммов P.aeruginosa. ГДНК штамма РА01 P.aeruginosa использовали в качестве матрицы для ПЦР-амплификации pyoS5 (SEQ ID NO: б) до клонирования в локус gp49 LUZ19 (SEQ ID NO: 25), фланкированный основным промотором капсида Pgp32 (SEQ ID NO: 21) и терминатором Tgp32 (SEQ ID NO: 22) (фиг. 9А). PyoS5 связывается с широко диспергированным пиохелиновым рецептором FptA перед конформационными изменениями для создания пор в мембране P.aeruginosa.
LUZ19+pyoS5 был создан, как описано выше, с использованием способа конструирования in vitro, описанный в настоящем документе. Сконструированный фаг амплифицировали внутри восприимчивого хозяина РА01, выделяли и проверяли путем секвенирования. Бактериальный штамм РА7416 выбирали для анализа, потому что лабораторный штамм РА01, как известно, устойчив к PyoS5, однако в анализе in silico показано, что штамм РА7416 МЛР P.aeruginosa был восприимчивым к фагу LUZ19 и кодировал PyoS5-рецептор FptA.
Способность фага ингибировать появление бактерий РА7416, устойчивых к фаговой терапии, тестировали в стандартном анализе зависимости время - летальное действие. Результаты показывают, что в то время как LUZ19 дикого типа первоначально ингибирует рост РА7416, бактерии быстро становятся устойчивыми, а повторный рост происходит через 8-12 часов (фиг. 9Б). Однако сконструированный UJZ/9+pyoS5 ингибирует повторный рост бактерий РА7416 на более чем 24 ч после обработки фагом (фиг. 9В, 9Г).
Эти данные представляют собой пример использования способа конструирования in vitro, описанного в настоящем документе, для получения вируса с улучшенными вирусными свойствами, в частности в данном случае, предотвращения развития устойчивости к фагу у бактерий.
Пример IX.
Система итеративного конструирования бактериофага для создания антимикробного продукта.
Используя описанный в настоящем документе способ конструирования in vitro, геномы бактериофагов могут быть быстро сконструированы без обширной генетической манипуляции штаммом хозяина. Объединение вирусных мутационных исследований и методов селекции, хорошо известных специалистам в данной области техники, с полным секвенированием генома, сравнительной геномикой и раскрытом в настоящем изобретении способом конструирования in vitro создает новую и улучшенную систему для разработки новых и улучшенных антимикробных препаратов. Система основана на итеративном улучшении 1, 2 или более 2 различных свойств в одном вирусном шасси для создания антимикробного препарата на основе вирусов. Последовательная очистка и редактирование генома LUZ19 для улучшения отдельных вирусных свойств были раскрыты (фиг. 6, 7 и 10), однако данный способ можно распространить на множество других бактериофагов Р.aeruginosa или другого бактериофага, заражающего любые другие штаммы или виды бактерии. Кроме того, данный способ можно использовать для улучшения свойств нескольких отдельных бактериофагов, заражающих одни и те же виды бактерий, для создания превосходного коктейля бактериофагов, предотвращающего или лечащего бактериальные инфекции, заражения или изменения микробиомы.
Эти данные демонстрируют, как конструирование in vitro в сочетании с секвенированием генома, сравнительной геномикой и вирусными мутационными/селекционными исследованиями могут выполнять последовательно для достижения поэтапных улучшений или инженерных изменений для включения улучшенных вирусных свойств, представляющих интерес (фиг. 10).
Пример X.
Способы.
Гидовые РНК (гРНК) синтезировали и очищали с использованием коммерчески доступного набора для транскрипции in vitro, такого как набор MEGAshortscript T7 kit (Thermo Fisher). Гидовые РНК были разработаны с использованием методов, хорошо известных в данной области техники (фиг. 15).
Разбавьте in vitro транскрибируемые гРНК на рабочий материал 500 нг/мкл.
Реакции сборки без очищенной РНК-направляемой нуклеазы, такой как Cas9. Очищенный Cas9 (SEQ ID NO: 31) был получен из экспрессирующей плазмиды, содержащей последовательность генов, кодирующую His-меченый Cas9 (SEQ ID NO: 27) и очищающей ее с помощью известных способов никель-аффинной очистки. Необязательно используйте гРНК, которая сначала разрезает самую внутреннюю часть генома для итеративных расщеплений.
Полная реакционная смесь:
мкл:
10Х Cas9 буфер* * 4;
ммоль/л MgCl2 8;
- 47 038595
100 ммоль/л спермидин 4;
гРНК1 2;
гРНК2 2;
Фермент Cas9 (0,45 мг/мл) 8 (общее количество);
гДНК X (общая масса 2 мкг);
дистилированная Н2О X (до общего объема 40 мкл).
* Полная реакционная смесь может быть использована на одном этапе для одновременного вырезания нескольких сайтов (совместное расщепление), однако это может привести к низкой эффективности вырезания вирусной гДНК. Реакции совместного расщепления выполняют на льду перед добавлением Cas9 и инкубацией при 37°C в течение 30 мин. Сконструированная 2-стадийная (или более) реакция также может быть выполнена, что обеспечивает более полное расщепление (описано ниже).
**10х Cas9 буфер содержит 200 ммоль/л HEPES рН 7.4, 1.5М KCl, 5 ммоль/л DTT и 1 ммоль/л EDTA рН8.
стадия реакции сборки и инкубация при комнатной температуре в течение 5 мин.
Реакционная смесь 1 стадии:
мкл:
10Х Cas9 буфер 4;
ммоль/л MgCl2 8;
100 ммоль/л спермидина 4;
гРНК1 2;
гДНК (общее количество 2 мкг);
дистилированная Н2О X (до общего объема 36 мкл).
Инкубируйте на льду в течение 10 мин.
Инкубируйте при 37°C в течение 2 мин.
Добавьте 4 мкл фермента Cas9 (0,45 мг/мл). Инкубируйте при 37°C в течение 30 мин.
стадия реакции, добавление второй гРНК и дополнительного фермента Cas9.
Реакционная смесь 2 стадии:
мкл:
Реакционная стадия 1 стадии 40;
гРНК2 2;
Фермент Cas9 (0,45 мг/мл) 4;
10Х Cas9 буфер 1;
дистиллированная H2O 3 (общий объем 50 мкл).
Инкубируйте реакцию 2 стадии при 37°C в течение 30 мин. Дополнительные шаги могут быть добавлены для расщепления генома в более чем 2 местах.
Инактивируйте фермент Cas9 путем инкубации при 80°С в течение 10 мин. Необязательно проведите очистку с использованием фенольно-хлороформной экстракции (повышает эффективность сборки фрагментов в сборке методом Gibson Assembly) или других способов инактивации, дезактивации или очистки, хорошо известных в данной области техники.
Исследуйте 5 мкл образца на агарозном геле для проверки правильности разрезания.
Для сборки in vitro с использованием метода сборки Gibson Assembly соответствующую концентрацию продуктов расщепления и in vitro сконструированной вставки использовали в соответствии с протоколом метода сборки Gibson Assembly NEB.
После сборки in vitro, возможно, трансформируют в клетки-хозяева для амплификации сконструированного генома, части генома или восстановления сконструированного вируса.
Пример XI.
Конструирование фага М13 Е.coli.
Используя описанный в настоящем документе способ конструирования in vitro, был сконструирован вирус, заражающий Escherichia coli, для экспрессии флуоресцентного репортера паприка (SEQ ID NO: 5). На фиг. 11А показана схема подхода конструирования in vitro для включения гена флуоресцентного белка паприка в геном фага М13 Е.coli. Этот процесс конструирования был разработан для создания лизогенного фага, экспрессирующего флуоресцентный репортер, который будет представлять собой улучшенное вирусное свойство, поскольку аналогичные вирусы использовали в качестве диагностики. Вирусный геном М13 (номер доступа Х02513) был выделен из вирусных частиц. Поскольку экспериментальная конструкция включает использование двух гРНК, функциональность каждой отдельной гРНК была впервые подтверждена в отдельных реакциях Cas9-расщепления in vitro (фиг. 11Б). Зная, что каждая гРНК была функциональной, сайт-специфическое расщепление выполняли с использованием РНКзависимой нуклеазы и обеих in vitro транскрибируемых гРНК (фиг. 11В). Флуоресцентный репортерный ген паприка (SEQ ID NO: 29) ПЦР-амплифицировали (фиг. 11Г) с использованием праймеров, которые добавляли 5'- и 3'-последовательностям, гомологичным последовательностям, фланкирующим ген LacZa, который был выделен из генома М13 с использованием расщепления РНК-зависимой нуклеазой, например Cas9. Метод сборки Gibson Assembly использовали для бесшовной вставки ПЦР-амплифицирован
- 48 038595 ного гена паприка в расщепленный геном М13, заменяя ген LacZa (SEQ ID NO: 28). Сконструированные геномы трансформировали непосредственно в хозяина Е.coli для получения функциональных вирусных частиц, кодирующих ген паприка. Сконструированный фаг оценивали по его способности образовывать бляшки у Е.coli (фиг. 11Д). Вирусную ДНК выделяли из бляшек и ПЦР-амплифицировали для подтверждения присутствия вставленного гена паприка (фиг. 11Е). Присутствие и функции рекомбинантного белка паприка подтвердили при помощи флуоресцентной визуализации (фиг. 11Ж).
Эти данные демонстрируют успешное использование описанного в настоящем документе способа конструирования in vitro для создания репортерного гена в геноме фага Е.coli. Демонстрируя, что раскрываемый способ можно расширить на другой род вирусов, включая тот, который заражает другой род бактерий.
Пример XII.
Конструирование фага X Е.coli.
Используя описанный в настоящем документе способ конструирования in vitro, был отредактирован второй вирус, заражающий Escherichia coli. На фиг. 12А показана схема подхода конструирования in vitro для удаления гена ell (SEQ ID NO: 30) из выделенного генома фага X (доступ NC_001416.1). Данный технический процесс был разработан для создания конститутивно литического вируса, который будет представлять собой улучшенное вирусное свойство. Вирусный геном λ был выделен из вирусных частиц. Поскольку экспериментальная конструкция предполагает использование двух гРНК, функциональность каждой отдельной гРНК была впервые подтверждена в отдельных реакциях Cas9-расщепления in vitro (фиг. 12Б). Зная, что каждая гРНК была функциональной, сайт-специфическое расщепление проводили с использованием РНК-зависимой нуклеазы и обеих in vitro транскрибируемых гРНК (фиг. 12В). Две синтезированные одноцепочечные молекулы ДНК были отожжены in vitro для получения шаблона для восстановления двухцепочечной ДНК (SEQ ID NO: 9), содержащего 5'- и 3'-последовательности, гомологичные последовательностям, фланкирующим Cas9-направленные вырезанные сайты в выделенный вирусный геном λ. Метод сборки Gibson Assembly использовали для бесшовной вставки ПЦРамплифицированной восстанавливающией матрицы в расщепленный геном λ. Затем сконструированные геномы были упакованы in vitro с использованием набора Maxplax lambda packaging extraction kit из Epicentre в соответствии со способом изготовителя (фиг. 12Г). После in vitro упаковки сконструированные геномы λ были извлечены из анализа бляшкообразования с двойным агаровым слоем с использованием рекомендованных изготовителем клеток-хозяев Е.coli. Было определено, что сконструированный фаг функционирует на основе его способности образовывать бляшки у E.coli. Вирусную ДНК выделяли из образовавшихся бляшек и ПЦР-амплифицировали, чтобы подтвердить отсутствие гена ell (фиг. 12Д).
Эти данные демонстрируют успешное использование описанного в настоящем документе способа конструирования in vitro для удаления нежелательного гена из генома фага Е.coli. Эти данные также обеспечивают пример упаковки сконструированных вирусных геномов in vitro, что повышает эффективность восстановления вируса и обеспечивает альтернативу прямой трансформации в клетку-хозяина. Кроме того, эти данные обеспечивают пример использования отожженных in vitro синтезированных олигонуклеотидов в качестве вставки для конструирования. Кроме того, эти данные являются еще одним примером использования этого подхода для конструирования генома фага, чтобы получить улучшенное вирусное свойство, а именно конститутивно литический фенотип. Наконец, эти данные показывают, что второй род вируса, заражающий Е.coli, может быть сконструирован с использованием описанного в настоящем документе способа конструирования in vitro.
Пример XIII.
Коррекция ошибок ЦМВ человека.
Используя раскрытый в настоящем документе способ конструирования in vitro, была отредактирована часть человеческого вируса. На фиг. 13А показана схема подхода конструирования in vitro, используемого для исправления ошибок. 18 т.п.н. часть ~230 т.п.н. вирусного генома ЦМВ человека содержалась в пределах плазмиды, реплицирующейся в Е.coli. Настоящая часть генома ЦМВ человека (SEQ ID NO: 10) содержала начало вирусного генома и несла мутантный аллель RL13 (SEQ ID NO: 33). Вместе фрагмент ЦМВ человека и плазмида Е.coli имели размер примерно 28 т.п.н., что превышает спецификации большинства современных методов коррекции ошибок. Для исправления ошибок плазмиду 28 т.п.н. выделяли из Е.coli и проводили сайт-специфическое расщепление с использованием РНК-зависимой нуклеазы и двух in vitro транскрибируемых гРНК (фиг. 13Б). Cas9-опосредованное расщеплением вырезали область гена RL13 непосредственно в прямом и обратном направлении от сайта мутации. Исправленная область гена RL13 (SEQ ID NO: 32) была синтезирована и ПЦР-амплифицирована с дополнительными 5'- и 3'-фланкирующими последовательностями, гомологичными областям, граничащим с каждым сайтом расщепления, специфичным для РНК (фиг. 13В). Метод сборки Gibson Assembly использовали для бесшовной вставки синтезированной восстанавливающей матрицы в расщепленную плазмиду. Исправленный RL13-содержащий фрагмент ЦМВ человека (SEQ ID NO: 11), содержащийся внутри плазмиды, затем трансформировали в Е.coli и восстанавливали на антибиотикосодержащих питательных средах. Колонии Е.coli подвергали скринингу с помощью ПЦР для подтверждения наличия исправленного
- 49 038595 гена RL13, который содержал дополнительную последовательность по сравнению с геном RL13, содержащим ошибки, что позволяет отличать его от гена RL13, содержащего ошибки (фиг. 13Г). Геномный фрагмент с исправленной ошибкой затем амплифицировали в Е.coli с использованием стандартных методик для последующего использования в обратных приложениях.
Эти данные демонстрируют успешное использование описанного в настоящем документе способа конструирования in vitro для конструирования генов из генома вируса человека и дополнительно обеспечивают способ использования синтезированной ДНК в качестве восстанавливающей матрицы в реакции сборки in vitro. Эти данные также демонстрируют использование этого способа конструирования in vitro для коррекции ошибок ДНК или плазмид, которые слишком велики для стандартных методов коррекции ошибок. Стандартная методика коррекции ошибок имеет ограничение по размеру около 5 т.п.н. и основана на ПЦР, которое по своей природе может создавать более нежелательные ошибки. Представленный в настоящем документе способ конструирования in vitro не зависит от ПЦР-амплификации всей или даже большой части плазмиды или вирусного генома и поэтому поддается применению при исправлении ошибок последовательностей, превышающих 5 т.п.н.
Пример XIV.
Быстрая идентификация терминально избыточных вирусных концов.
Описанный в настоящем документе способ расщепления in vitro также может быть адаптирован для идентификации точных концов терминально избыточных вирусных геномов. На фиг. 14 показана схема подхода расщепления in vitro, который использовался для определения концов фаговых геномов LBL3 и 14-1. LBL3 и 14-1 (номер доступа NC_011703.1) фаговую геномную ДНК очищали от вирусных частиц (фиг. 14А). Секвенирование нового поколения выполняли с использованием платформы MiSeq или PacBio, а затем при помощи автоматического слияния высококачественных считываний ДНК в более длинные сборки для восстановления исходной последовательности (фиг. 14Б). Как правило, программное обеспечение автоматической сборки неправильно собирает вирусные или бактериофаговые геномы в круговые контиги и размешает ПТП терминально повторяющихся геномов во внутреннюю область вирусной последовательности. Прогнозирование in silico физических концов генома выполняют на основе идентификации областей секвенирования двойного охвата и результатов поиска BLAST, которые соответствуют близкородственному терминально повторяющемуся геному (фиг. 14В). Данные прогнозируемые концы были подтверждены расщеплением эндонуклеазой Cas9. После инактивации Cas9 фрагменты ДНК, соответствующие геномным физическим концам, очищали и секвенировали (фиг. 14Г). Эти результаты секвенирования привели к точной сборке генома на основе истинных физических концевых последовательностей (фиг. 14Д).
Одной из самых больших технических проблем, связанных с секвенированием генома фага, является точное отображение геномных физических концов из-за их повторяющегося характера. Эти сегменты могут простираться от 4-14 п.о. в циклически перегруппированных геномах (например, большинство фагов Mycobacterium и Propionibacterium acnes) до нескольких сотен пар оснований в терминально повторяющихся геномах (например, ΦKMV-подобные, PBl-подобные и N4-подобные фаговые роды Р.aeruginosa) и даже до нескольких тысяч пар оснований (например, Т5 и DTR E.coli). Сопоставление повторяющихся концов (или ПТП - прямых терминальных повторов) в настоящее время выполняется комбинацией глубокого анализа последовательностей (для идентификации фрагментов ДНК с двойным покрытием), праймер-опосредованной прогулкой (секвенирование по Сэнгеру), идентификацией основных разрывов ДНК и анализом рестрикционных эндонуклеаз. Однако каждый из этих подходов часто ограничен в использовании или безрезультативный: I) плохо определенные двойные сиквенсы границы охвата двойного упорядочения в данных NGS (секвенирования следующего поколения); (II) считывание праймер-опосредованной прогулки с прохождением через конкатэмеры ПТП, дающая неубедительные результаты; (III) низкая частота мест рестрикции вблизи фаговых концов или обструкция рестрикционных участков вследствие модификаций ДНК, таких как метилирование. Использование направленного Cas9-расщепления ДНК фага в определенных положениях устраняет необходимость в ненадежных или громоздких анализах или процедурах и значительно упрощает идентификацию фаговых геномных физических концов. Такой подход имеет потенциал для точного отображения концов уже секвенированных фаговых геномов (как показано на примере картирования ПТП LBL3 и 14-1), а также для быстрой идентификации ПТП новых идентифицированных вирусов.
Использование направленного Cas9-расщепления в пределах описанного в настоящем документе способа конструирования in vitro для сопоставления физических концов терминально повторяющихся фаговых геномов представляет собой явное преимущество по сравнению с существующими подходами, поскольку оно не зависит от тонких изменений в охвате секвенирования и может выполняться независимо от образования конкатемера. Кроме того, активность Cas9 менее чувствительна к модификациям ДНК, чем многие рестрикционные ферменты.
Эти данные показывают успешное применение РНК-направляемого Cas9-расщепления in vitro, что дает возможность идентифицировать правильное положение последовательности фагового генома. Эта информация затем может быть использована для разработки нижерасположенных подходов модификации in vitro для конструирования этих фагов, что было ранее невозможным из-за отсутствия истинных
- 50 038595 границ генома.
Пример XV.
Способ конструирования со сборкой in vivo.
Настоящее раскрытие обеспечивает способ in vitro сайт-специфического расщепления очищенной вирусной нуклеиновой кислоты с использованием РНК-направляемой нуклеазы; и сборку сконструированной нуклеиновой кислоты путем вставки фрагмента ДНК или РНК в расщепленную вирусную нуклеиновую кислоту. Хотя рекомбинантная нуклеиновая кислота может быть собрана целиком в условиях in vitro с использованием очищенных ферментов, как описано в настоящем документе, этот процесс также может быть осуществлен с использованием естественных или сконструированных рекомбинантных сигнальных путей в чувствительном штамме хозяина. Трансформация очищенных и обработанных in vitro вирусных геномов вместе с фрагментом вставки восстановления, содержащим концевые области гомологии, достаточна для того, чтобы некоторые клетки-хозяева собирали рекомбинантный вирусный геном in vivo. Фрагменты вставки восстановления могут быть синтезированы или амплифицированы стандартными методами, известными в данной области техники, или могут находиться внутри плазмид, стабильно реплицирующихся в выбранной клетке-хозяине. Данный способ, вероятно, будет иметь более низкую эффективность по сравнению со сборкой in vitro из-за клеток-хозяев, имеющих как гомологичные, так и не гомологичные пути восстановления ДНК, задача совместной доставки достаточного количества вставки и расщепленного генома в клетку-хозяина и более низкой эффективности большинства гомологичных сигнальных путей рекомбинации хозяина. Поскольку только расщепленнные геномы не образуют функциональных вирусных частиц и в последующем бляшек без опосредованной хозяином рекомбинации, бляшки, полученные после трансформации и выращивания, могут быть скринированы с помощью ПЦР для данной вставки, чтобы подтвердить корректную сборку желаемой сконструированной вирусной нуклеиновой кислоты.
Пример XVI.
Сконструированные вирусы, описанные в настоящем документе.
В табл. 1 представлены сконструированные вирусы, полученные в соответствии с настоящим изобретением в способе модификации in vitro. В табл. 2 представлены сконструированные вирусы, описанные в настоящем документе, вместе с соответствующим примером и фигурой. В табл. 3 перечислены вирусы дикого типа, описанные в настоящем документе, и номера доступа для их полной геномной последовательности. В табл. 4 перечислены некоторые из последовательностей нуклеиновых кислот дикого типа, описанных в настоящем документе, и соответствующие аминокислотные последовательности.
- 51 038595
Таблица 1. Сконструированные вирусы, описанные в изобретении
Сконструированный вирус Исходный Вирус Тип мутации Целевая область Номер доступа, положение нуклеотида (SEQ ID NO.) Изменение нуклеотида и аминокислоты или добавление последовательно сти
LUZ19+ фрагмент др7 ФКЕ7 7 LUZ19 Замена др 7 (SEQ ID NO:23) Доступ NC_010326.1, 4288- 4491 (SEQ ID NO:23) Фрагмент др 7 ФКЕ7 7 (SEQ ID NO:8)
LUZ19+LKD16 др18 LUZ19 Замена gpi8 (SEQ ID NQ:50) Доступ NC_010326.1, 11368-11688 (SEQ ID NO:24) др18 LKD16 (SEQ ID NO:7)
IIIKX-LUZ19 LUZ19 ТМ gp!3 (SEQ ID NO: 1) Доступ NC_010326.1, 7325 (положение 50 SEQ ID NO:1) G на A, C17Y
ТМ gp!8 (SEQ ID N0:50) Доступ NC_010326.1, 11469 (положение 106 SEQ ID N0:50) G на T, D36Y
ТМ gp3 8 Доступ А на G, D82G
- 52 038595
(SEQ ID N0:2) NC_010326.1, 36462 (положение 245 SEQ ID NO:2)
TM gp3 8 (SEQ ID N0:2) Доступ NC_010326.1, 36464; 36465 (положение 247, 248 SEQ ID NO:2) AT на TC, I83S
TM gp4 0 (SEQ ID N0:3) Доступ NC_010326.1, 38180 (положение 757 of SEQ ID NO:3) А на G, N253D
LUZ19+gp34 L55A (LUZ19*) LUZ19 Делеция gP34 (SEQ ID N0:4) Доступ NC_010326.1, 2 6664-2 6666 (положение 163165 SEQ ID NO:4) CTG на -, L55
LUZ19+LKD16 gpl8+gp34 L55A LUZ19+ LK D16 gp!8 Делеция gp34 (SEQ ID N0:4) Доступ NC_010326.1, 2 6664-2 6666 (положение 163165 SEQ ID NO:4) CTG на -, L55
LUZ19+ gp49 LKA1 LUZ19 Вставка gp4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) gp49 LKA1 (SEQ ID NO:12) T32 (SEQ ID NO:22)
LUZ19+ gp34 NTU LUZ19 Вставка gp4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) NJ\Jgp34 (SEQ ID NO:13) T32 (SEQ ID
- 53 038595
NO:22)
LUZ19+Ppl5g p4 4 LUZ19 Вставка др4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) Ppl5gp44 (SEQ ID NO:14) T32 (SEQ ID NO:22)
LUZ19+SaPSM a3 LUZ19 Вставка др4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) SaPSMa3 (SEQ ID NO:16) T32 (SEQ ID NO:22)
LUZ19+SaPSM b2 LUZ19 Вставка gp4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) SaPSMb2 (SEQ ID NO:17) T32 (SEQ ID NO:22)
LUZ19+SePSM a LUZ19 Вставка gp4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) SePSMa (SEQ ID NO:18) T32 (SEQ ID NO:22)
LUZ19+dspS LUZ19 Вставка gp4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) dspB (SEQ ID NO:15) T32 (SEQ ID NO:22)
LUZ19+Ppl5g p4 4 ШКХ LUZ19 Вставка gp4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) Ppl5gp44 (SEQ ID NO:14)
LUZ19+SePSM a ШКХ LUZ19 Вставка gp4 9 (SEQ ID N0:51) Доступ NC_010326.1, 42719-42943 SePSMa (SEQ ID NO:18)
- 54 038595
(SEQ ID NO:25)
LUZ19+PPR1L LUZ19 Вставка др4 9 (SEQ ID NQ:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) PRR1 L (SEQ ID N0:20) T32 (SEQ ID NO:22)
LUZ19+MSR L LUZ19 Вставка др4 9 (SEQID NO:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) MS2 L (SEQ ID NO:19) T32 (SEQ ID NO:22)
LUZ19+pyoS5 LUZ19 Вставка др4 9 (SEQID NO:51) Доступ NC_010326.1, 42719-42943 (SEQ ID NO:25) P32 (SEQ ID NO:21) pyoS5 (SEQ ID NO: 6) T32 (SEQ ID NO:22)
М13МР18+пап рика М13МР1 8 Замена lacZ (SEQID NO:28) Доступ X02513, 6216-6722 (SEQID NO:28) паприка (SEQID NO:29)
Лямбда сП удаление лямбда Делеция ell (SEQID NO:30) Доступ NC_001416.1, 38390-28623 (SEQ ID N0:30) ell удаленная (SEQID NO:9)
цмв человека+от редактирова нный RL13 Фрагме нт ЦМВ Челове ка Замена RL13 (SEQID NO:33) Неотредактирова нный полноразмерный фрагмент (SEQ ID N0:10) и неотредактирова нный RL13 (SEQ ID NO:33) Отредактированн ый RL13(SEQID NO :32) и отредактированн ый полноразмерный фрагмент (SEQ ID NO:11)
ТМ - точечная мутация, замена - замена, делеция - удаление, вставка - инсерция.
- 55 038595
Таблица 2. Сконструированные вирусы, описанные в изобретении
Сконструированный фаг Пример Фигура Свойство
LUZ19+ фрагмент др 7 ФКД77 1 2 Сконструированный ОП
LUZ19+LKD16 др!8 II 3 Расширение круга хозяев
IIIKX-LUZ19 III 4 Расширение круга хозяев
LUZ19+gp34 L55A (LUZ19*) IV 5 Улучшенная литическая активность
LUZ19+LKD16 др!8+др34 L55A V 6 Итеративное конструирование
LUZ19+LKAlgp49 VI 7 Дисперсия биопленки
LUZ19+ др34 NTU VI 7 Дисперсия биопленки
LUZ19+Ppl5gp44 VI 7 Дисперсия биопленки
LUZ19+SaPSMa3 VI 7 Дисперсия биопленки
LUZ19+SaPSMb2 VI 7 Дисперсия биопленки
LUZ19+SePSMa VI 7 Дисперсия биопленки
LUZ19+dspS VI 7 Дисперсия биопленки
IIIKX-LUZ19+Ppl5gp4 4 VI 7 Итеративное конструирование
IIIKX-LUZ19+SePSMa VI 7 Итеративное конструирование
LUZ19+PPR1L VII 8 Антибиотическая сенсибилизация /предовращение устойчивости к фагу
LUZ19+MS2 L VII 8 Антибиотическая сенсибилизация
/предовращение устойчивости к фагу
LUZ19+pyoS5 VIII 9 Предовращение устойчивости к фагу
М13МР18+паприка XI 11 Сконструированный ОП
делеция ell λ XII 12 Сконструированный ОП
ЦМВ человека+отредактиро ванный RL13 XIII 13 Коррекция ошибок/сконструированный ОП
ОП - опытный образец.
- 56 038595
Таблица 3. Вирусы дикого типа, описанные в изобретении
Название вируса дикого типа Геномная последовательность
Фага LUZ19 Р. aeruginosa Доступ NC 010326.1
Фаг Е. coll \ сП 857 SAM7 Доступ NC 001416.1
Фаг М13 Е. coli Доступ Х02513
Фаг 14-1 Р. aeruginosa Доступ NC 011703.1
Таблица 4. Последовательности дикого типа, описанные в изобретении
Название Последовательность нуклеиновой кислоты Аминокислотная последовательность
gpl3 LUZ19 SEQ ID NO: 1 SEQ ID NO:34
др38 LUZ19 SEQ ID NO :2 SEQ ID NO:35
др40 LUZ19 SEQ ID NO :3 SEQ ID NO:36
др34 LUZ19 SEQ ID NO :4 SEQ ID NO :5
др49 LUZ19 SEQ ID NO:51 SEQ ID NO:49
др18 LUZ19 SEQ ID N0:50 SEQ ID NO:48
др18 LKD16 SEQ ID NO :26 SEQ ID NO:38
др49 LKA1 SEQ ID NO: 12 SEQ ID NO:39
PyoS5 SEQ ID NO:6 SEQ ID NO:37
др34 NTU SEQ ID NO: 13 SEQ ID NO :40
др44 Рр15 SEQ ID NO: 14 SEQ ID NO:41
DspB SEQ ID NO: 15 SEQ ID NO:42
SaPSMa3 SEQ ID NO: 16 SEQ ID NO:43
SaPAMb2 SEQ ID NO: 17 SEQ ID NO:44
SePSMa SEQ ID NO: 18 SEQ ID NO:45
MS2L SEQ ID NO: 19 SEQ ID NO:46
PRR1 L SEQ ID N0:20 SEQ ID NO:47
Из вышеприведенного описания специалист в данной области техники может легко определить основные характеристики изобретения и не отходя от его сущности и объема может вносить изменения и модификации в изобретение, чтобы адаптировать его к различным условиям применения и использования, а также реализовывать изобретение в полном объеме. Предшествующие конкретные варианты реализации изобретения должны толковаться как просто иллюстративные, а не ограничивающие объем изобретения каким-либо образом. Полное раскрытие всех заявок, патентов и публикаций (включая справочные руководства), упомянутых выше и на фигурах, полностью включено в настоящее описание посредством ссылки.
- 57 038595
Перечень последовательностей
SEQ ID NO: 1
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название- др!3 LUZ19 дикого типа
GTGCTGGCCCTCGGTGCCTTCGACCTGTCCGGCCTGATGGTAGGTTCCTGCCTCGTAGTAGGTG
GTGAGCTG
AAGGCCCTGTGCGTTGATGACCGGCACAGCAGGCAGGGTATCGGCGCTGAGCTGGTACGGGCCG
CTGAGCT
GGCTGGTGCCGAGTATCTGACCTGCTTCGAGTTCCTGGAGCCGTTCTACGCCGACTTGGGCTGG
AGCACCAC
CCACCGCGAGGCGAACTGGACAGCAGGAGAGCCGGACGTGCTGCACATGAGGGCACCCGGTCAT
GACGTAT
- 58 038595
GA
SEQ ID NO :2
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название- gp38 LUZ19 дикого типа
GTGGCTCGGTTCAAGAATCCCGAGACCATCCACGTTGCAGATGGGGTCGAGGCTGTCTTCAGTC
TCGACTTC
CCGTTCCTGCGGCGTGAGGACGTATTCGTCCAGGTCGATAAGATACTCGTCACCGACTATACGT
GGGTAGAC
GACACCAACATCCAATTGGCCGTGGTGCCGAAGAAGGACCAAGAGGTCCGCATCTTCCGCGACA
CGCCCGC
CCAGGTCCCGGACACACAGTTCAGCCAGGACATCCCGTTCCTGCCTCGATACATCGACGCGAAC
AACAAGC
AGCTCCTGTACGCTGTGCAGGAAGGCATCAACACCGCGAACCTCGCTCTCGATGGCGTACTCGA
CGCGATCC
GTATCGCCGAGGAGGCTCGTCGCCTGGCGCAGGAAGCACTCGACGCCGCCAATGAGGCGCTTCG
CCGTGCC
CTGGGCTTCGCTGAGATTCGCACCGTGACCGAGGACTCGGACATCGATCCGAGCTGGCGCGGTT
ACTGGAAC
CGTTGCATCACCGCCGATAAACCTCTGACCCTGACCATGCAGATGGAAGACCCGGATGCACCGT
GGGTCGA
GTTCAGCGAGGTTCACTTCGAGCAGGCCGGTGTGCGTGACCTAAACATCGTAGCCGGTCCTGGC
GTTACOAT
CAACCGTTTGCAGAACACCACCATGCAGCTCTACGGCGAGAATGGCGTGTGTACTCTCAAGCGG
CTGGGCGC
TAACCACTGGATCGTGTTCGGGGCCATGGAGGACGAATAA
SEQ ID NO :3
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название- gp40 LUZ19 дикого типа
ATGTTTAAGACCGAAGTAAAGGGACGTTACACCCTGATTCGCCGCAAGGCGGACGGCACTCCGG
TGGAGAC
TCTGGAGTTCGACAACATCATTACGAATGCGGGCCTGGATTGGATCGCCGCTATGGATACCGAC
CTCATGGG
CGAACCCGTAGCGGTCAGCACTTCTACAGCCGATCCCAACCCGAGCGCACCCGCCATCCCGGAG
GTTGTGCA
- 59 038595
ACGCACGTCCGCATCTGCCCCTGGTGGAGGTACTACGTCGGGCCTGGATGGCGAGTGGCTGTTC
TGGCGGAG
GCGTTGGAGATTCCCGCAGGGCACCCTAGCTGGTCAAGTCCTGGCCACCGTGGGCCTCATCTGC
AACTCGGA
TCGTCGCTTCGAGAGTAACACGGGTGAGCTGATCCCGAAGGATACCCCGCTGTCGTACACTCGC
ATCAAGGA
CGCCGCCGGGCAGCCTACTACTCTGGTGGTGGCCGCTGACGAGATTCTGGATGTCCAGTACGAG
TTCCGCAG
CCGGCCCGTAGGAACGGCTGAGGCCAAGTTCGTGATCTCCGGCGTGGAACGCACCTTCCGGCTG
ATCCCAAA
GCCTTTTGCGAACCGTGCTAATCTCTCCGGGGAACGCTACATCTTCTACAACACCAACCCCTAC
ATCAACGG
CAAGGACGCCTCCGGCGGCAATGTCCGAGACGGTCAGTGGCAGAAGAAATATCCCAAGTACGTG
CGCGGCT
CCTACAAGGCGCAGATCACGCTGCTGGCCCAGGTCCAGAACGGCAATATGGCTGGCGGCATCAC
CGGCACC
GAGGAACTСCAGATTTACAATGGAGGTAAGTATGTGСTCGATATCAAGСCGССTGTTGTGAAGA
ACAATACC
CAGGAGTTCACCGTGACCCTGGAGTTTACGGTGGCGAGGGCATAA
SEQ ID NO:4
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название- gp34 LUZ19 дикого типа
ATGAGCTACAAGCAATCCGCGTATCCCAATCTGCTGATGGGTGTGAGCCAGCAGGTGCCCTTCG
AGCGCCTG
CCGGGCCAGCTCAGCGAGCAGATCAACATGGTATCCGATCCCGTGTCAGGACTTCGGCGGCGCA
GCGGTAT
CGAGCTGATGGCCCACCTGCTGCATACCGACCAGCCCTGGCCGAGGCCGTTCCTCTACCACACG
AACCTCGG
TGGCCGCAGCATTGCGATGCTGGTGGCGCAGCACCGTGGCGAGCTGTACCTGTTCGACGAGCGG
GACGGTC
GCCTGCTGATGGGTCAGCCCCTGGTGCATGACTACCTCAAGGCCAACGATTACAGGCAGCTACG
GGCCGCCA
CGGTGGCCGATGACCTGTTCATCGCCAACCTGAGTGTAAAGCCCGAGGCCGACCGCACCGACAT
CAAGGGC
GTAGACCCCAACAAGGCCGGCTGGCTGTACATCAAGGCAGGCCAGTATTCGAAGGCATTCTCCA
- 60 038595
TGACCATC
AAGGTCAAGGACAACGCCACCGGCACCACCTACAGCCACACGGCCACCTACGTGACGCCGGACA
ACGCCAG
CACGAACCCCAACCTCGCTGAGGCGCCATTCCAAACGAGCGTAGGCTACATCGCGTGGCAGCTC
TACGGCA
AGTTCTTCGGTGCGCCGGAGTACACTCTGCCCAACTCGACGAAGAAGTACCCGAAGGTAGACCC
GGACGCC
AACGCGGCAACCATAGCCGGTTACCTCAACCAACGGGGCGTGCAGGACGGGTACATCGCGTTCC
GTGGCGA
CGCCGATATCCACGTTGAAGTGTCCACGGACATGGGCAACAACTACGGCATAGCCTCCGGCGGT
ATGAGCCT
CAACGCCACGGCAGACCTGCCGGCCTTACTGCCGGGCGCGGGTGCTCCTGGCGTGGGTGTGCAG
TTCATGGA
CGGCGCTGTCATGGCCACCGGCTCCACCAAGGCCCCGGTATACTTCGAGTGGGATTCCGCTAAC
CGCCGCTG
GGCAGAGCGGGCCGCCTACGGCACCGATTGGGTCCTGAAGAAGATGCCACTGGCCCTGCGCTGG
GATGAGG
CTACCGACACCTACAGCTTGAACGAGCTGGAGTATGATCGACGTGGCTCCGGCGACGAGGATAC
GAACCCC
ACGTTCAACTTCGTCACCCGAGGCATCACCGGCATGACGACCTTCCAGGGTCGCCTCGTCCTCC
TGTCGCAG
GAGTACGTCTGCATGTCGGCCAGTAACAATCCACACCGCTGGTTCAAGAAGTCGGCAGCCGCGC
TGAACGA
CGATGATCCTATCGAGATCGCAGCCCAGGGGAGCCTGACTGAACCGTACGAGCACGCGGTCACC
TTCAACA
AGGACTTGATCGTCTTCGCCAAGAAGTATCAGGCCGTGGTCCCCGGTGGCGGCATTGTAACTCC
CCGGACGG
CGGTTATCAGCATCACCACGCAGTACGACCTCGATACCAGGGCGGCACCTGCCGTGACTGGCCG
CAGTGTGT
ACTTCGCTGCGGAGCGTGCCCTGGGTTTCATGGGCCTGCATGAGATGGCCCCGTCTCCGTCCAC
GGACAGCC
ACTACGTCGCCGAAGACGTTACCAGCCACATCCCGAGCTACATGCCGGGGCCTGCTGAGTACAT
CCAGGCG
GCGGCCTCCAGCGGCTACCTGGTGTTCGGCACCAGCACGGCGGACGAGATGATCTGCCACCAGT
ACCTCTGG
CAGGGCAACGAGAAAGTGCAGAACGCGTTTCATCGCTGGACGTTGCGGCATCAGATCATCGGCG
- 61 038595
ССТАСТТС
ACTGGTGACAACCTGATGGTTCTGATTCAGAAGGGCCAGGAGATCGCCCTGGGACGGATGCACC TGAACAG
CCTGCCAGCCCGTGAGGGTCTGCAATACCCTAAATACGACTACTGGCGGCGTATCGAGGCGACC GTCGATGG
TGAGCTGGAACTGACCAAGCAGCATTGGGACCTGATCAAGGATGCCTCTGCCGTGTACCAGCTA CAGCCTGT
GGCCGGCGCCTACATGGAGCGTACCCATCTCGGCGTGAAGCGCGAGACGAATACGAAGGTGTTC CTCGACG
TGCCCGAGGCCGTGGTCGGGGCGGTGTATGTGGTCGGCTGCGAGTTCTGGTCGAAGGTGGAGTT CACTCCGC
CGGTTCTCCGGGACCACAATGGCCTGCCCATGACCTCGACCCGTGCAGTGCTTCATCGGTACAA CGTAAACT
TCGGCTGGACCGGCGAGTTCCTGTGGCGCATCAGCGACACGGCTCGACCCAACCAGCCGTGGTA CGAGACG
ACGCCCCTCCGGTTGTTCAGCCGGCAACTCAATGCCGGGGAGCCTCTGGTGGATAGCGCTGTGG TGCCGCTG
CCGGCACGGGTCGATATGGCCACGTCCAAGTTCGAGCTGAGCTGTCACAGTCCGTACGACATGA ACGTTCGG
G С T G T C GAG TAGAAG T T CAAG T С CAAG СAAAC C TAGAG GAG G G T G T GA
SEQ ID NO:5
Белок
Род/вид- Phikmvlikevirus LUZ19
Описательное название- белок Gp34 LUZ19 дикого типа
MSYKQSAYPNLLMGVSQQVPFERLPGQLSEQINMVSDPVSGLRRRSGIELMAHLLHTDQPWPRP FLYHTNLGGR
SIAMLVAQHRGELYLFDERDGRLLMGQPLVHDYLKANDYRQLRAATVADDLFIANLSVKPEADR TDIKGVDPN
KAGWLYKAGQYSKAFSMTIKVKDNATGTTYSHTATYVTPDNASTNPNLAEAPFQTSVGYIAWQL
YGKFFGAPE
YTLPNSTKKYPKVDPDANAATIAGYLNQRGVQDGYIAFRGDADIHVEVSTDMGNNYGIASGGMS LNATADLPA
LLPGAGAPGVGVQFMDGAVMATGSTKAPVYFEWDSANRRWAERAAYGTDWVLKKMPLALRWDEA TDTYSL
NELEYDRRGSGDEDTNPTFNFVTRGITGMTTFQGRLVLLSQEYVCMSASNNPHRWFKKSAAALN DDDPIEIAAQ
- 62 038595
GSLTEPYEHAVTFNKDLIVFAKKYQAWPGGGIVTPRTAVISITTQYDLDTRAAPAVTGRSVYF
AAERALGFMGL
HEMAPSPSTDSHYVAEDVTSHIPSYMPGPAEYIQAAASSGYLWGTSTADEMICHQYLWQGNEKV
QNAFHRWTL
RHQIIGAYFTGDNLMVLIQKGQEIALGRMHLNSLPAREGLQYPKYDYWRRIEATVDGELELTKQ
HWDLKDASA
VYQLQPVAGAYMERTHLGVKRETNTKVFLDVPEAWGAVYVVGCEFWSKVEFTPPVLRDHNGLP
MTSTRAVL
HRYNVNFGWTGEFLWRISDTARPNQPWYDTTPLRLFSRQLNAGEPLVDSAWPLPARVDMATSK
FELSCHSPYD
MNVRAVE YN FKS NQ T YRRV
SEQ ID NO:6
ДНК
Род/вид- Pseudomonas aeruginosa
Описательное название- последовательность PyoS5
ATGTСCAATGAGAAGGAAGTACСTGGTTСCATGGTTATTGTCGCACAAGGTСCAGACGATCAAT
ACGCATAC
GAGGTTCCCCCTATCGATAGCGCGGCCGTTGCCGGGAATATGTTTGGCGACTTAATTCAAAGAG
AAATATAT
С TACAGAAAAACATTTATTATCCAGTCCGATCTATTTTT GAACAAGGAACAAAAGAAAAGAAGG
AGATCAA
CAAGAAAGTATСTGATCAAGTCGATGGCTTGCTAAAGCAGATСАСTCAAGGAAAAAGGGAGGCC
ACAAGGC
AAGAGCGAGTCGATGTCATGTCGGCAGTCCTGCACAAGATGGAATCTGATCTTGAAGGATACAA
AAAGACC
TTTACCAAAGGCCCATTCATTGACTACGAAAAGCAGTCAAGCCTCTCCATCTATGAGGCCTGGG
TCAAGATC
TGGGAGAAGAACTCTTGGGAAGAAAGAAAGAAGTACCCTTTTCAGCAGCTTGTTAGAGATGAAC
TGGAGCG
GGCGGTTGCCTACTACAAACAAGATTCACTCTCTGAAGCGGTAAAAGTGCTAAGACAGGAGCTC
AACAAGC
AAAAAGCGCTAAAGGAAAAAGAGGACCTCTCTCAACTGGAGCGGGACTACAGAACCCGAAAGGC
GAATCT
CGAGATGAAAGTACAATCCGAGCTTGATCAAGCGGGAAGTGCTTTGCCTCCATTGGTCAGTCCA
ACGCCAGA
GCAATGGCTTGAACGTGCCACAAGACTGGTTACGCAAGCAATTGCTGATAAAAAGCAGCTGCAG
- 63 038595
ACCACAA
ACAATAC T С T TAT CAAGAAT T С С С СAAC С С С T С TAGAAAAG CAGAAAG С CAT C TAGAAT G G T GA
GCTACTTG
TGGATGAGATAGCCAGTCTACAGGCCCGCTTAGTTAAGCTGAACGCCGAAACGACACGACGCAG
GACAGAA
GCAGAACGCAAGGCGGCCGAGGAACAAGCGTTGCAAGATGCTATTAAATTTACTGCCGACTTTT
ATAAGGA
AGTAACTGAGAAATTTGGCGCACGAACATCGGAGATGGCGCGCCAACTGGCCGAAGGCGCCAGG
GGGAAA
AATATCAGGAGTTCGGCGGAAGCAATCAAGTCGTTTGAAAAGCACAAGGATGCGTTAAATAAAA AACTTAG
CCTTAAAGATAGGCAAGCCATTGCCAAAGCCTTTGATTCTCTAGACAAGCAGATGATGGCGAAG
AGCCTTGA
GAAATTTAGCAAAGGCTTTGGAGTTGTAGGCAAAGCTATTGACGCCGCCAGCCTGTACCAAGAG
TTCAAGAT
ATCTACGGAAACCGGGGACTGGAAACCATTCTTTGTAAAAATTGAAACACTAGCTGCTGGTGCG
GCCGCCA
GTTGGCTTGTGGGTATTGCATTTGCCACGGCAACAGCCACTCCTATAGGCATTCTGGGGTTCGC
ACTGGTAAT
GGCAGTTACCGGGGCGATGATTGACGAAGACCTTCTAGAAAAAGCAAACAATCTTGTAATATCC ATTTAA
SEQ ID NO:7
ДНК
Род/вид- Phikmvlikevirus LKD16
Описательное название - добавлена последовательность gp!8
LKD16
GAGTACCAACTGAACACGAGCGCACCCTGCGCTGCCTGCTCCAAGACATCCACGGGCCGCTGAA
TCTGCTGT
TCCCAGGTATCCGGGTGAAGGTGGAGGAGGCGTGCCTCGGATACTTGGGCTACAGGGAGCGGGG
CTATTGG
GAGCTGCGCCTCCAGGTGGACTACGACCACCCGAAGCTTGGGCACCTCCGCTACAGTCAGGCCG
TGCCGGA
GTACGTGCTGATCAACGACCGCGACAGCATCATCAAGTACCTGATGGAAGCAGTCCCTCGGCAG GTAGTAG
AGGGCATGCTCAATAAGGCCCAGGAATTCGTAACCAAGAACTGGTATTCCCTATGACGAC SEQ ID NO:8
- 64 038595
ДНК
Род/вид- Phikmvlikevirus phi-KF77
Описательное название - добавлена последовательность др7 ФКЕ7 7 TACAAGGTGGTGACGCCTAGCTCGGCAGAGGGCGCCGTTGTGCTGGCGACCAAGCAGACGCCTG CCCTCGC TCAGGCAGTCATCGTACTGCACAGCATGAACCCCGCGCAGTACGCGGTGGGCACGGCCATACTA AACACAG ACTGGCGGTGCCGCCGCCTGGGTGCCGGCGAGTACATCAAGCTCGTTCAAGGGGAGGCCGAC
SEQ ID NO:9
ДНК
Род/вид- Lambdavirus лямбда
Описательное название- ell фага λ Е. coll
ATGGTTCGTGCAAACAAACGCAACGAGGCTCGTTCTGAACAAATCCAGATGGAGTTCTGA SEQ ID NO: 10 ДНК Род/вид - цитомегаловирус ЦМВЧ Описательное название - предварительное редактирование фрагмента ЦМВЧ ACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTCGAGCTCGGTACCCGATTAC CCTGTTAT CCCTACCATTCCGGGCCGTGTGCTGGGTCCCCGAGGGGCGGGGGGGTGTTTTTAGCGGGGGGGT GAAATTTG GAGTCTTGGAGCCGCGTGTGCTGTGGAGGACGGTGACGGTGGTAAGAGTGTGCTGCGGTGCGGT TGGGACG GCGGCGGCGAATAAAAGCGGCGTGCGGCGCGCACGGCGAAAAGCAGACGCGCGTCTGTGTTGTG TGTCTTT GACCGCGGCGGAACACACGCGGAAAAGCGAGTCCCAGGGGACACACGACGAGCGAGTCCCAGGG GGGGAC GACGACGGCCAGGGACGCGGAAACGACGCGGAAAAGAGGAAGTCCCCAGGGGGACGGGCGGAAA AGAGG AAGCGCCTAGGGGACCGCGGGGGCAGGAACAGACGAAGTACGCCGCAACCCGCGTCGAGGACAC ACGCAG AAGCGGCCGCCCAGGGGAGGGGGGGGGGGGGACTCGCGGGCCCCGGGGCACACTTGTTGTTCCC TCCGGCC
- 65 038595
GCCGACACGCACCCCGAAGCCGCGCACACCGCCGACACACCCCTGACACACCCGCGACACACCC
GCCACAC
G С С C GAGACAC G С С C G C GACACAC С C GAC C GACACAC CCT GACACAC С С C G С СAACACACCCAG
CCGCACC
CGCCCCGCCAACACACCCCCGACACACCCGACACACGCCCGCGACACACCCGGCACACACCCAC
CCACCCA
GCCGCGCCCCCGACACACCCCGAACGGCGCCGGTGCGGGACAGGGCTCACGGAGGTTTGCGGGC
CGTGAGC
ACGCCTCCCTTTGTACACACTACCGGTGCGTGGCGTCCCACGCTATTTGTTCGCGAGACCGGAC
TAAGGGAG
GTTTGCGGTGCGTCAGCGCGGGGCGGCGTTTGCGGCGTGTTTCGACCAGCGCTTTGTGCGCGCT
GCCTGTGC
GTGTCGTCCCATGGTCTTTGTCAGCGGCACGGCGCTGGGGACGGGGTTTCACCGCGCTGAGGGA
TCTTTCTG
CGGGTGTGAGGGACGGAGCTTTTTTCGCACGCTGGGCACCGGGCTGGGGGACGGGGGGTGTGCG
GGACGGC
GGTGGGGCCGGGGCGTTGCGGGTACGGGGATTACGCTGGGAACGGGGACTCGCGGACCCGGGCT
GAGGGA
CGGGGGTGGCGGGGGTGTTTGCGGCGAGGACGGGGGCCTTTTGCGGCGGGGACGGGGACTCACC
CTCGCCT
ATT TAAC С T С СAC С СAC T T CAACACACACATGСCGCACAATCAT GCCAGСCACAGACACAAACA
GCACCCAC
AC CAC G С C G C T T СAC С CAGAG ТАС CAACACACGT TACСС T ТАСACCACAGCAACACACAACCGC
CTATCCAA
ACCTCGGACAAACACGCCAACGAAGAACACCGCACGCAGATGGAGCTCGACGCCGCGGATTACG
CTGCTTG
CGCGCAGGCCCGCCAACACCTCTACGCTCAAACACAACCCCAACTACACGCATACCCCAACGCC
AACCCTCA
GGAAAGCGC TCAT TTT T CCACAGAAAATCAACAT CAAC T CACGCAT С ТАС T T CACAACAT T GGC
GAAGGCGC
AGCGCTCGGCTACCCCGTCCCCCGCGCGGAAATCCGCCGCGGCGGTGGCGACTGGGCCGACAGC
GCGAGCG
ACTTCGACGCCGACTGCTGGTGCATGTGGGGACGCTTCGGAACCATGGGCCGCCAACCTATCGT
GACCTTAC
TGTTGGCGCGCCAACGCGACGGCCTCGCTGACTGGAACGTCGTACGCTGCCGCGGCACAGGCTT
TCGCGCAC
- 66 038595
ACGATTCCGAGGACGGCGTCTCTGTCTGGCGTCAGCACTTGGTTTTTTTACTCGGAGGCCACGG
CCGCCGTGT
ACAGTTAGAACGTCCATCCGCGGGAGAAGCCCAAGCTCGAGGCCTATTGCCACGCATCCGGATC
ACCCCCAT
CTCCACATCTCCACGCCCAAAACCACCCCAGCCCACCATATCCACCGCATCGCACCCACATGCT
ACGACTCG
CCCACATCACACGCTCTTTCCTATCCCTTCTACACCCTCAGCCACGGTTCACAATCCCCGAAAC
TACGCCGTC
CAACTTCACGCCGAAACGACCCGCACATGGCGCTGGGCACGACGCGGTGAACGTGGCGCGTGGA
TGCCGGC
CGAGACATTTACATGTCCCAAGGATAAACGTCCCTGGTAGACGGGGTAGGGGGATCTACCAGCC
CAGGGAT
CGCGTATTTCGCCGCCACGCTGCTTCACCGATATCCAATAAACCCATCCCCTCGCCACGACGTC
TCCGCGTAT
CTTTGTAGCCTCAGGAATCCGTCCCCACGTCCATCCATCCCGAGCACTCCACACGCTATAACAG
ACCACGGA
CACGGCAAATGCATGCAAACTTCTCATTTATTGTGTCTACTACTCTGTGTTGCTACAGGGAGTG
AAGGGGGT
GAAGGCAAAGAAAAAAAAAAGGAACAAAATAATAGATTAGCAGAAGGAATAATCCGTGCGACCG
AGCTTG
TGGTTСTTTTСTTATAAGGAGGCAAATATACTAGGGAAAACTTAAGAATAGGAAGAAACCGAGG
TTTGGGA
GAAAAGCTGAGATAAAATAGCGCATTTTCCATACAGAGGTTGTTGTTTTTGTGGATCCTAAGAG
GTTTCAAG
TGCGAATСTCAAAGTTСTCACGAGAATATTGTСTTCAAGAATCGACAACTGTGGTCCAAGATTT
TTTTTTGGT
CTTTTTAGGTTCTGCGAGGGACATCACGATGGATCGTTGCGATGAAGTCACGCGTACGCCTCTG
GTGTGGCG
CGGTGTCGTGACAGGAGAGTGTGTTTTCAGTGCAGAGCTGTCTTGATTCCTATATCCGAGTATC
TGTTTTCTC
GTAAGGACGGTAATCTTCTTTGGTGTAAGTACATCTAAAAGCTGCAAACTATATTTTAAGGGCT
GTCTCTAG
GTGTACTTTGATGCTGGAGTTTTTCGCTGTGTTGATGTGAATAAATCTACTACTACTATTATAT
GCAGAAAGA
GTGATTATGCCGAGACAAGATTGCATTGGCTGAACTGTTTCAAAAACGCCTACACTCTACTTAT
CCGTAAAC
- 67 038595
CTAAGGTAATACTATGTGTAAGTTGTTTTTTTTTCTTTTTGTAGTAAAATGGTGATACGTGCAA
TTAAAACTG
TATTCCATGTTTCCATCCTTTCATTTCAACTTTAAAGGCGGCTTTGAGAGCGAAGAAGTGCGAG
TGGATGACTCCTTCGTGTCCAGGGAGTCGACTACTGCAACGCTGATTGATTAAAAGATGGTCTC
CGATGATG
ATGTTGTTATTGATCGAATCATGGTGCAGAACGGCGACGGAGAGGAGCGTGTCCGCCGCCGGGA
AGGTGGT
CTCTTTCTCTTTTCTTTTTTCAAGAAATCTTCCATGTGTTTATCGTAGTGATCGAAATCGACTG
ATCTCGGGTT
CTTTTTGTTGGTTTCTTTTCGGTTAATCATGTATTGTTTTCTTTTTTTACAGAAAGATACTTTT
TTCATGAGCAA
TTCCTCGCCCGGCGCCGGCATGCCGAGGTGGGGCCACTGCGATCAGCGGCATGCCGACGCCGAC
CCGGGGA
TCTTGGATTCACCGTTTTCTCTCTTCTCTCTCTACATACAGACCGGGTGGCAGGAGCGGTAAGG
AATCATCGT
C G T C Τ Τ T CAT T C Τ T C GAT GAT TAT G G TAATACΤAAAT CTTATCTAGGAGCATATACAT С TAAGA
TTGGAGTAC
TAGTAGTCGTTTGTGGTTTCTATTTTTTTTATATTTATCTATGACAGTTTTTCTGTTTTTCGTT
TTGATAATAAT
ATAATAAAAACTCATGGACGTGAAATCTGGCTTGGTTGTGGTGATTTCATTCTCATTATTGTTG
TTTTCTTTCC
GTCTTGCGGATGAAGATGTTGCGATGCGGTTGTTGTTGGTGTTGCTATACACCGAGAGAGATGA
TCTTTTTGT
TCTTCTGGTTCATTTCCTATGATTGTTTGGCTGCTGACCGACGCGTCAGGATGTGCAGGGCATG
CGGGGAATC
AGGACCGGACACGGGATAATTTCATCTACCTATACGGAGATCGCGGTCCTCGCCATGAGGATCG
CGACAGG
CGCGTCGAGGGGGCAGGAACACCCTTGCGGATTGACATTCTTGGTGGTGTTTCGTTGTTGTCGG
TAGTTGTTG
TTGACGATGAGGATAAATAAAAATGACCTTGTTTTTGTTCTGTTTTCTCTTGTTGGGAATCGTC
GACTTTGAA
TTCTTCGAGTTATCGGAAAGCTGAGGTACCCAAATGTCTGTAGCTTTTTTCTTTTTACCCTCTT
GTTTATCATC
TGCGATTCGTGGTAGGTAGGAGAGGGAAATGATAATCCGAGATTAAGGAAAGGAGAAGATAAAA
- 68 038595
AAAAAAATAATAAAACAGAAGCCGACCGGCCGCCGACCCGTTCCCCAGGACCAGCCTACGAGGA
ATGGATA
ACGCGGTGGCGACGGCAGCGGTGGTGGCGCTGGGGGTGGCGGCAGTGGTACTGCTGATGGTAGT
CGGGACG
GAGGAGAGGCGATGCATACATACACGCGTGCATGCTGCATGGGTGGATGGTACGGCCGGGAGAC
GCGGAA
GAGAAAC T C AC AT AAAAAG G T GAG AAAAAGAG C G G T T GAAAAAAGAAAAC GAGAT T C GAG GAGA
CAGAAG
AGAAGGACCGGGGCTTGGCGACCCTTCCACGACTGCTGTTGTCATCTCGGCTCCCCCGTCTTCT
CCCGGCCAC
GGGCGGCTAAGTCACCGCCGTTCTCCCCATCCGTCCGAGCGCCGACCGACCAGCCGGCCGATTC
GCCCGCCG
GGGCTTCTGGAGAACGCCGGGGCAGCAGCGATCTGGGGAAGCCGCTAAACCCCTGCGTTTTTAT
ATGGTAGC
TCTGCCGAGCGCGGGCTGACGCGTTGAGTAAGCGGAAAGACGTGTGTGACGAAAAGGGGTCCCA
TGGTATT
TCACGTGACGATGAGGAGATGCGGTTTGGAGCACATACGGTTTAGAAAAAGGGAGTTGTCGTGA
CAAGGGC
TGAGGGACCTCTGTCTCCATGTGTGTATAAAAAGCAAGGCACGTTCATAATGTAAAAAAGAACA
CGTTGTAA
ACAAGCTATTGCTGTATCATTCGGCTGACTATGCTTCATTCGGACTGATTTTCTTTTCCTAACG
GCGTAACTT
AAAG T GAT TAAG GTATGATATTTGTTCCC CAGAG TTATACTATAGTCATCATCC TAAAAT T CAG
ATATAAATG
AACACATGTCGTATGGGATTATTAAGAAACCGAAACTСTСCACAGTTСACCATСTTСTTCGTCA
TTCAACCG
ATGACCCACTCCGTACAACGAATCAGTCTGCTGTGTCACACTGCAAACTACTAGCGACGTATGC
AAACAACT
T GAAAC AC GGGCTGTTGTATT GAC GAC C G T T G T AC C AT T AC T AG T C AC AT T G C AT AGAGAC CAT
CCACCGTC
ATCCCATCTTTCCCACCCGATGGAAAACCGTCTTCTATCATCAACTATGGTAAGATTTCGACCC
TGCGAGGTA
T T CAG TTTCCCCATATC CATAAC CTGGATTTTATCAT TAAAC С С CAATAT TAAACAC T T T T T TA
GTACCCCCCC
ACCCACCAAAAAATGTGACTGGACCGGTTCCTAGCAGCTCTGGGAGCCATGTTCAGGTTGAACC
ACAGCTAC
- 69 038595
AGCGAAACCGAGTCCAGTGACCGGTAACCACGTCCAGCCCCTGCGTATGTACCAGTCCAAGCAC GTCCGGTC
AT T G T T C TAGACAG GAAAT С TAAG TAG G T CAAG G CAAT T T TAT T С САС C G T TAC G CAGAATAC T AACAAACA
AAC AC AC AAAT T T AAC GAAT TAG AC GTAGTTTAT TAG AT GAAAAC T G T AAGAAC AC C AAT T C AC TAAGCGAT
ACAACAT T TAG С T GAC T T С CAAG TGC CACACAT СAC CAC TGTATTCATCCATGTTTT СAC C GAA CCAACGAG
ACAGAT C GAAGAAG С CAGAAT С T С С C GAC T T TAAAT TACATAAATСCAACGTAT TAT GACCACA GCTCGACA
CACAAATAG TTGCGTTACTATT CACAG TAG CAT ТАС С TATAC С C G TAAC G T T G CACAAC СAC T G АТСACCATT
GTTACCAAAAACGGTTTTCCACTTAGTTGTCAACGGATCTTTCCCATGCGTAATGGTCAAATTA CTACCAGTC
GTCGCTTTTAGCTCATTACGAGTATTATCCGCATCCACATATATCAACGTCATAGCTAGGCACG CTATAAGTA
CCCCCCCCCCACAATGGAATGTTGCCAAACCGGTTCTTTCCCGTTATAGCCATAGCGTTCCCAG
GCAAAAGC
AAACGCCAAACCTAATGCAGTGAAAAGCGCTTGCAGCCAGAACCAGCTTATGTACCAGCCACAA TCACATC
CGGTTATTGTTTCCACAGGAAATCCTACCAGGCAAAGCCCCGCTTGTTTTGTTCCTGACCATCT
TGTTTAGCA
ATTCGTAAACTGTCAGCCTAGCGACGTCCGTTTAGATCAAAAGTCACGTATATAGCGACGCTGT
TTCCACCC
GTTTCCCCGTCCCGCCGTTTCCGAACAACCCACCCGGGTTCAGACAACCGACCACCAACAGAAA
TATACACA
CAGACCACCGGGAGTTCAGTTAAAGATTTCATCAGGTTTATTTTGGCTGCTGCTAGTCTTTTGC
TTCTTAGAA
AAAAAATACCCATATAGAGAAATAAT GATAGT T T GACAACACATAT GGCAGGGAT TTCTTCTTC
ATCAATAA
GATAT G CAAT T С С С C CAG G GAGAGAC TTT CAACAAT T GAAT T TACAAAAACAAAAT TAGAT CAG
GAGAAAG
AGAGGATACAT TAATAAATATAT TATAT С T GGT GTATATAC T GAAT GC T GC T GGT T CATAAGGT
AACGATGC
TACTTTTTTTAATTCCAAGATGGTTTTTCTTTGTTAGTCTTTTGTTGACTTGCTGGTTCCTAAA
AGTTCGCAAA
- 70 038595
AACGATTGTGTGAAGATTATGACGTTGGTTGACTAGTTCATGAGATTCTGCTGTACGTGTGATG
GTTATTCGC
TGGTTCGTTCTAAGATGAGTATCGTACTGTGTCTGCGATGGTCGTCTCTTACTGGCATTCTCTC
GGCTGCCTCT
TGTTTTCATGATTGAAAAGGAAAAAAGGACTCCGAGGGCGCGGTCATCTTTTACTTTTCGGTTT
TCTCGTTGG
CGGGTCAGAGGTAGTCAGATCATGAGACTGTCGTGGTCGATGAAACTGTGTCTGCTCAAGTGAC
GTCCATTT
CTTGTACGGAGAAAAAAGTCATCGGGATAAATAAGGCTATACAAGGCGTTGTCAAGCGTGCGGC
TCTAAAC
AAATTAAGCGATACAAAATTACAGTGATACGAATAATAAATTACССССTСССССTGTGGTСССC
CCGAGGCG
AGAGCCACCCATCGTGTACTCTCGCACCACCCACGACCACAGGGGGAGACGGGACGAAGAGACG
ACGCAG
AGCGCCATCTCCTCCTGGAGGCCGGCGGCGTTAACTGCTACAGCTGCGGCGGCGACGACAGCTG
CGATTTGT
CGGCCGACATGCCGATGGTATGGGCGGCGGCGGCGGTGGCCGCGGCAGCGGGGAGGAGAGGAGA
GAGAAG
AGGAGCGGGGCGTCCGAAGGCGAGGATGGCATGGTCTCGCCGGAGCGCCCGGCTTTTATGGAAC
ACTCGCG
TCCGGTTGGGTAT САС C GAGAG GAAGAT GAATCACAAGT T ССAAACCAT С T T GAGACСCGAGTA
ACGGTTTA
CAGGTCGCACGCCAGTCTCAGCTAAAAACAGCGGACAGTCCCACGCTGTTTCTGTTGTGGCTCT
CTCCAGTTT
CCTCATCGCCGTCTTGGTCTCCGTCATCATCGGAAGAATACCACCCGCTCTCATGCGGCAGTCG
ATCAGCCTC
GATGAACGAGACGCGGCGACGCCTTTCTACGGCCGACTGGTTGTGGTGGTGAAAGAAGAGCACC
AGCAATC
CCAGGAGGAGCAACAAGCCCTCACATGTCCAGGAGGTCGGGGAGAGGGCCTGTCGGAGATGACC
GTGAGG
CATCACGTACGGCAGCTGAGGAGAAACGGAGAAGAAAGGAAAATTACCGTCAGGGGCCGGGGTT
CTTATTA
GAGAAACAGCACGTAGGTCAGGATCCAGATGCTAATGGCAATCATGATGACGATGATCATGCAG
GCCAAGA
CGCGGCGCACCAATGCAGAATCCAATAGCCGCCGTGCCTCCGGTTGGTGGCCGGCGGCATCTAG
AGACATG
- 71 038595
ATTTGGGGGGGGGACCGGCGGCGCAAAAAGACAGGGAGATGGACAGTGCCACGGTGTTTTGTTA
TGATTAG
GACATGGGGACCGGAAGCCGAGACAGAGTACTACAGGGTGTTGAAGGGTAACGTGAGGGAGATC
ATGTCAT
GGGCGGGCTGAAGACCGTGCGGGGAGGATCGACGTGTGCGGTGCTTGTGGAACACGGTGTTTTA
ATATGTA
TCCGCGTGTAATGCACGCGGTGTGCTTTTTAGCACTCGGCTTGATAAGCTACGTGACCGTCTGC
GCTGAAAC
CATGGTCGССACCAAGTGTСTCGTGAAAACAGAAAATACССACСTAGCATGTAAGTGCAATСCG
AATAGTAG
ATCTACCAATGGCAGCAAGTGCCACGCGATGTGCAAATGCCGGGTCACAGAACCCATTACCATG
CTAGGCG
CATACTCGGCCTGGGGCGCGGGCTCGTTCGTGGCCACGCTGATAGTCCTGCTGGTGGTCTTCTT
CGTAATTTA
CGCGCGCGAGGAGGAGAAAAACAACACGGGCACCGAGGTAGATCAATGTCTGGCCTATCGGAGC
CTGACAC
GCAAAAAGCTGGAACAACACGCGGCTAAAAAGCAGAACATCTACGAACGGATTCCATACCGACC
CTCCAGA
CAGAAAGATAACTCCCCGTTGATCGAACCGACGGGCACAGACGACGAAGAGGACGAGGACGACG
ACGTTT
AACGAGGAAGACGAGAACGTGTTTTGCACCATGCAGACCTACAGCAACTCCCTCACGCTTGTCA
TAGTCACG
TCGCTGTTTTTATTCACAGCTCAGGGAAGTTTATCGAATGCCGTCGAACCAATCAAAAAACCCC
TAAAGCTC
GCCAACTACCGCGCCACTTGCGAAAACCGTACACGCACGCTGGTTACCAGGCTTAACACTAGCC
ATCACAGC
GTAGTCTGGCAACGTTATGATATCTACAGCAGATACATGCGTCGTATGCCGCCACTTTGCATCA
TTACAGAC
GCCTATAAAGAAACCACGCGTCAGGGTGGCGCAACTTTCACGTGCACGCGCCAAAATCTCACGC
TGTACAAT
CTTACGGTTAAAGATACGGGAGTCTACCTTCTACAGGATCAGTATACCGGCGATGTCGAAGCTT
TCTACCTC
ATCATCCACCCACGCAGCTTCTGCCGAGCCTTGGAAACGCGTCGATGCTTTTATCCGGGACCAG
GCAGAGTC
GGTGTGGTCACGGATTCCCAAGAGGCAGACCGAGCAATTATCTCGGATTTAAAACGCCAGTGGT
CCGGCCTC
- 72 038595
TCACTCCATTGCGCCTGGGTTTCGGGACTGATGATCTTTGTTGGCGCACTGGTCATCTGCTTTC
TGCGATCGC
AACGAATCGGAGAACAGGACGTTGAACATCTGCGGACGGACCTGGATACGGAACCTTTGTTGTT
GACGGTG
GACGGGAATTTGGAATAAAAGATGCGTAACACCTGTCGAAGATGCGATAACTTTACATACAGGC
AAACAGT
G TATACAATTATAGTATTTTGTATGTTGCATAAAGT TAGAT GCAAGAGTAC T GС TAACAGTACT GCATCCATT
AC G С TAT С CAACACTGCCTCTACСAC T T T T GTAACCAACATATAT T CAAC T СCGAATAACAACA
CATCAACG
AC G С CACACACAT С T G T СAC С T CACAAG CGT CAAC CAT T G G CAACAT СAC CAAC GTTACCTCCG
ACTTGAGT
AC T T T CACAAC CGTATATTC TAGAT T CAATACAT CAT T T G С CAATATAT CTAATACGGCTGTCA CTACAGAAT
T GAT T T CAACAAATAC CAACAC TATCTCATCTTTTAC CAAC G TAACAG СAAAC G C TAGAT CATC TTATAACAC
AACAAT СAC C G TAAC TGT CAC G T CAGAT GAAAC T T C G CACAAC G TAT С СAC TAATAAT G СAC T T
ATAAGCAC
ACCATGGCCTACAAATTGCAGCGCCACAACATACACCACGTACAACCTTACTAACTCTTCCAAC
GCTTGTCA
CACAGAGACAACAAT CATAC G T T T CAAGGAAAC CAATACAACAGGAATAGAAGGGAG TAAT G T C
ACCATAA
AGGGTAATTCTACGTGGGACTGTCTTTCAGTCGCCTGGATACGACATTACAATAGATCCACACA
CGGACATC
ATCTAGGTTATCGTAAGAACGCACATACCCAATCTTGGTATTGGCTACGCATCCTTACCTCTCA
CACTGTATG
T CAT T С T CAACAT GAAAGAC CTT СAC T G TAG CAT GAC TTATGTCGTTCGTG CAACAACACAGAA TTACATCTG
TAG GAT С T AAAT AT C AC CAAT T С C G G CAG G TAG AG C AGAC G T T G T T T T AAAGAAAAT T AC T T C A CAGGACAT
CAC GAAGAT GAAAAT TTCTACCTATTAG TAACAC СAAAAAAT CATAC T GAAG CTATTAATGCTA
CTTTCGTT
T G С С С TAGATACAACAC C GATAT C GAAAAT GAAGATAGAGAGAAAG GAAG T CAACATAC TAACA
ATACACA
TCACCACAAACGTAATCTCTATCATAGCTCGCAAAGAAGCCGCACCGTATGGACCATCGTGTTG
GTTTGTAT
- 73 038595
GGCCTGCATAGTTCTGTTTTTTGCACGACGAGCCTTTAACAAAAAGTATCATATGTTACAAGAC
ACCGTCAG
T GAAT CAGAAT TCATTGTTCGATAT СAC С CAGAACAT GAAGAT T GAG CTACGTTTCCGGG CAGA
CATCTTAT
GAAG С T GAACAATAAAC TAAAACAT T С T G TAAGAC T CAG C G T T CAAAG GAATAT TAATGCCCAT
TGAGCGA
AAACTAATATTGCAATGGACTGGCGATTTACGGTTACGTGGACCGTTACTTGTGATGGTTTCAA
TTATACAGT
CCATAAAAGATGCGATCGCAGTTACGAGGTAATCAACGTAACAGGATACGTTGGTAGCAACATA
ACTCTAA
AAAAATGCAATCAGACTGAGAAATGGCACAATGTAGACTGGATTCATTATGAGTACCCCACGCA
TAAAATG
TGCGAATTAGGCAACTATCACCAAACCACACCACGGCACGACATATGTTTTGACTGCAACGACA
CCTCCCTA
AAATTACTACGTAACGGTGTTAATTGGAGACACAACGTTATTCACTCTTGGCACATGCCCTGTA
AGATATAA
AGAAT С TAC GAACAC T GAAAACAC CAT T G GAAG TAG CAT CATAGAAAC CATT GAGAAAG С TAAC
ATTCCCC
TGGGAATTCATGCTGTATGGGCAGGCGTAGTGGTATCAGTGGCGCTTATAGCGTTGTACATGGG
TAGCCATC
G CAT T С С CAAAAAG С C G CAT TACAC CAAAC T T С С СAAATAT GAT С CAGAT GAAT T T T G GAC TAA
GGCTTAAC
ATGCTGATCAATAAACTTTTTTTAACCAATAACATGTCTCCGTTTTTTTTTGTTAACAACCTAT
GATATAAAG
CGTTATATTCAGTCGTTACTAAACAAAAAAACATGGGCATGCAATGCAACACTAAATTGTTATT
GCCAGTCG
C AC TAATACCGGTTG C AAT CATCCTAATTGGTACTCTAGTGCCGATACTTT T AC AT GAAC AAAA
AAAGGCGT
TTTACTGGCGACTTTTTCTGCAAAGTCAACATGTAGAAGCACCCATTACAGTAACGCAGGGAGA
CACAGTCT
ACCTAGACGCTAGCAATAATCCCTGTAATTATTCCAGCTTTTGGTACCACGGTAATTGCGAACT TTGTGGATG
GAAC GGATATCTACG CAAT G T TAGACAT TAG TAGACAAACACAT CGTGTTCCCCG CAAT T CAT C TGCATAAA
- 74 038595
CGAAACTAAAGGTCTGCAGTTATATAATGTAACATTAAACGATTCAGGCGCTTATACTGAACAC GTTTACGA
AT G T GAG CTTTCGTG TAACAT ТАС ТАС TAATAAC GAATAT GAAATAC T CAAT TAT T T T GATAAC TGTAACTAC
AC CATAAATAG СAC CAAG CATAT TAT CAC CGTGGTGTCTT CAC G T CAT T С TAAACAAACAAAT T CCCACGTA
TCCACTCACGCTGGTTGGGCAGTCGCCGTGGTGACGGTAATTATGATCTACGTTCTGATCCACT
TTAACGTCC
CGG CAAC TCT GAGACACAAAC TAG GAAC TAGAAACAAC G TAAAT C G CATAG C G T GAT TATAAAG
TATCGAC
GCTAATTTCTCCAAGATAAAATTTGATTACTCCGTGCAGTTCTCAAAAACTGTAAGGCCCCGCT
TTTCCACTC
CGTCATGAAGGATCGCAATAGAATACTGCTATGTATCATCTTTATTTGCATTATGTGCCTCATT
TGTATTTAC
TTTAAACGTCGTTGTGTTTTTACTCCGTCTCCAGACAAAGCAGATCTGCGAGTGGAATTTCCCT
CGTTACCCC
CGTGTATTGGCATACAGTGCGCTGCATGAGAACACGCGTGACACATAGCGTACCCCTGGACGGT
ACAGTTTA
T GATAAC G TAAT T CAG G GAAAG TATACAT T CATAC CAACAT G T TAT CACATAACACACAGAT T T
TCTGCGTG
TTTTATAAAAGAGCGTCTCGAAGCAGCTTGAGCCACACTACGGTCCAGATGACGAGCGTAATTA
AAAATATG
CCGCGCAGTATTCGAAAGCCGTACTGAGCGTGCGAGGCGGGTAGGGTGCCGAACGACGGATATG
CGTCGTT
GTCATCTTCGACTATAAGGATCGCGACCGAGTCTTCGGCCATGGTAAACGTCACCCTGTGTGGC
TGGTATGT
AGCGTATCCGGTTTGGAATTGTTCTGCTCCAGCTCGGGGGATAGTGAGGAATTCTCAAGGGATA
CGGGACCC
AATGACTGGATAAGAGAAGGGTTTTTCCCCGTAAGATGATCCTCGTATCACATGAGGTCTGGAT
ATGTATAA
ATGAAGAGTGAAATAGGCACAGGGAATCAGATGCCAGCCTCGTGATGCAGCCGCTGGTTCTCTC
GGCGAAG
AAACTGTCGTCTTTGCTGACTTGCAAATACATCCCGCCTTAAGCGATGAGTCTATAAAGCACCG
TTGCCCGA
GTACGGTAAAAGTGACCCGGATTGTAGAACGTCCTTTTTTTTTGTTTTTGCATCGTTTATCGTC
ACTAGTAGT
- 75 038595
GCAATATTTTGATTGTAAGGCTGAAAGAGTATCGTTATGATGCTTAGAACGTGGAGATTATTAC
AGATGGTA
CTGCTTGCCGCGTACTGTTATTATGTTTTTGCGACTTGTTCAATCAGCACGACGACTGCTCCTG
TGGAATGGA
AGTCTCCCGACCGTCAGATTCCCAAGAATATTACCTGCGCTAATTACTCAGGGACCGTCAACGG
CAACGTTA
GTTCGTTCTTCCC GAAAC T C CAG G G TAAG TAT GAG GAACAAGAT TACAGATAT GAAG TAG C GAA
CCTGACGT
ATAACTGCACCTATAACCGCTTGACGTTGCTGAATCTGACGACGGAAAACAGCGGAAAGTACTA
TTTCAAAA
GGGAAGATGCGAATTTCACCTTCTATTACTCTTGTTACAACTTGACCGTGTCCTAAAGATCGCA
CGTGAAGTT
TCACAGAGCCGCGTGGCTGTAGCTATTGTGTTTACGTTGCTTTTGAAATGTTAAGCGTCCCTAC
GGCGCTAAC
ATGTTTCTAGGCTACTCTGACTGTGTAGATCCCGGCCTTGCTGTGTATCGTGTATCTAGATCAC
GCTTAAAGC
TCATGTTGTCTTTTGTGTGGTTGGTCGGTTTGCGTTTCTATGATTGTGCCGCGTTCGAGTCCTG
CTGTTACGAC
ATCACCGAGGCGGAGAGTAACAAGGCTATATCAAGGGACGAAGCAGCATTCACCTCCAGCGTGA
GCACCCG
TACACCGTCCCTGGCGATCGCGCCTCCTCCTGACCGATCGATGCTGTTGTCGCGAGAGGAAGAA
CTCGTTCC
GTGGAGTCGTCTCATCATCACTAAGCAGTTCTACGGAGGCCTGATTTTCCACACCACCTGGGTC
ACCGGCTTC
GTCCTGCTAGGACTCTTGACGCTTTTCGCCAGCCTGTTTCGCGTACCGCAATCCATCTGTCGTT
TCTGCATAG
ACCGTCTCCGGGACATCGCCCGTCCTCTGAAATACCGCTATCAACGTCTTGTCGCTACCGTGTA
GCTAGTTAG
CCAGCTGTGTGTAGTGTTTTGCTTTTGCATATTTGTTTTCAGTCAGAGAGTCTGAAACGGGGTG
GGAGGGACT
TTTGCGGGTAGTGCATGCTAAGATGAACGGGTGGGCTGGGGTGTGCTTGATAACTCACTGTTTG
AATACGCG
CTCACGCACATATGTAGCACTCAACATGTTAGCTTTTGCCCGCACGCCCCGGGGCGTGCCGAGC
TGCCTTTTT
AATAAAGTCTGGGTTTCCAGATACGCGCTGGTTCTGATTTTGATGGTTTGTGCCTCTGAAAGCT
CTACGAGCT
- 76 038595
GGGCCGTGACATCCAATGGACTGCCTAACTGTAGCACGGTAACTAGAACAGCGGGTCAAGACGC
TGAATTG
CACGGTCCGGCACCGTTAAGCTGTAATGTGACCCAGTGGGGACGTTACGAGAATGGAAGCACAC
CCGTGTT
ATGGTGCACTTTACGGGGATCAAGCATGCGAGTCTCATTAGGACACCGTGTAGCGTTTGGCTGT
TCTTGGAA
AACATTTTTTATTTATAACGTTTCTGAAAGTAGCGGTGGCACTTACTATCAAAAAGGTTACAAC
TGCACCGA
CAAACATATAACACTATCTTGTTTCAACTTAACGGTGGTTCCTCGAGCGGTTCAAAGCACAACC
ACCGTAAT
GACACCCACGCTGGTTACAAACTCCACATTCAGTGTGTCACTTGTTCCGTTGAGACTGACGACA
AATTCCAG
CGCGTTTGGACACGCTATTTATCAACGACAACAGCGTGTTGAAAACGGGACGTTATCCAAGAAC
ATAACTAA
CTTGGCATTCACCTATGGCAGCTGGGGCGTTGCGATGCTGCTGTTTGCCGCCGTGATGGTGCTC
GTTGATTTG
GGTTTGCCTCAATCGGCTTGGCGACGCTGGCGAAGCCACGTGGACGATGAAGAACGTGGTTTGT
TAATGTAG
GAAATAAAAGGCAGTTTGAGCATGACTGTTTCCAAACCGTAACGTGGTAAATAAATCATGGCTT
CCGACGTG
GGTTCTCATCCTCTGACGGTTACACGATTTCGCTGCAGAGTGCATTATGTGTACAATAAACTGT
TGATTTTAA
CTTTGTTTGCCCCCGTGATTCTGGAATCCGTCATCTACGTGTCCGGGCCACAGGGAGGGAACGT
TACCCTGGT
ATCCAACTTCACTTCAAACATCAGCGCACGGTGGTTCCGCTGGGACGGCAACGATAGCCATCTC
ATTTGCTT
TTACAAACGTGGAGAGGGTCTTTCTACGCCCTATGTGGGTTTAAGCCTAAGTTGTGCGGCTAAC
CAAATCAC
CATCTTCAACCTCACGTTGAACGACTCCGGTCGTTACGGAGCAGAAGGTTTTACGAGAAGCGGC
GAAAATG
AAACGTTCCTGTGGTATAATTTGACCGTGAAACCCAAACCTTTGGAAACTACTCCAGCTAGTAA
CGTAACAA
С CAT C G T GAG GAG GAGAT C GAG GAT GAT C GAG G C GAAAAG TAAG G T TAGAG G GAAC G C CAG TTT
AGCACCA
CAATTACGTGCCGTCGCTGGATTCTCCAATCAGACGCCTTTGGAAAACAACACGCACCTGGCCT
TGGTAGGT
- 77 038595
GTTGTTGTGTTTTTAGTTCTGATAGTTGTTTGCATTATGGGGTGGTGGAAATTGTTGTGTGGTA
AACCAGAGT
TATAGTAATGTGCTTTTTATCAGGGAGAAGGTTTTGTGCCAACAATGACTAGCCCGGGACTATC TGCGTCAG
AAAAT TAT GAG G GAAAT TAT GAAT T GAG G GAAAC CGG GAATACAAG G C G TAGAAATAGAAG T GA CTGGACA
ACGTTAGAAACCAGTGCATTGCTATTGAAAAACACGGAGACTGCAGTGAACCTCAGCAACGCGA
CTACGGT
CATCCCACAACCTGTAGAATACCCGGCTGGGGAAGTACAATATCAAAGAACGGCAACGCATTAT TCTTGGAT
GC TAAT CAT TGT CAT CAT TCT CAT CAT TTT TAT TAT CAT С T G T C TAG GAGCAC С T C GAAAAAT C TAGCATCACT
G GAAAGACAGTAAACAGTACGGACAAGT GT T TAT GACAGACACGGAAC TGT GACAGT GAT GT С T AAGCGTT
T GCAGG TAT T T C CAT GGATAACAAT T T TAT T T TACACAT CAAAAT С C CAG TAT T GGAAC TATAT GGCAATACC
ATGTACCCCTACAGTTGGATACGGCAGTCATAATATTAGCTTGCATCCGCTTAATAACTCATTA
TTTCAAGAC
GATGTTTTT GAAT G G TAGATAGACAAAC CAAT GGT TAGAAG TTATGTCTTTAT CAAAG TAAT GA
ACGCACAA
AAT С CAAT С TAGAC T С T С CAAATAT T G T G T G G CAAT G CACAGATAAT C G ТАСAC TAATTCTCAT GAACTTAA
С СACAACATACAG TAGAAAC TATTATTTT CAAT С С T T TAAATAT С T C G GAC GAG GAG ТАС CAAA ACCGAATA
AC T T G T G T TATAAC G T TAG T G ТАСAC T T TAC С СAC CAAACACAT TGC CATACAAC TAGAT CATC CCTGTATCC
AC C TAG AT CTG TAG AC GAT T CAT T AGAAAT AT C AC AG T C AT T С AC С T C AAC C AAC T T C AC AC AT ACCGCGGT
С СAC TAC G С CAC CGG TAAC GTT GAAG CACAACAC GACAC ТАС СAC T С CACATACAAT G T G GAT C ATACCCCT
AGTTATCGTTATAACAATCATCGTTTTAACTTGTTTCAAATTСССCCAGAAAGСTTGGAATAAA TTCACACAA
GATATGTACGTTTATTTTT CAG С T СAC T G T T T GAATAC C G TAAACATAAT GAC G TAGATATAC G
TGGTTATAC
- 78 038595
AACAGGTGTTTGTGTTATGCGGCGACTGATTAACCATATCGTGAACCATGATCTTTTCCGATGG
TCCGTCGTG
AC C G CAAT GATAT T T TACAGATAT T С C GAAAC С T G TAT G GAG G T CAC TGT CAGAG TAG G T GAT C
CAGTТАСC
CTCGGTAGTGGACATGGTTATCATCCAGGTAGGGATAACAGGGTAATGATCCTCTAGAGTCGAC
CTGCAGGC
AT GCAAGC T T GAGTAT T C TATAGT С T CACC TAAATAGC T TGG
SEQ ID NO: 11
ДНК
Род/вид - цитомегаловирус ЦМВЧ
Описательное название- пост-редактирование фрагмента ЦМВЧ
ACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTCGAGCTCGGTACCCGATTAC
CCTGTTAT
CCCTACCATTCCGGGCCGTGTGCTGGGTCCCCGAGGGGCGGGGGGGTGTTTTTAGCGGGGGGGT
GAAATTTG
GAGTCTTGGAGCCGCGTGTGCTGTGGAGGACGGTGACGGTGGTAAGAGTGTGCTGCGGTGCGGT
TGGGACG
GCGGCGGCGAATAAAAGCGGCGTGCGGCGCGCACGGCGAAAAGCAGACGCGCGTCTGTGTTGTG
TGTCTTT
GACCGCGGCGGAACACACGCGGAAAAGCGAGTCCCAGGGGACACACGACGAGCGAGTCCCAGGG
GGGGAC
GACGACGGCCAGGGACGCGGAAACGACGCGGAAAAGAGGAAGTCCCCAGGGGGACGGGCGGAAA
AGAGG
AAGCGCCTAGGGGACCGCGGGGGCAGGAACAGACGAAGTACGCCGCAACCCGCGTCGAGGACAC
ACGCAG
AAGCGGCCGCCCAGGGGAGGGGGGGGGGGGGACTCGCGGGCCCCGGGGCACACTTGTTGTTCCC
TCCGGCC
GCCGACACGCACCCCGAAGCCGCGCACACCGCCGACACACCCCTGACACACCCGCGACACACCC
GCCACAC
G С С С GACACAC G С С С G С GACАСАС С С GAC С GACАСАС С С Т GACАСАС С С С G С СААСАСАС С СAG
CCGCACC
CGCCCCGCCAACACACCCCCGACACACCCGACACACGCCCGCGACACACCCGGCACACACCCAC
ССАСССА
GCCGCGCCCCCGACACACCCCGAACGGCGCCGGTGCGGGACAGGGCTCACGGAGGTTTGCGGGC
CGTGAGC
ACGCCTCCCTTTGTACACACTACCGGTGCGTGGCGTCCCACGCTATTTGTTCGCGAGACCGGAC
- 79 038595
TAAGGGAG
GTTTGCGGTGCGTCAGCGCGGGGCGGCGTTTGCGGCGTGTTTCGACCAGCGCTTTGTGCGCGCT
GCCTGTGC
GTGTCGTCCCATGGTCTTTGTCAGCGGCACGGCGCTGGGGACGGGGTTTCACCGCGCTGAGGGA
TCTTTCTG
CGGGTGTGAGGGACGGAGCTTTTTTCGCACGCTGGGCACCGGGCTGGGGGACGGGGGGTGTGCG
GGACGGC
GGTGGGGCCGGGGCGTTGCGGGTACGGGGATTACGCTGGGAACGGGGACTCGCGGACCCGGGCT
GAGGGA
CGGGGGTGGCGGGGGTGTTTGCGGCGAGGACGGGGGCCTTTTGCGGCGGGGACGGGGACTCACC
CTCGCCT
ATT TAAC С T С СAC С СAC T T CAACACACACATGСCGCACAATCAT GCCAGСCACAGACACAAACA
GCACCCAC
AC CAC G С C G C T T СAC С CAGAG ТАС CAACACACGT TACСС T ТАСACCACAGCAACACACAACCGC
CTATCCAA
ACCTCGGACAAACACGCCAACGAAGAACACCGCACGCAGATGGAGCTCGACGCCGCGGATTACG
CTGCTTG
CGCGCAGGCCCGCCAACACCTCTACGCTCAAACACAACCCCAACTACACGCATACCCCAACGCC
AACCCTCA
GGAAAGCGC TCAT TTT T CCACAGAAAATCAACAT CAAC T CACGCAT С ТАС T T CACAACAT T GGC
GAAGGCGC
AGCGCTCGGCTACCCCGTCCCCCGCGCGGAAATCCGCCGCGGCGGTGGCGACTGGGCCGACAGC
GCGAGCG
ACTTCGACGCCGACTGCTGGTGCATGTGGGGACGCTTCGGAACCATGGGCCGCCAACCTATCGT
GACCTTAC
TGTTGGCGCGCCAACGCGACGGCCTCGCTGACTGGAACGTCGTACGCTGCCGCGGCACAGGCTT
TCGCGCAC
ACGATTCCGAGGACGGCGTCTCTGTCTGGCGTCAGCACTTGGTTTTTTTACTCGGAGGCCACGG
CCGCCGTGT
ACAGTTAGAACGTCCATCCGCGGGAGAAGCCCAAGCTCGAGGCCTATTGCCACGCATCCGGATC
ACCCCCAT
CTCCACATCTCCACGCCCAAAACCACCCCAGCCCACCATATCCACCGCATCGCACCCACATGCT
ACGACTCG
CCCACATCACACGCTCTTTCCTATCCCTTCTACACCCTCAGCCACGGTTCACAATCCCCGAAAC
TACGCCGTC
CAACTTCACGCCGAAACGACCCGCACATGGCGCTGGGCACGACGCGGTGAACGTGGCGCGTGGA
- 80 038595
TGCCGGC
CGAGACATTTACATGTCCCAAGGATAAACGTCCCTGGTAGACGGGGTAGGGGGATCTACCAGCC
CAGGGAT
CGCGTATTTCGCCGCCACGCTGCTTCACCGATATCCAATAAACCCATCCCCTCGCCACGACGTC
TCCGCGTAT
CTTTGTAGCCTCAGGAATCCGTCCCCACGTCCATCCATCCCGAGCACTCCACACGCTATAACAG
ACCACGGA
CACGGCAAATGCATGCAAACTTCTCATTTATTGTGTCTACTACTCTGTGTTGCTACAGGGAGTG
AAGGGGGT
GAAGGCAAAGAAAAAAAAAAGGAACAAAATAATAGATTAGCAGAAGGAATAATCCGTGCGACCG
AGCTTG
TGCTTСTTTTСTTATAAGGAGGCAAATATACTAGGGAAAACTTAAGAATAGGAAGAAACCGAGG
TTTGGGA
GAAAAGCTGAGATAAAATAGCGCATTTTCCATACAGAGGTTGTTGTTTTTGTGGATCCTAAGAG
GTTTCAAG
TGCGAATСTCAAAGTTСTCACGAGAATATTGTСTTCAAGAATCGACAACTGTGGTСCAAGATTT
TTTTTTGGT
CTTTTTAGGTTCTGCGAGGGACATCACGATGGATCGTTGCGATGAAGTCACGCGTACGCCTCTG
GTGTGGCG
CGGTGTCGTGACAGGAGAGTGTGTTTTCAGTGCAGAGCTGTCTTGATTCCTATATCCGAGTATC
TGTTTTCTC
GTAAGGACGGTAATCTTCTTTGGTGTAAGTACATCTAAAAGCTGCAAACTATATTTTAAGGGCT
GTCTCTAG
GTGTACTTTGATGCTGGAGTTTTTCCrCTGTGTTGATGTGAATAAATCTACTACTACTATTATA
TGCAGAAAGA
GTGATTATGCCGAGACAAGATTGCATTGGCTGAACTGTTTCAAAAACGCCTACACTCTACTTAT
CCGTAAAC
CTAAGGTAATACTATGTGTAAGTTGTTTTTTTTTCTTTTTGTAGTAAAATGGTGATACGTGCAA
TTAAAACTG
TATTCCATGTTTCCATCCTTTCATTTCAACTTTAAAGGCGGCTTTGAGAGCGAAGAAGTGCGAG
TGGATGACTCCTTCGTGTCCAGGGAGTCGACTACTGCAACGCTGATTGATTAAAAGATGGTCTC
CGATGATG
ATGTTGTTATTGATCGAATCATGGTGCAGAACGGCGACGGAGAGGAGCGTGTCCGCCGCCGGGA
AGGTGGT
CTCTTTCTCTTTTCTTTTTTCAAGAAATCTTCCATGTGTTTATCGTAGTGATCGAAATCGACTG
- 81 038595
ATCTCGGGTT
TTCATGAGCAA
TTCCTCGCCCGGCGCCGGCATGCCGAGGTGGGGCCACTGCGATCAGCGGCATGCCGACGCCGAC
CCGGGGA
TCTTGGATTCACCGTTTTCTCTCTTCTCTCTCTACATACAGACCGGGTGGCAGGAGCGGTAAGG
AATCATCGT
C G T С T T T CAT T С T T C GAT GAT TAT GG TAATAC TAAAT С T TAT C TAGGAGCATATACAT С TAAGA
TTGGAGTAC
TTGATAATAAT
ATAATAAAAACTCATGGACCrTGAAATCTCrCrCTTGGTTGTGGTGATTTCATTCTCATTATTG
TTCrTTTTCTTTCC
GTCTTGCGGATGAAGATGTTGCGATGCGGTTGTTGTTGGTGTTGCTATACACCGAGAGAGATGA
TCTTCTGGTTCATTTCCTATGATTGTTTGGCTGCTGACCGACGCGTCAGGATGTGCAGGGCATG
CGGGGAATC
AGGACCGGACACGGGATAATTTCATCTACCTATACGGAGATCGCGGTCCTCGCCATGAGGATCG
CGACAGG
CGCGTCGAGGGGGCAGGAACACCCTTGCGGATTGACATTCTTGGTGGTGTTTCGTTGTTGTCGG
TAGTTGTTG
GACTTTGAA
TGCGATTCGTGGTAGGTAGGAGAGGGAAATGATAATCCGAGATTAAGGAAAGGAGAAGATAAAA
AATAAA
AAAAAAATAATAAAACAGAAGCCGACCGGCCGCCGACCCGTTCCCCAGGACCAGCCTACGAGGA
ATGGATA
ACGCGGTGGCGACGGCAGCGGTGGTGGCGCTGGGGGTGGCGGCAGTGGTACTGCTGATGGTAGT
CGGGACG
GAGGAGAGGCGATGCATACATACACGCGTGCATGCTGCATGGGTGGATGGTACGGCCGGGAGAC
GCGGAA
GAGAAAC T C AC AT AAAAAG G T GAC AAAAAGAG C G G T T GAAAAAAGAAAAC GAGAT T C GAC C AGA
CAGAAG
AGAAGGACCGGGGCTTGGCGACCCTTCCACGACTGCTGTTGTCATCTCGGCTCCCCCGTCTTCT
- 82 038595
CCCGGCCAC
GGGCGGCTAAGTCACCGCCGTTCTCCCCATCCGTCCGAGCGCCGACCGACCAGCCGGCCGATTC
GCCCGCCG
GGGCTTCTGGAGAACGCCGGGGCAGCAGCGATCTGGGGAAGCCGCTAAACCCCTGCGTTTTTAT
ATGGTAGC
TCTGCCGAGCGCGGGCTGACGCGTTGAGTAAGCGGAAAGACGTGTGTGACGAAAAGGGGTCCCA
TGGTATT
TCACGTGACGATGAGGAGATGCGGTTTGGAGCACATACGGTTTAGAAAAAGGGAGTTGTCGTGA
CAAGGGC
TGAGGGACCTCTGTCTCCATGTGTGTATAAAAAGCAAGGCACGTTCATAATGTAAAAAAGAACA
CGTTGTAA
ACAAGCTATTGCTGTATCATTCGGCTGACTATGCTTCATTCGGACTGATTTTCTTTTCCTAACG GCGTAACTT
AAAG T GAT TAAC GTATGATATTTGTTCCC CAGAG TTATACTATAGTCATCATCC TAAAAT T CAG ATATAAATG
AACACATGTCGTATGGGATTATTAAGAAACCGAAACTСTСCACAGTTСACCATСTTСTTCGTCA
TTCAACCG
ATGACCCACTCCGTACAACGAATCAGTCTGCTGTGTCACACTGCAAACTACTAGCGACGTATGC
AAACAACT
T GAAAC AC GGGCTGTTGTATT GAC GAC C G T T G T AC C AT T AC T AG T C AC AT T G C AT AGAGAC CAT
CCACCGTC
ATCCCATCTTTCCCACCCGATGGAAAACCGTCTTCTATCATCAACTATGGTAAGATTTCGACCC TGCGAGGTA
T T CAG TTTCCCCATATC CATAAC CTGGATTTTATCAT TAAAC С С CAATAT TAAACAC T T T T T TA GTACCCCCCC
ACCCACCAAAAAATGTGACTGGACCGGTTCCTAGCAGCTCTGGGAGCCATGTTCAGGTTGAACC
ACAGCTAC
AGCGAAACCGAGTCCAGTGACCGGTAACCACGTCCAGCCCCTGCGTATGTACCAGTCCAAGCAC GTCCGGTC
AT T G T T C TAGACAG GAAAT С TAAC TAG G T CAAC G CAAT T T TAT T С СAC C G T TAC G CAGAATAC T AACAAACA
AACACACAAAT T TAAC GAAT TAGAC GTAGTTTAT TAGAT GAAAAC T G TAAGAACAC CAAT T CAC TAAGCGAT
ACAACAT T TAG С T GAC T T С CAAG TGC CACACAT СAC CAC TGTATTCATCCATGTTTT СAC C GAA CCAACGAG
ACAGAT C GAAGAAG С CAGAAT С T С С C GAC T T TAAAT TAGATAAAT С CAAC G TAT TAT GAC CACA
- 83 038595
GCTCGACA
СACAAATAG TTGCGTTACTATT CACAG TAG CAT TAC С TATAC С C G TAAC G T T G СACAAC СAC T G
АТСACCATT
GTTACCAAAAACGGTTTTCCACTTAGTTGTCAACGGATCTTTCCCATGCGTAATGGTCAAATTA CTACCAGTC
GTCGCTTTTAGCTCATTACGAGTATTATCCGCATCCACATATATCAACGTCATAGCTAGGCACG CTATAAGTA
CCCCCCCCCCACAATGGAATGTTGCCAAACCGGTTCTTTCCCGTTATAGCCATAGCGTTCCCAG GCAAAAGC
AAACGCCAAACCTAATGCAGTGAAAAGCGCTTGCAGCCAGAACCAGCTTATGTACCAGCCACAA TCACATC
CGGTTATTGTTTCCACAGGAAATCCTACCAGGCAAAGCCCCGCTTGTTTTGTTCCTGACCATCT TGTTTAGCA
ATTCGTAAACTGTCAGCCTAGCGACGTCCGTTTAGATCAAAAGTCACGTATATAGCGACGCTGT TTCCACCC
GTTTCCCCGTCCCGCCGTTTCCGAACAACCCACCCGGGTTCAGACAACCGACCACCAACAGAAA TATACACA
CAGACCACCGGGAGTTCAGTTAAAGATTTCATCAGGTTTATTTTGGCTGCTGCTAGTCTTTTGC
TTCTTAGAA
AAAAAATACCCATATAGAGAAATAAT GATAGT T T GACAACACATAT GGCAGGGAT TTCTTCTTC ATCAATAA
GATAT G CAAT T С С С C CAG G GAGAGAC TTT CAACAAT T GAAT T TACAAAAACAAAAT TACAT CAG GAGAAAG
AGAGGATACAT TAATAAATATAT TATAT С T GGT GTATATAC T GAAT GC T GC T GGT T CATAAGGT
AACGATGC
TACTTTTTTTAATTCCAAGATGGTTTTTCTTTGTTAGTCTTTTGTTGACTTGCTGGTTCCTAAA
AGTTCGCAAA
AACGATTGTGTGAAGATTATGACGTTGGTTGACTAGTTCATGAGATTCTGCTGTACGTGTGATG GTTATTCGC
TGGTTCGTTCTAAGATGAGTATCGTACTGTGTCTGCGATGGTCGTCTCTTACTGGCATTCTCTC GGCTGCCTCT
TGTTTTCATGATTGAAAAGGAAAAAAGGACTCCGAGGGCGCGGTCATCTTTTACTTTTCGGTTT
TCTCGTTGG
CGGGTCAGAGGTAGTCAGATCATGAGACTGTCGTGGTCGATGAAACTGTGTCTGCTCAAGTGAC GTCCATTT
CTTGTACGGAGAAAAAAGTCATCGGGATAAATAAGGCTATACAAGGCGTTGTCAAGCGTGCGGC
- 84 038595
TCTAAAC
AAATTAAGCGATACAAAATTACAGTGATACGAATAATAAATTACCCCCTCCCCCTGTGGTCCCC
CCGAGGCG
AGAGCCACCCATCGTGTACTCTCGCACCACCCACGACCACAGGGGGAGACGGGACGAAGAGACG
ACGCAG
AGCGCCATCTCCTCCTGGAGGCCGGCGGCGTTAACTGCTACAGCTGCGGCGGCGACGACAGCTG
CGATTTGT
CGGCCGACATGCCGATGGTATGGGCGGCGGCGGCGGTGGCCGCGGCAGCGGGGAGGAGAGGAGA
GAGAAG
AGGAGCGGGGCGTCCGAAGGCGAGGATGGCATGGTCTCGCCGGAGCGCCCGGCTTTTATGGAAC
ACTCGCG
TCCGGTTGGGTAT САС С СACAG GAAGAT GAAT САСААС Т Т С САААС САТ С Т Т GAGAC С С GAG ТА
ACGGTTTA
CAGGTCGCACGCCAGTCTCAGCTAAAAACAGCGGACAGTCCCACGCTGTTTCTGTTGTGGCTCT
CTCCAGTTT
CCTCATCGCCGTCTTGGTCTCCGTCATCATCGGAAGAATACCACCCGCTCTCATGCGGCAGTCG
ATCAGCCTC
GATGAACGAGACGCGGCGACGCCTTTCTACGGCCGACTGGTTGTGGTGGTGAAAGAAGAGCACC
AGCAATC
CCAGGAGGAGCAACAAGCCCTCACATGTCCAGGAGGTCGGGGAGAGGGCCTGTCGGAGATGACC
GTGAGG
CATCACGTACGGCAGCTGAGGAGAAACGGAGAAGAAAGGAAAATTACCGTCAGGGGCCGGGGTT
СТТАТТА
GAGAAACAGCACGTAGGTCAGGATCCAGATGCTAATGGCAATCATGATGACGATGATCATGCAG
GCCAAGA
CGCGGCGCACCAATGCAGAATCCAATAGCCGCCGTGCCTCCGGTTGGTGGCCGGCGGCATCTAG
AGACATG
ATTTGGGGGGGGGACCGGCGGCGCAAAAAGACAGGGAGATGGACAGTGCCACGGTGTTTTGTTA
TGATTAG
GACATGGGGACCGGAAGCCGAGACAGAGTACTACAGGGTGTTGAAGGGTAACGTGAGGGAGATC
ATGTCAT
GGGCGGGCTGAAGACCGTGCGGGGAGGATCGACGTGTGCGGTGCTTGTGGAACACGGTGTTTTA
ATATGTA
TCCGCGTGTAATGCACGCGGTGTGCTTTTTAGCACTCGGCTTGATAAGCTACGTGACCGTCTGC
GCTGAAAC
СATGGТСGССАССААСТGТСТСGТGAAAACAGAAAATАСССАССТAGСATGТAAGТGСААТССG
- 85 038595
AATAGТАС
ATCTACCAATGGCAGCAAGTGCCACGCGATGTGCAAATGCCGGGTCACAGAACCCATTACCATG
CTAGGCG
CATACTCGGCCTGGGGCGCGGGCTCGTTCGTGGCCACGCTGATAGTCCTGCTGGTGGTCTTCTT
CGTAATTTA
CGCGCGCGAGGAGGAGAAAAACAACACGGGCACCGAGGTAGATCAATGTCTGGCCTATCGGAGC
CTGACAC
GCAAAAAGCTGGAACAACACGCGGCTAAAAAGCAGAACATCTACGAACGGATTCCATACCGACC
CTCCAGA
CAGAAAGATAACTCCCCGTTGATCGAACCGACGGGCACAGACGACGAAGAGGACGAGGACGACG
ACGTTT
AACGAGGAAGACGAGAACGTGTTTTGCACCATGCAGACCTACAGCAACTCCCTCACGCTTGTCA
TAGTCACG
TCGCTGTTTTTATTCACAGCTCAGGGAAGTTTATCGAATGCCGTCGAACCAATCAAAAAACCCC
TAAAGCTC
GCCAACTACCGCGCCACTTGCGAAAACCGTACACGCACGCTGGTTACCAGGCTTAACACTAGCC
ATCACAGC
GTAGTCTGGCAACGTTATGATATCTACAGCAGATACATGCGTCGTATGCCGCCACTTTGCATCA
TTACAGAC
GCCTATAAAGAAACCACGCGTCAGGGTGGCGCAACTTTCACGTGCACGCGCCAAAATCTCACGC
TGTACAAT
CTTACGGTTAAAGATACGGGAGTCTACCTTCTACAGGATCAGTATACCGGCGATGTCGAAGCTT
TCTACCTC
ATCATCCACCCACGCAGCTTCTGCCGAGCCTTGGAAACGCGTCGATGCTTTTATCCGGGACCAG
GCAGAGTC
GGTGTGGTCACGGATTCCCAAGAGGCAGACCGAGCAATTATCTCGGATTTAAAACGCCAGTGGT
CCGGCCTC
TCACTCCATTGCGCCTGGGTTTCGGGACTGATGATCTTTGTTGGCGCACTGGTCATCTGCTTTC
TGCGATCGC
AACGAATCGGAGAACAGGACGTTGAACATCTGCGGACGGACCTGGATACGGAACCTTTGTTGTT
GACGGTG
GACGGGAATTTGGAATAAAAGATGCGTAACACCTGTCGAAGATGCGATAACTTTACATACAGGC
AAACAGT
G TATACAAT TATAGTATTTTGTATGTTG CATAAAG T TAGAT G СAACAG TAC T G С TAACAG TACT GCATCCATT
AC G С TAT С CAACAC TGCCTCTAC СAC T T T T G TAAC CAACATATAT T CAAC T С C GAATAACAACA
- 86 038595
CATCAACG
AC G С CACACACAT С T G T СAC С T CACAAG CGT CAAC CAT T G G CAACAT СAC CAAC GTTACCTCCG
ACTTGAGT
AC T T T CACAAC CGTATATTC TAGAT T CAATACAT CAT T T G C CAATATAT CTAATACGGCTGTCA
CTACAGAAT
T GAT T T CAACAAATAC CAACAC TATCTCATCTTTTAC CAAC G TAACAG СAAAC G C TAGAT CATC
TTATAACAC
AACAAT СAC C G TAAC TGT CAC G T CAGAT GAAAC T T C G CACAAC G TAT С СAC TAATAAT G СAC T T
ATAAGCAC
ACCATGGCCTACAAATTGCAGCGCCACAACATACACCACGTACAACCTTACTAACTCTTCCAAC
GCTTGTCA
C AC AGAGAC AAC AAT C AT AC G T T T C AAG GAAAC CAAT AC AAC AG GAAT AGAAG G GAG T AAT G T C
ACCATAA
AGGGTAATTCTACGTGGGACTGTCTTTCAGTCGCCTGGATACGACATTACAATAGATCCACACA
CGGACATC
ATCTAGGTTATCGTAAGAACGCACATACCCAATCTTGGTATTGGCTACGCATCCTTACCTCTCA
CACTGTATG
T CAT T С T CAACAT GAAAGAC CTT СAC T G TAG CAT GAC TTATGTCGTTCGTG CAACAACACAGAA
TTACATCTG
TAG GAT С TAAATAT CAC CAAT T С C G G CAG G TAGAG CAGAC G T T G T T T TAAAGAAAAT TAC T T CA
CAGGACAT
CAC GAAGAT GAAAAT TTCTACCTATTAG TAACAC СAAAAAAT CATAC T GAAG CTATTAATGCTA
CTTTCGTT
T G С С С TAGATACAACAC C GATAT C GAAAAT GAAGATAGAGAGAAAG GAAG T CAACATAC TAACA
ATACACA
TCACCACAAACGTAATCTCTATCATAGCTCGCAAAGAAGCCGCACCGTATGGACCATCGTGTTG
GTTTGTAT
GGCCTGCATAGTTCTGTTTTTTGCACGACGAGCCTTTAACAAAAAGTATCATATGTTACAAGAC
ACCGTCAG
T GAAT CAGAAT TCATTGTTCGATAT СAC С CAGAACAT GAAGAT T GAG CTACGTTTCCGGG CAGA
CATCTTAT
GAAG С T GAACAATAAAC TAAAACAT T С T G TAAGAC T CAG C G T T CAAAG GAATAT TAATGCCCAT
TGAGCGA
AAACTAATATTGCAATGGACTGGCGATTTACGGTTACGTGGACGATACTAATGTCCGCGTTGTC
AGAAAGCT
GCAATCAAACCTGTTCTTGTCAATGTCCCTGTAGTACTACCGTTAACTATTCAACTAGTACTGA
- 87 038595
GACAGCCAC
AT CAACATACAGTAGAACAGT TAT CAGCAATAAAAGCAC T T CAGAAT C TATAAAT T GC T С ТАС T
GCAACTAC
T T GAGAC ТАС CACAT G TAC CAACAC СAC CAC GAC CGTTACTTGTGATGGTTT CAAT TATACAG T
CCATAAAA
GATGCGATCGCAGTTACGAGGTAATCAACGTAACAGGATACGTTGGTAGCAACATAACTCTAAA
AAAATGC
AAT CAGAC T GAGAAAT G G CACAAT G TAGAC TGGATTCATTAT GAG TAC С С CAC G CATAAAAT G T
GCGAATT
AGGCAACTATCACCAAACCACACCACGGCACGACATATGTTTTGACTGCAACGACACCTCCCTA
ACTATСТА
CAACTTAACCACAAAAAACGCTGGAAAATATACCAGGCGTCACCGTGATAACGGTCAAGAAGAA
AATTACT
ACGTAACGGTGTTAATTGGAGACACAACGTTATTCACTCTTGGCACATGCCCTGTAAGATATAA
AGAATCTA
C GAACAC T GAAAACAC CAT T G GAAG TAG CAT CATAGAAAC CATT GAGAAAG С TAACAT T С С С С T
GGGAATT
CATGCTGTATGGGCAGGCGTAGTGGTATCAGTGGCGCTTATAGCGTTGTACATGGGTAGCCATC
GCATTCCC
AAAAAGCCGCATTACACCAAACTTCCCAAATATGATCCAGATGAATTTTGGACTAAGGCTTAAC
ATGCTGAT
CAATAAACTTTTTTTAACCAATAACATGTСTСCGTTTTTTTTTGTTAACAACСTATGATATAAA
GCGTTATATT
CAGTCGTTACTAAACAAAAAAACATGGGCATGCAATGCAACACTAAATTGTTATTGCCAGTCGC
ACTAATAC
CGGTTGCAATCATCCTAATTGGTACTCTAGTGCCGATACTTTTACATGAACAAAAAAAGGCGTT
TTACTGGC
GACTTTTTCTGCAAAGTCAACATGTAGAAGCACCCATTACAGTAACGCAGGGAGACACAGTCTA
CCTAGACG
CTAGCAATAATCCCTGTAATTATTCCAGCTTTTGGTACCACGGTAATTGCGAACTTTGTGGATG
GAACGGAT
AT С TAC G CAAT G T TAGACAT TAG TAGACAAACACAT CGTGTTCCCCG CAAT T CAT С T G CATAAA
CGAAACTA
AAGGTCTGCAGTTATATAATGTAACATTAAACGATTCAGGCGCTTATACTGAACACGTTTACGA
- 88 038595
ATGTGACC
T T T C G T G ΤAAGАТТАС ТАС ТAATAACGAATATGAAATACT CAAT TAT T T T GATAAC T GTAAC TA
CACCATAAA
TAG С AC C AAG CAT AT TAT C AC CGTGGTGTCTT C AC G T C AT T С T AAAC AAAC AAAT T С С C AC G T A
TCCACTCAC
GCTGGTTGGGCAGTCGCCGTGGTGACGGTAATTATGATCTACGTTCTGATCCACTTTAACGTCC
CGGCAACTC
T GAGACACAAACTAGGAAC TAGAAACAACGTAAAT CGCATAGCGT GAT TATAAAGTAT CGACGC
TAATTTCT
CCAAGATAAAATTTGATTACTCCGTGCAGTTCTCAAAAACTGTAAGGCCCCGCTTTTCCACTCC
GTCATGAA
GGATCGCAATAGAATACTGCTATGTATCATCTTTATTTGCATTATGTGCCTCATTTGTATTTAC
TTTAAACGTC
GTTGTGTTTTTACTCCGTCTCCAGACAAAGCAGATCTGCGAGTGGAATTTCCCTCGTTACCCCC
GTGTATTGG
CATACAGTGCGCTGCATGAGAACACGCGTGACACATAGCGTACCCCTGGACGGTACAGTTTATG
ATAACGTA
ATT CAG G GAAAG TATACAT T CATAC CAACATGT TAT CACATAACACACAGATTTTCTGCGTGTT
TTATAAAA
GAGCGTCTCGAAGCAGCTTGAGCCACACTACGGTCCAGATGACGAGCGTAATTAAAAATATGCC
GCGCAGT
ATTCGAAAGCCGTACTGAGCGTGCGAGGCGGGTAGGGTGCCGAACGACGGATATGCGTCGTTGT
CATCTTCG
ACTATAAGGATCGCGACCGAGTCTTCGGCCATGGTAAACGTCACCCTGTGTGGCTGGTATGTAG
CGTATCCG
GTTTGGAATTGTTCTGCTCCAGCTCGGGGGATAGTGAGGAATTCTCAAGGGATACGGGACCCAA
TGACTGGA
T AAGAGAAG GGTTTTTCCCCG T AAGAT GATCCTCGTAT C AC AT GAG GTCTGGATATG T AT AAAT
GAAGAGTG
AAATAGGCACAGGGAATCAGATGCCAGCCTCGTGATGCAGCCGCTGGTTCTCTCGGCGAAGAAA
CTGTCGT
CTTTGCTGACTTGCAAATACATCCCGCCTTAAGCGATGAGTCTATAAAGCACCGTTGCCCGAGT
ACGGTAAA
AGTGACCCGGATTGTAGAACGTCCTTTTTTTTTGTTTTTGCATCGTTTATCGTCACTACTAGTG
CAATATTTTG
ATTGTAAGGCTGAAAGAGTATCGTTATGATGCTTAGAACGTGGAGATTATTACAGATGGTACTG
- 89 038595
CTTGCCGC
GTACTGTTATTATGTTTTTGCGACTTGTTCAATCAGCACGACGACTGCTCCTGTGGAATGGAAG
TCTCCCGAC
CGTCAGATTCCCAAGAATATTACCTGCGCTAATTACTCAGGGACCGTCAACGGCAACGTTACAT
TTCGAGGT
CTTCAGAACAAAACGGAAGACTTTTTGTACTGGTTGTTAGGATGGGGTCATAAGTCCATTTGTT
CGTTCTTCC
C GAAAC T C CAG G G TAAC TAT GAC GAACAACATTACAGATAT GAAGTAGCGAACС T GACGTATAA
CTGCACC
TATAACCGCTTGACGTTGCTGAATCTGACGACGGAAAACAGCGGAAAGTACTATTTCAAAAGGG
AAGATGC
GAATTTCACCTTCTATTACTCTTGTTACAACTTGACCGTGTCCTAAAGATCGCACGTGAAGTTT
CACAGAGCC
GCGTGGCTGTAGCTATTGTGTTTACGTTGCTTTTGAAATGTTAAGCGTCCCTACGGCGCTAACA
TGTTTCTAG
GCTACTCTGACTGTGTAGATCCCGGCCTTGCTGTGTATCGTGTATCTAGATCACGCTTAAAGCT
CATGTTGTC
TTTTGTGTGGTTGGTCGGTTTGCGTTTCTATGATTGTGCCGCGTTCGAGTCCTGCTGTTACGAC
ATCACCGAG
GCGGAGAGTAACAAGGCTATATCAAGGGACGAAGCAGCATTCACCTCCAGCGTGAGCACCCGTA
CACCGTC
CCTGGCGATCGCGCCTCCTCCTGACCGATCGATGCTGTTGTCGCGAGAGGAAGAACTCGTTCCG
TGGAGTCG
TCTCATCATCACTAAGCAGTTCTACGGAGGCCTGATTTTCCACACCACCTGGGTCACCGGCTTC
GTCCTGCTA
GGACTCTTGACGCTTTTCGCCAGCCTGTTTCGCGTACCGCAATCCATCTGTCGTTTCTGCATAG
ACCGTCTCC
GGGACATCGCCCGTCCTCTGAAATACCGCTATCAACGTCTTGTCGCTACCGTGTAGCTAGTTAG
CCAGCTGT
GTGTAGTGTTTTGCTTTTGCATATTTGTTTTCAGTCAGAGAGTCTGAAACGGGGTGGGAGGGAC
TTTTGCGGG
TAGTGCATGCTAAGATGAACGGGTGGGCTGGGGTGTGCTTGATAACTCACTGTTTGAATACGCG
CTCACGCA
CATATGTAGCACTCAACATGTTAGCTTTTGCCCGCACGCCCCGGGGCGTGCCGAGCTGCCTTTT
TAATAAAGT
CTGGGTTTCCAGATACGCGCTGGTTCTGATTTTGATGGTTTGTGCCTCTGAAAGCTCTACGAGC
- 90 038595
TGGGCCGTG
ACATCCAATGGACTGCCTAACTGTAGCACGGTAACTAGAACAGCGGGTCAAGACGCTGAATTGC
ACGGTCC
GGCACCGTTAAGCTGTAATGTGACCCAGTGGGGACGTTACGAGAATGGAAGCACACCCGTGTTA
TGGTGCA
CTTTACGGGGATCAAGCATGCGAGTCTCATTAGGACACCGTGTAGCGTTTGGCTGTTCTTGGAA
AACATTTTT
TATTTATAACGTTTCTGAAAGTAGCGGTGGCACTTACTATCAAAAAGGTTACAACTGCACCGAC
AAACATAT
AACACTATCTTGTTTCAACTTAACGGTGGTTCCTCGAGCGGTTCAAAGCACAACCACCGTAATG
ACACCCAC
GCTGGTTACAAACTCCACATTCAGTGTGTCACTTGTTCCGTTGAGACTGACGACAAATTCCAGC
GCGTTTGG
ACAC GCTATTTAT СAAC GACAACAG C G T G T T GAAAAC G G GAC G T TAT С CAAGAACATAAC TAAC
TTGGCATT
CACCTATGGCAGCTGGGGCGTTGCGATGCTGCTGTTTGCCGCCGTGATGGTGCTCGTTGATTTG
GGTTTGCCT
CAATCGGCTTGGCGACGCTGGCGAAGCCACGTGGACGATGAAGAACGTGGTTTGTTAATGTAGG
AAATAAA
AGGCAGTTTGAGCATGACTGTTTCCAAACCGTAACGTGGTAAATAAATCATGGCTTCCGACGTG
GGTTCTCA
TCCTCTGACGGTTACACGATTTCGCTGCAGAGTGCATTATGTGTACAATAAACTGTTGATTTTA
ACTTTGTTT
GCCCCCGTGATTCTGGAATCCGTCATCTACGTGTCCGGGCCACAGGGAGGGAACGTTACCCTGG
TATCCAAC
TTCACTTCAAACATCAGCGCACGGTGGTTCCGCTGGGACGGCAACGATAGCCATCTCATTTGCT
TTTACAAA
CGTGGAGAGGGTCTTTCTACGCCCTATGTGGGTTTAAGCCTAAGTTGTGCGGCTAACCAAATCA
CCATCTTC
AACCTCACGTTGAACGACTCCGGTCGTTACGGAGCAGAAGGTTTTACGAGAAGCGGCGAAAATG
AAACGTT
ССTGTGGTATAATTTGACCGTGAAACССAAACСTTTGGAAACTACTСCAGСTAGTAACGTAACA
ACCATCGT
CACGACGACATCGACGATGATCGACGCGAAAAGTAACGTTACAGGGAACGCCAGTTTAGCACCA
CAATTAC
GTGCCGTCGCTGGATTCTCCAATCAGACGCCTTTGGAAAACAACACGCACCTGGCCTTGGTAGG
- 91 038595
TGTTGTTG
TGTTTTTAGTTCTGATAGTTGTTTGCATTATGGGGTGGTGGAAATTGTTGTGTGGTAAACCAGA
GTTATAGTA
ATGTGCTTTTTATCAGGGAGAAGGTTTTGTGCCAACAATGACTAGCCCGGGACTATCTGCGTCA
GAAAATTA
TGACGGAAATTATGAATTCACGGAAACCGCCAATACAACGCGTACAAATAGAAGTGACTGGACA
ACGTTAG
AAACCAGTGCATTGCTATTGAAAAACACGGAGACTGCAGTGAACCTCAGCAACGCGACTACGGT CATCCCA
CAACCTGTAGAATACCCGGCTGGGGAAGTACAATATCAAAGAACGGCAACGCATTATTCTTGGA
TGCTAATC
ATTGTCATCATTCTCATCATTTTTATTATCATCTGTCTACGAGCACCTCGAAAAATCTACCATC ACTGGAAAG
ACAG TAAACAG TAC G GACAAG T G T T TAT GACAGACAC G GAAC TGT GACAG T GAT G T С TAAG CGT TTGCAGG
TAT T T C CAT GGATAACAAT T T TAT T T TACACAT CAAAAT С C CAG TAT T GGAAC TATAT GGCAAT ACCATGTAG
CCCTACAGTTGGATACGGCAGTCATAATATTAGCTTGCATCCGCTTAATAACTCATTATTTCAA GACGATGTT
TTT GAAT G G TAG AT AGAC AAAC C AAT GGT TAG AAG TTATGTCTTTAT C AAAG T AAT GAAC G C AC AAAATCCA
АТС TAGAC T С T С СAAATAT T G T G T G G CAAT G CACAGATAAT C G ТАСAC TAATTCTCAT GAAC T T AACCACAA
CATACAG TAGAAAC TATTATTTT CAAT С С T T TAAATAT С T C G GAC GAG GAG ТАС СAAAAC C GAA TAACTTGT
G T TATAAC G T TAG T G ТАСAC T T TAC С СAC CAAACACAT TGC CATACAAC TAGAT CATCCCTGTA TCCACCTAC
AT С T G TAGAC GAT T CAT TAGAAATAT CACAG T CAT T СAC С T CAAC CAAC T T CACACATAC C G C G GTCCACTA
C G С CAC CGG TAAC GTT GAAG CACAACAC GACAC ТАС СAC T С CACATACAAT G T G GAT CATAC С C CTAGTTAT
CGTTATAACAATCATCGTTTTAACTTGTTTCAAATTССССCAGAAAGСTTGGAATAAATTCACA CAATACAG
ATACAGCGGTATGCTCGCCGCCGCTTAAAGAATCAACGCCAAGGAAACCAAAACGTAAAAAGAA
TAGATAT
GTACGTTTATTTTT CAG С T СAC T G T T T GAATAC C G TAAACATAAT GAC G TAGATATAC G T G G T T
- 92 038595
ATACAACAG
GTGTTTGTGTTATGCGGCGACTGATTAACCATATCGTGAACCATGATCTTTTCCGATGGTCCGT
CGTGACCGC
AATGATATTT T AC AGAT AT T С C GAAAC С T G T AT G GAG G T C AC TGT C AGAG T AG G T GAT C CAG T T
ACCCTCGG
TAGTGGACATGGTTATCATCCAGGTAGGGATAACAGGGTAATGATCCTCTAGAGTCGACCTGCA
GGCATGCA
AGC T T GAG TAT T C TATAG TCT САС С TAAATAGC T TGG
SEQ ID NO: 12
ДНК
Род/вид- Phikmvlikevirus LKA1
Описательное название - последовательность gp49 LKA1
ATGGCGCAAACACCCAGTACATGGGCCGACTACGTAGGCGACGGCGTAGAGGATACGTTCCAAG
TCACAT
TCCCGTACCAGAAGCAGCAAGAGGTGTTTGTGACTGTGGGCGGCGATCCGGCAGCTTTCACATT
CATCTC
GGCAGGTTGGATTCAACTGGCAGCGGTCCCGGTAAATGGGGCCGCAATCCGTGTACGGCGCAGC
ACTGAG
GCATTCGAGCCTCGGCACGAGTTCGCCAACGGCGTGCCATTACTGCCGCGATTCATAGACGAGA
ATAATA
CCCAGTTCTTGTACACTGTACAAGAGGCAGTGAATGAGACACATGGCATTGCTTCCGAAGCGCT
GAGTGT
CGCAGAGGAGGCCAGAGGCATTGCGCAGGCGGCATCGGATAAAGTGGATGCTGCCACCATTGAC
TCCGCA
CACCAGTTGCGTCTAGACCTCGCCGACCCGGCGAAGGGGCCTGGGCTGCTAGGCTACGACCGAG
ACGTAA
GTTATCCGGTCGGGTCGGTCGGTCAAAGCCTACAGTTTCTGGAAATGGGTCGGGTCACACCAGC
GCAATT
TGGCGCCGTTGGTGATGGCGCCAGCCACCCCCTCTCTGAGCGATACGCAACTCTAGCGGAAGCT
CAGACT
GTCTATCCGCATGCAGTCGCACTCTCCGACGAAATAGACTGGGCCGCATTGCAAGCTGCCGTGG
ATT CAG
GGGCACCTGTACACATACCGTCTGGGGACTATCAGATAAATAGGGGGATTAGCAGTACGGGCTC
TСТАСА
GATTGCGGGTGATGGCGCTACATCTATTATACGCCCGACTGCTGCGTTCACTGGTACATCGGTC
CTCAGT
- 93 038595
TGTGTGGGGAGCTTAGTTGCCTTGCCGAATATATCCTCCGTGTCGGCTGGGTCCCTAACCATTG
ACTTTG
CCAGCACCCCTAATCTTGTAGCGGGGGATGTATTCATCATCTACAACCCGACTGATAGCAGCTT
CTCGGG
ATTTCGGACGAGCTATCGCGCAGGAGAGTTCTGTGAGGTCAGGGCGGTTTCTGGGAACACCGTG
AGAATC
CGTTCCGCACTCTATGCCGCATACGACGGGGCTACTGTTGCTATTTACAAAGTAGTCTCTGGTG
TAGTTG
ATATAGCTAGCATCCAAATCGTTGGCGGGACAGTCCCAATGAATGGACTGTTAGTGGAGGCTGT
CGTTTC
ACCGCGCGTCGATGACGTGACGGTCACCCTTGCAAACAACGCCGGTGTGTATTTTGCCCGCTGC
TAT GAC
GCTAAGATCACAAACAGTAATATATCGAACATCGGCGACGGTGGCGATGACTATGGAATCATCT
TTGGGA
ACTGTCACGACGGTGGGGCAGACAACTGTAAAGTCTACGCTAGGCGACATGCCATCGCCACGGG
CGGCGA
TGCAGAAGTAGGCTGCGTTCCGGTCCGTAATGTGCGTATGCGTAACTGCACACTTAGGAATGAT
ATТАСC
TCTGGTACACACTGCGCAGACTTCCACGGTAACGCCGAGGATTGCAGCTACGAAAACTGCACAA
TCTACG
GTGGTGCAACTTGGCAGGGGAAGGATATCAGCTACAGACACTGTACAATCACTAACGCGTCGGG
TGGTTG
GATTGTTATATCCGCTGAGATTCTTGGTGGTACATTCCTTCTCGACCAATGCACATTGTACACA
ACCGGC
GATCCGCAGCCTGGTAACCGTGGGGTTATAGATGTAGGTGGGAACTCCGCAGTCCTCACTACAA
ATACAA
CGCAACCCTGTAACTTCCTTATACAAGGCGGCAGTCTGCGAGCGCCCAGCTTAAGTACGTCTAG
TTACCT
ACTGCGCGCACGTCTTGAGGGTAGTACAGTTCCAGTAAACATACAGTACAGCGGACAGGCTATT
GATGTA
GGCTCTCTGGGCAAGGTACTACAACTCGATATTACCTCGGGCAGTACCTCTCCTGAGTATTTGA
TCGTGG
AGAATTTAGCGGGGTTGCCATCTGGCATCACGCTGGCGTCTGCTGCTGGTGGTTTCGCAAGTGC
CCCGAT
GCGTATGCCTGTGCTGGGTGGTAGGGTTCAAGTAACTACGGCAACCAACGCGAGTAGCGTTACT
GCTCCA
- 94 038595
GTAACGTTCAGGTACATTTATCCTAAGGCCCCAACCGTCCAGGTCACAAAGACGGACAGGAGCT
ACGCCG
GTAACAGGGTCGGCGTTGCTATCGCCAATCCGACCTCTGCGTCTGGGGCGACGTTGGGTCTGTT
CACGGA
CGACGGGACAAACTTTAGCTCAGCCGTTACTAACCAGTTGAACTGGCAGGCAGGTATTTATGAG
GTGTAA
SEQ ID NO: 13
ДНК
Род/вид- Phikmvlikevirus NTUH-K2044-K1-1
Описательное название- gp34 NTUH-K2044-K1-1
ATGGCCCTGATCCGGCTCGTGGCGCCCGAGCGCGTGTTCAGCGACCTGGCCAGCATGGTCGCCT
ATCCGAAC
TTCCAGGTGCAGGACAAGATCACCCTGCTGGGCTCGGCCGGCGGCGACTTCACCTTCACCACCA
CCGCGTCG
GTGGTGGACAACGGCACCGTGTTCGCCGTGCCCGGCGGCTATCTCCTGCGGAAGTTCGTCGGCC
CGGCGTAT
AGCTCGTGGTTCAGCAACTGGACCGGGATCGTCACGTTCATGAGCGCGCCGAACCGGCACCTGG
TGGTGGA
CACCGTGCTGCAGGCCACGAGCGTGCTGAACATCAAGAGCAACAGCACGCTGGAATTCACGGAC
ACGGGCC
GCATCCTGCCCGACGCCGCCGTGGCCCGCCAGGTGCTGAACATCACCGGCTCCGCGCCCTCGGT
GTTCGTGC
CCCTCGCCGCCGACGCCGCCGCGGGGTCGAAGGTGATCACCGTGGCCGCCGGCGCGCTGTCCGC
GGTGAAA
GGCACCTACCTCTATCTGCGCTCCAACAAGCTGTGCGACGGCGGGCCGAACACCTATGGCGTCA
AGATCAGC
CAAATCCGTAAGGTGGTCGGCGTGAGCACCAGCGGGGGCGTGACGTCCATCCGCCTCGACAAAG
CCCTGCA
CTATAACTACTACCTCTCGGATGCCGCCGAAGTGGGCATCCCGACCATGGTGGAGAACGTCACC
CTGGTGAG
CCCGTACATCAACGAGTTCGGCTACGACGACCTGAACCGCTTCTTCACCAGCGGCATCTCCGCG
AACTTCGC
GGCCGACCTGCACATCCAGGACGGCGTCATCATCGGCAACAAGCGTCCGGGCGCCTCCGACATC
GAGGGCC
GCAGCGCCATCAAGTTCAACAACTGCGTGGATAGCACCGTGAAGGGCACCTGCTTCTATAATAT
CGGCTGGT
- 95 038595
ACGGCGTGGAGGTCCTCGGCTGCTCGGAGGACACCGAGGTGCACGACATCCACGCCATGGACGT
GCGCCAT
GCCATCTCCCTGAACTGGCAAAGCACCGCCGACGGCGATAAGTGGGGCGAACCGATCGAGTTCC
TGGGCGT
GAACTGTGAGGCGTACAGCACCACCCAGGCCGGCTTCGACACCCACGACATCGGGAAGCGTGTC
AAATTCG
TCCGCTGCGTGTCCTACGACAGCGCGGATGACGGCTTCCAGGCCCGCACCAACGGCGTGGAGTA
CCTCAACT
GCCGCGCCTACCGCGCCGCCATGGACGGCTTCGCCTCGAACACGGGCGTCGCCTTCCCGATCTA
CCGCGAAT
GCCTGGCCTACGACAACGTGCGCAGCGGGTTCAACTGCAGCTACGGCGGCGGGTATGTGTACGA
CTGCGAG
GCGCACGGCAGCCAGAACGGCGTCCGCATCAACGGCGGCCGGGTCAAAGGCGGGCGCTACACCC
GCAACTC
GTCGAGCCACATCTTCGTGACGAAAGATGTGGCGGAAACCGCCCAAACCAGCCTCGAGATCGAC
GGCGTCT
CCATGCGGTACGACGGCACCGGCCGCGCCGTGTACTTCCACGGCACCGTGGGCATCGATCCGAC
GCTCGTGA
GCATGTCCAACAACGACATGACCGGCCACGGCCTGTTCTGGGCCCTGCTGTCCGGCTATACCGT
GCAGCCGA
CCCCGCCGCGCATGTCGCGCAACCTGCTCGACGATACCGGCATCCGCGGCGTCGCGACCCTGGT
CGCGGGCG
AAGCGACCGTCAATGCCCGCGTCCGCGGGAACTTCGGCAGCGTGGCCAACAGCTTCAAGTGGGT
GTCGGAG
GTGAAGCTGACGCGCCTCACGTTCCCGTCGTCGGCCGGCGCCCTCACGGTCACCAGCGTCGCCC
AAAACCAG
GACGTGCCGACCCCCAACCCGGACCTGAACAGCTTCGTCATCCGCAGCAGCAACGCCGCCGACG
TGTCCCA
AGTC GC CT GGG AGGT CT ACCTGT G A
SEQ ID NO: 14
ДНК
Род/вид - Т7-подобный Ppl5
Описательное название - добавлена последовательность др44
Рр15
ATGGCACGAACTATCGTCCAGAACGCCCTAACAGGCGGACAACAGGACTTCGAGGTACCTTTCG
АСТАСАТС
- 96 038595
TTGCAGCGCTTCGTTAAGCTTACCCTGATCGGTGACGGTAACCGACAAGAGCTGGTCCTCGGTA
CCGACTTC
CGGTTCATCGGTCCTCGCACCGTTCGCACTAACGTCTTCTGGGGACCAGCGCAGGGGTATACCT
CCATCGAG
ATCCGACGAGTTACCAGCGCTTCTGATCGTCGCGTAGAGTTCTCGGACGGGTCCATCCTGACCG
CAGGTGAT
CTGAACATCGCCCAGCTTCAGGCCATCCACATTGCCGAAGAAGCGCGAGACTCTGCCACTGAGA
ACCTGAG
CCCAGATGCTGATGGCAACTACGATGCACGTGGTGCGCGCATTTACAACCTCGGTGACGCTGTT
CAGCCGAA
GGATGCGGTCAACCGGTACACTCTTGACCTCGCTATCGCAGCCGCTCTGGCCATGAATACCGGC
AACCCGAA
CAACGCCCAGAACATCTCGTACACCCCTAACGGGCCTGGTCAGTCGATCCGAAGTGTTGAAGGC
CGTCTGCG
GGATGCTGTGTTCGTCTCGGACTACATGACCACTCCACGTGATGGAGTTACCAGTAACCAGCAG
GACCTCGA
AAAGGCACTCGCTGCGGCGAACGCTAAAGGTGCCGACCTATTCTGGCCTGACGACATCCCGTTC
TTCTCCAC
GTCCCCGCTGGCACTGATCCACGCGGTCTACCATGTTGGACGTGGTGTCATCAACGCGAACGGT
ACGCTGTT
CTACGTGAACCCGAAGAACGGCCAACACAACAGGCTACACGTGTCTCCCGGGGGCACCGGGGAT
GGTCTGG
CAGCTGGCCGCCCACTGGGGACCATCTGGAGTGCACTCGCGGCCCTTAACATGCGAGCCCCACT
GACCACGC
GCTGGTCCTTGGAGATGACCGCTGGCGCCTATAATGAAGCCGTTACACTTCCGAACTACCTGAC
CAGCTGTA
ACGACTACTTGGCGTTTAACTGGCCGAACACCGGTCAGGAACGTATGGAGCCCACTGCGTACCC
ATCAGCTC
TCGACGGCACAGGCCAGACCGGCCTCACAGGTTTCCACACTGGCATCGGCAACCGCATTACCAT
CAACAAC
GTGTGCATGTCCAACTGGTACGACACTGCGCTGACTCCTACCCAACAGGTGCGAAGAGCGTTCG
TTGTAGGT
GCGTATTCGACTGCCTACGTGGTCAACTGCGCGTTCATTTACAACGGCATCGCGAGCGTGTCTG
TGCTGCCC
GGTGGCACTGCTATCGTAACCGGTGGCATCGTCGATGGTGGGCGGTTCGGCCTCGACAACACTG
GCGGTCGC
- 97 038595
CTGTCCCTGACGGCAACCAAGAGCAATTATACGCAGGTCCGGAACTGCCTCGAATATGGACTGT
ACTCGAAG
CATGACGCATCGACCGTAATGGACAACACCGAGTTCCGCAACTGCGGTAATCACCCTGCGGCTG
TTGCGTAT
GGTGCTGCAATCTTCGCGTACAAGTTCAACTGTTCTGTTGACACTCGTGGGGTCAAGTTCTACG
GCAACAAC
ATCGCCCAGCACTGCCGTGGCGGTATCACCTCGGACAATCCGGGCGATCCGGACATCTACGGTA
CCGGCGCA
GATGCTAATAAGCGTCTATTCCTGTGCACCGGTGGTGGCTCTGACGACATCCAGTTCTACGAAG
CTCGGCGC
GTCATGGACATCACGAAGCGCACTGGTGGCGGCTCAACTACTGCCAGCGTATCGTCGCTGCTAC
TGGCTGCC
GTTGCGTCTGTCCGTAAGGGCTACTTTGCGCACAACGATCAGGTGATCCGGATGACCCTGATGT
TCCGCGCT
ACAGGCTCGGCTGGCATCTTCACGCCGACCTTGCGCACACCTCTGGGGACTATCCCTCTGGGTA
GCTTCAGG
GTCGCATCGGGACAGTACGGCGAGATCAAGTTGACCATTCGACCTACTCTGACATCTGATGGTC
TCATAGTC
GGGTTCTCCTGCATCAACGCCGTGCAGAATCTTGGGTCCTCTGTTGGTCAAATCATCGTCAGCG
GCACCGTA
GACCTCCGCACCGTCGACCAGCTGGTCGAGATGTGGGGCTATTCGGAAGCTGGTGGCACCGCTT
CGTACATT
CAAGGCCT GATCGAGCT GGTCGGGT GA
SEQ ID NO: 15
ДНК
Род/вид - Aggregatibacter actinomycetemcomitans
Описательное название - добавлена последовательность dspB
ATGAACTGTTGCGTCAAGGGCAATTCCATCTACCCCCAGAAGACCTCCACCAAGCAGACCGGCC
TGATGCTC
GATATCGCCCGGCATTTCTACAGCCCCGAGGTGATCAAGAGCTTCATCGATACGATCAGCCTGA
GCGGCGGC
AACTTCCTCCACCTGCACTTCTCGGACCATGAAAACTATGCCATCGAGTCGCACCTGCTCAACC
AGCGGGCG
GAGAACGCCGTCCAGGGGAAGGATGGCATCTACATCAATCCGTACACCGGGAAACCGTTCCTGA
GCTACCG
CCAGCTGGACGACATCAAGGCCTACGCCAAGGCCAAGGGCATCGAACTGATCCCGGAGCTGGAC
- 98 038595
AGCCCGA
ACCATATGACGGCCATCTTCAAACTGGTCCAGAAGGACCGCGGCGTCAAGTACCTGCAGGGGCT
GAAATCC
CGCCAGGTGGACGACGAGATCGACATCACCAACGCCGATAGCATCACCTTCATGCAGAGCCTGA
TGAGCGA
GGTCATCGATATCTTCGGCGACACGAGCCAGCACTTCCACATCGGCGGCGACGAATTCGGCTAC
TCCGTCGA
GAGCAACCACGAGTTCATCACCTACGCCAACAAGCTGTCGTACTTCCTGGAGAAGAAGGGGCTC
AAGACCC
GCATGTGGAACGACGGCCTCATCAAGAACACCTTCGAGCAGATCAATCCCAACATCGAAATCAC
GTACTGG
TCGTACGACGGCGACACCCAGGATAAGAACGAAGCGGCCGAGCGCCGCGACATGCGCGTGAGCC
TGCCGGA
GCTGCTGGCGAAGGGCTTCACCGTGCTGAACTACAACAGCTACTACCTCTACATCGTGCCGAAG
GCGAGCCC
GACGTTCTCGCAGGACGCCGCCTTCGCCGCCAAAGACGTGATCAAGAACTGGGATCTGGGCGTC
TGGGATG
GCCGGAACACCAAGAACCGCGTGCAGAACACCCATGAGATCGCCGGGGCGGCGCTGTCGATCTG
GGGCGAG
GATGCGAAGGCGCTCAAGGACGAGACGATCCAGAAGAACACCAAAAGCCTGCTCGAGGCCGTCA
TCCACAA
GACCAACGGCGACGAGTGA
SEQ ID NO: 16
ДНК
Род/вид- Staphylococcus aureus
Описательное название- добавлена последовательность SaPSMaS
ATGGAGTTCGTGGCGAAGCTCTTCAAGTTCTTCAAGGACCTGCTCGGGAAGTTCCTGGGGAATA
ACT GA
SEQ ID NO: 17
ДНК
Род/вид- Staphylococcus aureus
Описательное название- добавлена последовательность SaPAMb2
ATGACCGGCCTGGCCGAGGCGATCGCGAATACCGTCCAGGCGGCCCAGCAGCACGACAGCGTCA
AGCTGGG
CACCTCGATCGTGGACATCGTCGCCAACGGCGTGGGCCTGCTGGGCAAACTCTTCGGCTTCTGA
SEQ ID NO: 18
- 99 038595
ДНК
Род/вид- Staphylococcus epidermidis
Описательное название - добавлена последовательность SePSMa ATGGCGGACGTCATCGCCAAGATCGTCGAGATCGTGAAGGGCCTGATCGACCAGTTCACCCAGA AGT GA
SEQ ID NO: 19
ДНК
Род/вид- Levivirus MS2
Описательное название- добавлена последовательность L MS2 ATGGAGACCCGGTTCCCGCAGCAGTCCCAGCAAACCCCGGCCAGCACCAACCGCCGCCGCCCCT TCAAGCA
CGAGGACTACCCGTGCCGCCGGCAGCAGCGCAGCTCCACCCTGTACGTGCTGATCTTCCTGGCG АТСТТССТ
GAGCAAGTTCACCAACCAGCTGCTGCTGTCCCTGCTGGAGGCGGTCATCCGGACCGTCACCACC CTGCAGCA
GCTGCTGACCTGA
SEQ ID NO:20
ДНК
Род/вид- Levivirus PRR1
Описательное название- добавлена последовательность L PRR1
AT G Т G СAAG G Т G Т С ТАС ТAAG G ТAGAC Т С ТАААС Т GAC Т GAG Т СAG Т Т G GACAAC Т САС САТАА GGAGCTAC
CTATGGCTACGGAATATCCTAGCATTAGCAGGACTTCTTTTCGTAATCCTTCTTGCGACCAATC АТТТАТССА
TCGCTATCTACAGTCCGTAA
SEQ ID NO:21
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название - промотор gp32 (Р32) LGZ19
CGACCCTGCCCTACTCCGGCCTTAAACCCACATCCAAAAGAGAGAGAATCGC
SEQ ID NO:22
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название - терминатор gp32 (Т32) LGZ19
TGCCACGAAACCCCGCACTTCGGTGTGGGGTTTCTTCAAAGCCTAACGACCCGCGCAGATTCCC TGCGTGGG
- 100 038595
TTTTTGCGCTTTAGGAGAAACCCT
SEQ ID NO:23
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название - область gp7 LUZ19 дикого типа
TACAAGGTGGTGGCACCCAGCTCGGCGGAAGGTATCATTGTGCTGGCGACCAAGCAGACGCCGG
CGCTAGC
CCAAGCAGCCGTCGTACTGCACAGCATGAACCCTGCGCAGTATCCCGCAGGTTCGGCTATCCTC
AACACGGC
CTGGAAGTGCCGCCGCCTGGGAGTGGGCGAGTACGTCAAGCTCGTCCAAGGGGAGGAGGAC
SEQ ID NO:24
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название- область gp!8 LUZ19 дикого типа
GAATGCCAACCGAAGAAGAACGCATGATCCGCTGTTTACTGGCGGATATCCACGAGCCACTGGA
CCTGCTGT
TCCCCGGCCTCCGTACCAAGGCCCATATGGACCCGCAAGCAGAGGAACTGTCGATTCGAATTGA
CTACGACC
ATGCGAAGCTGGGCCGTATGGGATTCTGCCACGCGGTATCCCTATATCAACTGTCCATATATGG
CCGCGAGG
GGATGGTCCGCTACCTGATGCAGGAGATTCCCCGCCGCGTGCTGGAAGGTCTGCTGGTCAAGGC
GCAGCAGT
ACAGCCAAAGCAACTGGTACAGCAAATGACGAC
SEQ ID NO:25
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название - др49 и межгенная область др48-др49
LUZ19 дикого типа
GGGGACACCATGAGCAAAGCCAAACTACGAGTCATCGCCGACACCCCGGAGCTGGAGTCAGTGC
TAAAAGC
ATTGCTGACCGCCACCTACGCTATCGAGGACCTGCTCAACGAGGCCGTGGCTAGCAAGGTGCTA
AACTCCCG
CCTGGGCTGGTCCGCAGTCGGCGAGTATGTCGAACTGTTCAACCGCACGCAATCCCGCGTGGCC
GGGTTGAT
TCCCGAGTAG
SEQ ID NO:26
- 101 038595
ДНК
Род/вид- Phikmvlikevirus LKD16
Описательное название - ген gp!8 LKD16 дикого типа
GTGCGAGTACCAACTGAACACGAGCGCACCCTGCGCTGCCTGCTCCAAGACATCCACGGGCCGC
TGAATCTG
CTGTTCCCAGGTATCCGGGTGAAGGTGGAGGAGGCGTGCCTCGGATACTTGGGCTACAGGGAGC
GGGGCTA
TTGGGAGCTGCGCCTCCAGGTGGACTACGACCACCCGAAGCTTGGGCACCTCCGCTACAGTCAG
GCCGTGCC
GGAGTACGTGCTGATCAACGACCGCGACAGCATCATCAAGTACCTGATGGAAGCAGTCCCTCGG
CAGGTAC
TAGAGGGCATGCTCAATAAGGCCCAGGAATTCGTAACCAAGAACTGGTATTCCCTATGA
SEQ ID NO:27
ДНК
Синтетический (искусственный/неизвестный)
Описательное название - ген, кодирующий NLS-FLAG-CAS9-His
ATGCCCAAGAAAAAGCGGAAGGTCGGCGACTACAAGGATGACGATGACAAGTTGGAGCCTGGAG
AGAAGC
CCTACAAATGCCCTGAGTGCGGAAAGAGCTTCAGCCAATCTGGAGCCTTGACCCGGCATCAACG
AACGCAT
ACACGAGACAAGAAGTACTCCATCGGGCTGGACATCGGGACGAACTCCGTGGGATGGGCCGTGA
ТСACAGA
CGAATACAAGGTGCCTTCCAAGAAGTTCAAGGTGCTGGGGAACACGGACAGACACTCCATCAAG
AAGAACC
TCATCGGGGCCTTGCTCTTCGACTCCGGAGAAACCGCCGAAGCAACGCGATTGAAAAGAACCGC
CAGAAGA
CGATACACACGACGGAAGAACCGCATCTGCTACCTCCAGGAGATCTTCAGCAACGAGATGGCCA
AGGTGGA
CGACTCGTTCTTTCATCGCCTGGAGGAGAGCTTCCTGGTGGAGGAAGACAAGAAACATGAGCGC
САСССGA
TCTTCGGGAACATCGTGGACGAAGTGGCCTACCACGAGAAATACCCCACGATCTACCACTTGCG
CAAGAAA
CTCGTGGACTCCACGGACAAAGCGGACTTGCGGTTGATCTACTTGGCCTTGGCCCACATGATCA
AATTTCGG
GGCCACTTCCTGATCGAGGGCGACTTGAATCCCGACAATTCCGACGTGGACAAGCTCTTCATCC
AGCTGGTG
- 102 038595
CAGACCTACAACCAGCTCTTCGAGGAGAACCCCATCAATGCCTCCGGAGTGGACGCCAAAGCCA
TCTTGTCC
GCCCGATTGTCCAAATCCAGACGCTTGGAGAACTTGATCGCACAACTTCCTGGCGAGAAGAAGA
ACGGCCT
CTTCGGCAACTTGATCGCGCTGTCGCTGGGATTGACGCCTAACTTCAAGTCCAACTTCGACTTG
GCCGAGGA
CGCCAAGTTGCAACTGTCCAAGGACACCTACGACGACGACCTCGACAACCTGCTGGCCCAAATT
GGCGACC
AATACGCGGACTTGTTTTTGGCGGCCAAGAACTTGAGCGACGCCATCTTGTTGAGCGACATCTT
GCGCGTGA
ATACGGAGATCACCAAAGCCCCTTTGTCCGCCTCTATGATCAAGCGGTACGACGAGCACCACCA
AGACTTGA
CCCTGTTGAAAGCCCTCGTGCGGCAACAATTGCCCGAGAAGTACAAGGAGATCTTCTTCGACCA
GTCCAAGA
ACGGGTACGCCGGCTACATCGACGGAGGAGCCTCCCAAGAAGAGTTCTACAAGTTCATCAAGCC
CATCCTG
GAGAAGATGGACGGCACCGAGGAGTTGCTCGTGAAGCTGAACCGCGAAGACTTGTTGCGAAAAC
AGCGGAC
GTTCGACAATGGCAGCATCCCCCACCAAATCCATTTGGGAGAGTTGCACGCCATCTTGCGACGG
CAAGAGG
ACTTСTACСCGTTССTGAAGGACAACCGCGAGAAAATCGAGAAGATССTGACGTTCAGAATССC
CTAGTAGG
TGGGACCCTTGGCCCGAGGCAATTCCCGGTTTGCATGGATGACGCGCAAAAGCGAAGAGACGAT
CACCCCC
TGGAACTTCGAAGAAGTGGTCGACAAAGGAGCATCCGCACAGAGCTTCATCGAGCGAATGACGA
ACTTCGA
CAAGAACCTGCCCAACGAGAAGGTGTTGCCCAAGCATTCGCTGCTGTACGAGTACTTCACGGTG
TAGAACGA
GCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCGCAAACCCGCGTTCCTGTCGGGAGAGCAA
AAGAAGG
CCATTGTGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAACAGCTGAAAGAGGACTA
CTTCAAG
AAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGATTCAATGCCTCCTTGG
GAACCTAC
CATGACCTCCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCC
TGGAGGA
- 103 038595
CATCGTGCTGACCCTGACCCTGTTCGAGGACCGAGAGATGATCGAGGAACGGTTGAAAACGTAC
GCCCACTT
GTTCGACGACAAGGTGATGAAGCAGCTGAAACGCCGCCGCTACACCGGATGGGGACGATTGAGC
CGCAAAC
TGATTAATGGAATTCGCGACAAGCAATCCGGAAAGACCATCCTGGACTTCCTGAAGTCCGACGG
GTTCGCCA
ACCGCAACTTCATGCAGCTCATCCACGACGACTCCTTGACCTTCAAGGAGGACATCCAGAAGGC
CCAAGTGT
CCGGACAAGGAGACTCCTTGCACGAGCACATCGCCAATTTGGCCGGATCCCCCGCAATCAAAAA
AGGCATC
TTGCAAACCGTGAAAGTGGTCGACGAACTGGTGAAGGTGATGGGACGGCACAAGCCCGAGAACA
TCGTGAT
CGAAATGGCCCGCGAGAACCAAACCACCCAAAAAGGACAGAAGAACTCCCGAGAGCGCATGAAG
CGGATC
GAAGAGGGCATCAAGGAGTTGGGCTCCCAGATCCTGAAGGAGCATCCCGTGGAGAATACCCAAT
TGCAAAA
CGAGAAGCTCTACCTCTACTACCTCCAGAACGGGCGGGACATGTACGTCGACCAAGAGCTGGAC
ATCAACC
GCCTCTCCGACTACGATGTGGATCATATTGTGCCCCAGAGCTTCCTCAAGGACGACAGCATCGA
CAACAAGG
TCCTGACGCGCAGCGACAAGAACCGGGGCAAGTCTGACAATGTGCCTTCCGAAGAAGTCGTGAA
GAAGATG
AAGAACTACTGGCGGCAGCTGCTCAACGCCAAGCTCATCACCCAACGGAAGTTCGACAACCTGA
CCAAGGC
CGAGAGAGGAGGATTGTCCGAGTTGGACAAAGCCGGCTTCATTAAACGCCAACTCGTGGAGACC
CGCCAGA
TCACGAAGCACGTGGCCCAAATCTTGGACTCCCGGATGAACACGAAATACGACGAGAATGACAA
GCTGATC
CGCGAGGTGAAGGTGATCACGCTGAAGTCCAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGT
TCTACAA
GGTGCGGGAGATCAACAACTACCATCACGCCCATGACGCCTACCTGAACGCCGTGGTCGGAACC
GCCCTGA
TCAAGAAATACCCCAAGCTGGAGTCCGAATTCGTGTACGGAGATTACAAGGTCTACGACGTGCG
GAAGATG
ATCGCGAAGTCCGAGCAGGAGATCGGCAAAGCCACCGCCAAGTACTTCTTTTACTCCAACATCA
TGAACTTC
- 104 038595
TTCAAGACCGAGATCACGCTCGCCAACGGCGAGATCCGCAAGCGCCCCCTGATCGAGACCAACG GCGAGAC GGGAGAGATTGTGTGGGACAAAGGAAGAGATTTTGCCACAGTGCGCAAGGTGCTGTCCATGCCT CAGGTGA
ACATCGTGAAGAAGACCGAGGTGCAAACAGGAGGGTTTTCCAAAGAGTCCATTTTGCCTAAGAG GAATTCC GACAAGCTCATCGCCCGCAAGAAGGACTGGGACCCCAAGAAGTACGGGGGCTTCGACTCCCCCA CGGTGGC CTACTCCGTGTTGGTGGTGGCCAAAGTGGAGAAAGGGAAGAGCAAGAAGCTGAAATCCGTGAAG GAGTTGC TCGGAATCACGATCATGGAACGATCGTCGTTCGAGAAAAACCCCATCGACTTCCTCGAAGCCAA AGGGTAC
AAAGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGAGCTGGAGAACG GCCGCAA GCGGATGCTGGCCTCCGCCGGGGAACTGCAGAAAGGGAACGAATTGGCCTTGCCCTCCAAATAC GTGAACT TCCTCTACTTGGCCTCCCATTACGAAAAGCTCAAAGGATCCCCTGAGGACAATGAGCAGAAGCA ACTCTTCG TGGAACAACACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGCGCGT GATCCTC GCCGACGCCAACCTGGACAAGGTGCTCTCCGCCTACAACAAGCACCGCGACAAGCCTATCCGCG AGCAAGC CGAGAATATCATTCACCTGTTTACCCTGACGAATTTGGGAGCCCCTGCCGCCTTTAAATACTTT GACACCACC ATCGACCGCAAAAGATACACСTССACCAAGGAAGTСTTGGACGССACССTCATССACCAGTСCA TCACGGGC CTCTACGAGACGCGCATCGACCTCTCCCAATTGGGCGGCGACCATCATCACCACCACCACTAA
SEQ ID NO:28
ДНК
Род/вид - Inovirus M13MP18
Описательное название - заменена область М13МР18 дикого типа ATGACCATGATTACGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATG CAAGCTTG GCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCC TTGCAGCA
- 105 038595
CATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGT
TGCGCAGC
CTGAATGGCGAATGGCGCTTTGCCTGGTTTCCGGCACCAGAAGCGGTGCCGGAAAGCTGGCTGG
AGTGCGA
TCTTCCTGAGGCCGATACGGTCGTCGTCCCCTCAAACTGGCAGATGCACGGTTACGATGCGCCC
ATCTACAC
CAACGTAACCTATCCCATTACGGTCAATCCGCCGTTTGTTCCCACGGAGAATCCGACGGGTTGT
TACTCGCTC
ACATTTAATGTTGATGAAAGCTGGCTACAGGAAGGCCAGACGCGAATTATTTTTGATGGCGTTC
CTATTGGT
TAA
SEQ ID NO:29
ДНК
Неизвестный/искусственный - коммерчески доступный из DNA2.О
Описательное название - последовательность паприка
AT GGT GT CAAAGGGAGAAGAAC Т GAT CAAAGAGAATAT GAGGAT GAAAC Т С ТАСАТ GGAAGGAA
CTGTGA
ACAACCACCATTTCAAGTGCACGAGCGAGGGTGAAGGGAAACCTTACGAAGGTACCCAGACCAT
GCGGATT
AAGGTCGTCGAAGGAGGACCACTCCCCTTCGCATTCGACATCCTGGCCACTTCCTTCATGTACG
GGTCGCGC
ACTTTCATCAAGTACCCAAAAGGGATCCCCGACTTCTTCAAGCAGTCCTTTCCGGAGGGATTCA
CTTGGGAA
CGCGTCACTAGATACGAGGATGGCGGAGTGGTCACCGTGATGCAAGACACCTCTTTGGAAGATG
GATGCCT
GGTGTACCACGTGCAAGTCAGAGGAGTGAACTTTCCGAGCAATGGGCCGGTGATGCAGAAGAAA
ACCAAGG
GCTGGGAACCGAACACCGAAATGCTGTATCCAGCAGACGGAGGCTTGGAGGGCCGGTCCGACAT
GGCTCTG
AAGCTTGTTGGAGGAGGACATCTGTCCTGCTCGTTCGTGACGACCTACCGGAGCAAGAAGCCGG
CGAAAAA
CCTTAAGATGCCGGGGATCCACGCGGTGGATCATCGCCTGGAAAGGCTCGAGGAGTCAGACAAC
GAGATGT
TTGTCGTGCAACGCGAGCACGCCGTGGCCCGCTACTGTGATCTCCCTTCAAAGCTGGGCCACAA
GCTGAATT
CCGGCCTCCGGTCGAGAGCCCAGGCTTCGAATTCAGCCGTGGACGGAACTGCGGGCCCTGGTTC
- 106 038595
GACCGGA AGCCGATGA
SEQ ID NO :30
ДНК
Род/вид- Lambdavirus лямбда
Описательное название - последовательность ell фага X дикого типа Е. coli ATGGTTCGTGCAAACAAACGCAACGAGGCTCTACGAATCGAGAGTGCGTTGCTTAACAAAATCG CAATGCTT GGAACTGAGAAGACAGCGGAAGCTGTGGGCGTTGATAAGTCGCAGATCAGCAGGTGGAAGAGGG ACTGGA TTCCAAAGTTCTCAATGCTGCTTGCTGTTCTTGAATGGGGGGTCGTTGACGACGACATGGCTCG ATTGGCGC GACAAGTTGCTGCGATTCTCACCAATAAAAAACGCCCGGCGGCAACCGAGCGTTCTGAACAAAT CCAGATG GAGTTCTGA
SEQ ID NO :31
Белок
Синтетический (искусственный/неизвестный)
Описательное название - белок NLS-FLAG-CAS9-His, транслируемый из SEQ ID NO: 27 MPKKKRKVGDYKDDDDKLEPGEKPYKCPECGKSFSQSGALTRHQRTHTRDKKYSIGLDIGTNSV GWAVITDEYK VPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEM AKVDDSFFHRLE ESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRG HFLIEGDLNPDN SDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLI ALSLGLTPNFKSN FDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSA SMIKRYDEHHQ DLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLN REDLLRKQRTFD NGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSE ETITPWNFEEWD KGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKA
- 107 038595
IVDLLFKTNR
KVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVL
TLTLFEDREMIEE
RLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIH
DDSLTFKEDIQ
KAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKWDELVKVMGRHKPENIVIEMARENQTTQKG
QKNSRERMKR
IEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFL
KDDSIDNKVLTR
SDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVE
TRQITKHVA
QILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTA
LIKKYPKLESE
FVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGE
IVWDKGRDFATV
RKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA
KVEKGKSKKL
KSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQ
KGNELALPSKYV
NFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKH
RDKPIREQAENII
HLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDHHHHHH
SEQ ID NO:32
ДНК
Род/вид - цитомегаловирус ЦМВЧ
Описательное название - фрагмент RL13 ЦМВЧ после редактирования
ATGGACTGGCGATTTACGGTTACGTGGACGATACTAATGTCCGCGTTGTCAGAAAGCTGCAATC
AAACCTGT
Т С Т Т G Т СAAT GTCCCTGTAGTACTACCGT ТААС ТАТТ СAAC TAG ТАС Т GAGACAG С САСАТ САА
САТАСAGТА
CAACAGT ТАТ CAGCAATAAAAGCAC Т Т CAGAAT С ТАТАААТ Т GC Т С ТАС Т GCAAC TACACCAGC
AAACACCG
Т Т Т С ТАСААААС С G Т С G GAAACAAC СACACAGATАТ С СACAAC GAC GAACACАААС G Т Т GAGAC
ТАССАСА
Т G ТАС СААСАС САС САС GAC CGTTACTTGTGATGGTTT СAAT ТАТACAG Т С СATAAAAGAT G С G
- 108 038595
ATCGCAGT
TACGAGGTAATCAACGTAACAGGATACGTTGGTAGCAACATAACTCTAAAAAAATGCAATCAGA CTGAGAA
ATGGCACAATGTAGACTGGATTCATTATGAGTACCCCACGCATAAAATGTGCGAATTAGGCAAC TATСАСGA
AAG САСAC CAC G G CAC GACATAT G T T T T GAC T G СAAC GACAC С T С С С TAAC TAT С TACAAC T TA ACCACAAA
AAACGCTGGAAAATATACCAGGCGTCACCGTGATAACGGTCAAGAAGAAAATTACTACGTAACG GTGTTAA
TTG GAGACACAAC G T TAT T СAC T С T T G G CACAT G С С С T G TAAGATATAAAGAAT С TAC GAACAC TGAAAACA
CCATTGGAAGTAGCATCATAGAAACCATTGAGAAAGCTAACATTCCCCTGGGAATTCATGCTGT ATGGGCAG
GCGTAGTGGTATCAGTGGCGCTTATAGCGTTGTACATGGGTAGCCATCGCATTCCCAAAAAGCC GCATTACA
С СAAAC T T С С СAAATAT GAT С CAGAT GAAT T T T G GAC TAAG G С T TAA
SEQ ID NO:33
ДНК
Род/вид - цитомегаловирус ЦМВЧ
Описательное название - предварительное редактирование фрагмента RL13 ЦМВЧ ATGGACTGGCGATTTACGGTTACGTGGACCGTTACTTGTGATGGTTTCAATTATACAGTCCATA AAAGATGC GATCGCAGTTACGAGGTAATCAACGTAACAGGATACGTTGGTAGCAACATAACTCTAAAAAAAT GCAATCA GACTGAGAAATGGCACAATGTAGACTGGATTCATTATGAGTACCCCACGCATAAAATGTGCGAA TTAGGCA АСТАТ САС С AAAC С АС АС САС G G САС GAC AT AT G Т Т Т Т GAC Т G С AAC GAC АС С Т С С С Т ААС ТАТ СТАСААСТ
Т AAC С AC AAAAAAC G С Т G GAAAAT АТ АС С AG G С G Т САС С G Т GAT AAC G G Т С AAGAAGAAAAT ТА CTACGTA
ACGGTGTTAATTGGAGACACAACGTTATTCACTCTTGGCACATGCCCTGTAAGATATAAAGAAT СТАСGAAC
ACTGAAAACACCATTGGAAGTAGCATCATAGAAACCATTGAGAAAGCTAACATTCCCCTGGGAA TTCATGCT GTATGGGCAGGCGTAGTGGTATCAGTGGCGCTTATAGCGTTGTACATGGGTAGCCATCGCATTC
- 109 038595
CCAAAAAG
С C G CAT ТАСАС СAAAC Т Т С С СAAATAT GAT С СAGAT GAAT Т Т Т G GAC ТAAG G С Т ТАА SEQ ID NO:34 Белок Род/вид- Phikmvlikevirus LUZ19
Описательное название - последовательность белка Gpl3 LUZ19 дикого типа MLALGAFDLSGLMVGSCLWGGELKALCVDDRHSRQGIGAELVRAAELAGAEYLTCFEFLEPFY ADLGWSTTH REANWTAGEPDVLHMRAPGHDV
SEQ ID NO:35
Белок
Род/вид- PMkmvlikevirus LUZ19
Описательное название - последовательность белка Gp38 LUZ19 дикого типа MARFKNPETIHVADGVEAVFSLDFPFLRREDVFVQVDKILVTDYTWVDDTNIQLAVVPKKDQEV RIFRDTPAQVP DTQFSQDIPFLPRYIDANNKQLLYAVQEGINTANLALDGVLDAIRIAEEARRLAQEALDAANEA LRRALGFAEIRT VTEDSDIDPSWRGYWNRCITADKPLTLTMQMEDPDAPWVEFSEVHFEQAGVRDLNIVAGPGVTI NRLQNTTMQL YGENGVCTLKRLGANHWIWGAMEDE SEQ ID NO:36 Белок Род/вид- PMkmvlikevirus LUZ19
Описательное название - последовательность белка Gp40 LUZ19 дикого типа MFKTEVKGRYTLIRRKADGTPVETLEFDNIITNAGLDWIAAMDTDLMGEPVAVSTSTADPNPSA PAIPEWQRTS ASAPGGGTTSGLDGEWLFWRRRWRFPQGTLAGQVLATVGLICNSDRRFESNTGELIPKDTPLSY TRIKDAAGQPT TLWAADEILDVQYEFRSRPVGTAEAKFVISGVERTFRLIPKPFANRANLSGERYIFYNTNPYI NGKDASGGNVRD GQWQKKYPKYVRGSYKAQITLLAQVQNGNMAGGITGTEELQIYNGRNYVLDINPPVVKNNTQEF TVTLEFTVAR А
- 110 038595
SEQ ID NO:37
Белок
Род/вид- Pseudomonas aeruginosa
Описательное название - последовательность белка PyoS5
MSNDNEVPGSMVIVAQGPDDQYAYEVPPIDSAAVAGNMFGDLIQREIYLQKNIYYPVRSIFEQG TKEKKEINKKV
SDQVDGLLKQITQGKREATRQERVDVMSAVLHKMESDLEGYKKTFTKGPFIDYEKQSSLSIYEA WVKIWEKNSW
EERKKYPFQQLVRDELERAVAYYKQDSLSEAVKVLRQELNKQKALKEKEDLSQLERDYRTRKAN LEMKVQSEL
DQAGSALPPLVSPTPEQWLERATRLVTQAIADKKQLQTTNNTLIKNSPTPLEKQKAIYNGELLV DEIASLQARLVK
LNAETTRRRTEAERKAAEEQALQDAIKFTADFYKEVTEKFGARTSEMARQLAEGARGKNIRSSA EAIKSFEKHKD
ALNKKLSLKDRQAIAKAFDSLDKQMMAKSLEKFSKGFGWGKAIDAASLYQEFKISTETGDWKP FFVKIETLAA
GAAASWLVGIAFATATATPIGILGFALVMAVTGAMIDEDLLEKANNLVISI
SEQ ID NO:38
Белок
Род/вид- PMkmvlikevirus LKD16
Описательное название - последовательность белка Gpl8 LKD16 MRVPTEHERTLRCLLQDIHGPLNLLFPGIRVKVEEACLGYLGYRERGYWELRLQVDYDHPKLGH LRYSQAVPEY
VLINDRDSIIKYLMEAVPRQVLEGMLNKAQEFVTKNWYSL
SEQ ID NO:39
Белок
Род/вид- PMkmvlikevirus LKA1
Описательное название - последовательность белка Gp49 LKA1
MAQT PS TWADYVGDGVEDT FQVT FPYQKQQEVFVTVGGDPAAFT FISAGWIQLAAVPVNGAAIR
VRRSTEAFEP
RHEFANGVPLLPRFIDENNTQFLYTVQEAVNETHGIASEALSVAEEARGIAQAASDKVDAATID SAHQLRLDLAD
PAKGPGLLGYDRDVSYPVGSVGQSLQFLEMGRVTPAQFGAVGDGASHPLSERYATLAEAQTVYP HAVALSDEID
WAALQAAVDSGAPVHIPSGDYQINRGISSTGSLQIAGDGATSIIRPTAAFTGTSVLSCVGSLVA LPNISSVSAGSLTI
- 111 038595
DFASTPNLVAGDVFIIYNPTDSSFSGFRTSYRAGEFCEVRAVSGNTVTIRSALYAAYDGATVAI
YKWSGWDIASI
QIVGGTVPMNGLLVEAVVSPRVDDVTVTLANNAGVYFARCYDAKITNSNISNIGDGGDDYGIIF
GNCHDGGADN
CKVYARRHAIATGGDAEVGCVPVRNVRMRNCTLRNDITSGTHCADFHGNAEDCSYENCTIYGGA
TWQGKDISY
RHCTITNASGGWIVISAEILGGTFLLDQCTLYTTGDPQPGNRGVIDVGGNSAVLTTNTTQPCNF
LIQGGSLRAPSLS
TSSYLLRARLEGSTVPVNIQYSGQAIDVGSLGKVLQLDITSGSTSPEYLIVENLAGLPSGITLA
SAAGGFASAPMRM
PVLGGRVQVTTATNASSVTAPVTFRYIYPKAPTVQVTKTDRSYAGNRVGVAIANPTSASGATLG
LFTDDGTNFSS
AVTNQLNWQAGIYEV
SEQ ID NO:40
Белок
Род/вид- PMkmvlikevirus NTUH-K2044-K1-1
Описательное название - последовательность белка Gp34 NTUHК2044-К1-1
MALIRLVAPERVFSDLASMVAYPNFQVQDKITLLGSAGGDFTFTTTASWDNGTVFAVPGGYLL
RKFVGPAYSS
WFSNWTGIVTFMSAPNRHLWDTVLQATSVLNIKSNSTLEFTDTGRILPDAAVARQVLNITGSA
PSWVPLAADA
AAGSKVITVAAGALSAVKGTYLYLRSNKLCDGGPNTYGVKISQIRKWGVSTSGGVTSIRLDKA
LHYNYYLSDA
AEVGIPTMVENVTLVSPYINEFGYDDLNRFFTSGISANFAADLHIQDGVIIGNKRPGASDIEGR
SAIKFNNCVDSTV
KGTCFYNIGWYGVEVLGCSEDTEVHDIHAMDVRHAISLNWQSTADGDKWGEPIEFLGVNCEAYS
TTQAGFDTH
DIGKRVKFVRCVSYDSADDGFQARTNGVEYLNCRAYRAAMDGFASNTGVAFPIYRECLAYDNVR
SGFNCSYGG
GYVYDCEAHGSQNGVRINGGRVKGGRYTRNSSSHIFVTKDVAETAQTSLEIDGVSMRYDGTGRA
VYFHGTVGID
PTLVSMSNNDMTGHGLFWALLSGYTVQPTPPRMSRNLLDDTGIRGVATLVAGEATVNARVRGNF
GSVANSFKW
VSEVKLTRLTFPSSAGALTVTSVAQNQDVPTPNPDLNSFVIRSSNAADVSQVAWEVYL
SEQ ID NO :41
- 112 038595
Белок
Род/вид - Т7-подобный Рр15
Описательное название - последовательность белка Gp44 Рр15
MARTIVQNALTGGQQDFEVPFDYILQRFVKLTLIGDGNRQELVLGTDFRFIGPRTVRTNVFWGP
AQGYTSIEIRRV
TSASDRRVEFSDGSILTAGDLNIAQLQAIHIAEEARDSATENLSPDADGNYDARGARIYNLGDA
VQPKDAVNRYT
LDLAIAAALAMNTGNPNNAQNISYTPNGPGQSIRSVEGRLRDAVFVSDYMTTPRDGVTSNQQDL
EKALAAANAK
GADLFWPDDIPFFSTSPLALIHAVYHVGRGVINANGTLFYVNPKNGQHNRLHVSPGGTGDGLAA
GRPLGTIWSAL
AALNMRAPLTTRWSLEMTAGAYNEAVTLPNYLTSCNDYLAFNWPNTGQERMEPTAYPSALDGTG
QTGLTGFHT
GIGNRITINNVCMSNWYDTALTPTQQVRRAFVVGAYSTAYVVNCAFIYNGIASVSVLPGGTAIV
TGGIVDGGRFG
LDNTGGRLSLTATKSNYTQVRNCLEYGLYSKHDASTVMDNTEFRNCGNHPAAVAYGAAIFAYKF
NCSVDTRGV
KFYGNNIAQHCRGGITSDNPGDPDIYGTGADANKRLFLCTGGGSDDIQFYEARRVMDITKRTGG
GSTTASVSSLL
LAAVASVRKGYFAHNDQVIRMTLMFRATGSAGIFTPTLRTPLGTIPLGSFRVASGQYGEIKLTI
RPTLTSDGLIVGF
SCINAVQNLGSSVGQIIVSGTVDLRTVDQLVEMWGYSEAGGTASYIQGLIELVG
SEQ ID NO:42
Белок
Род/вид - Aggregatibacter actinomycetemcomitans
Описательное название - последовательность белка DspB
MNCCVKGNSTYPQKTSTKQTGI.MI,DTARHFYSPF.VTKSFTDTTSLSGGNFI. HI,HFSDHF .NYATF. SHI,1,NQRAF.NAV
QGKDGIYINPYTGKPFLSYRQLDDIKAYAKAKGIELIPELDSPNHMTAIFKLVQKDRGVKYLQG
LKSRQVDDEIDI
TNADSITFMQSLMSEVIDIFGDTSQHFHIGGDEFGYSVESNHEFITYANKLSYFLEKKGLKTRM
WNDGLIKNTFEQI
NPNIEITYWSYDGDTQDKNEAAERRDMRVSLPELLAKGFTVLNYNSYYLYIVPKASPTFSQDAA
FAAKDVIKNW
DLGVWDGRNTKNRVQNTHEIAGAALSIWGEDAKALKDETIQKNTKSLLEAVIHKTNGDE SEQ ID NO:43
- 113 038595
Белок
Род/вид- Staphylococcus aureus
Описательное название - последовательность белка SaPSMaS MEFVAKLFKFFKDLLGKFLGNN
SEQ ID NO:44
Белок
Род/вид- Staphylococcus aureus
Описательное название - последовательность белка SaPAMb2
MTGLAEAIANTVQAAQQHDSVKLGTSIVDIVANGVGLLGKLFGF SEQ ID NO:45 Белок
Род/вид- Staphylococcus epidermidis
Описательное название - последовательность белка SEPSMa MADVIAKIVEIVKGLIDQFTQK SEQ ID NO:46 Белок Род/вид- Levivirus MS2
Описательное название - последовательность белка L MS2 METRFPQQSQQTPASTNRRRPFKHEDYPCRRQQRSSTLYVLIFLAIFLSKFTNQLLLSLLEAVI RTVTTLQQLLT
SEQ ID NO:47
Белок
Род/вид- Levivirus PRR1
Описательное название - последовательность белка L PRR1
MCKVSTKVDSKLTESVGQLTIRSYLWLRNILALAGLLFVILLATNHLSIAIYSP SEQ ID NO:48 Белок
Род/вид- Phikmvlikevirus LUZ19
Описательное название - последовательность белка Gpl8 LUZ19 MRMPTEEERMIRCLLADIHEPLDLLFPGLRTKAHMDPQAEELSIRIDYDHAKLGRMGFCHAVSL YQLSIYGREGM
VRYLMQEIPRRVLEGLLVKAQQYSQSNWYSK
SEQ ID NO:49
Белок
Род/вид- Phikmvlikevirus LUZ19
Описательное название - последовательность белка Gp49 LUZ19
- 114 038595
MSKAKLRVIADTPELESVLKALLTATYAIEDLLNEAVASKVLNSRLGWSAVGEYVELFNRTQSR VAGLIPE
SEQ ID NO :50
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название - последовательность гена gp!8 LUZ19
ATGAGAATGCCAACCGAAGAAGAACGCATGATCCGCTGTTTACTGGCGGATATCCACGAGCCAC TGGACCT
GCTGTTCCCCGGCCTCCGTACCAAGGCCCATATGGACCCGCAAGCAGAGGAACTGTCGATTCGA ATTGACTA
CGACCATGCGAAGCTGGGCCGTATGGGATTCTGCCACGCGGTATCCCTATATCAACTGTCCATA TATGGCCG
CGAGGGGATGGTCCGCTACCTGATGCAGGAGATTCCCCGCCGCGTGCTGGAAGGTCTGCTGGTC
AAGGCGC
AGCAGTACAGCCAAAGCAACTGGTACAGCAAATGA
SEQ ID NO:51
ДНК
Род/вид- Phikmvlikevirus LUZ19
Описательное название - последовательность белка Gp49 LUZ19
ATGAGCAAAGCCAAACTACGAGTCATCGCCGACACCCCGGAGCTGGAGTCAGTGCTAAAAGCAT ТGCTGAC
CGCCACCTACGCTATCGAGGACCTGCTCAACGAGGCCGTGGCTAGCAAGGTGCTAAACTCCCGC CTGGGCTG
GTCCGCAGTCGGCGAGTATGTCGAACTGTTCAACCGCACGCAATCCCGCGTGGCCGGGTTGATT CCCGAGTA
G
- 115 038595
Перечень последовательностей < 110> SYNTHETIC GENOMICS, INC. DIPETRILLO, Christen CADY, Kyle C. BARBU, Elana M.
< 120> КОМПОЗИЦИИ И СПОСОБЫ ДЛЯ КОНСТРУИРОВАНИЯ ВИРУСНОГО ГЕНОМА IN VITRO < 130> SGI1840-3WO < 150> US 62/092,707 < 151> 2014-12-16 < 150> US 62/102,362 < 151> 2015-01-15 < 150> US 62/242,811 < 151> 2015-10-16 < 160> 51 < 170> Patentin версии 3.5 < 210> 1 < 211> 288 < 212> ДНК < 213> Phikmvlikevirus LUZ19
<220>
< 221> misc_feature < 223> gpl3 LUZ19 дикого типа < 400> 1 gtgctggccc tcggtgcctt cgacctgtcc ggcctgatgg taggttcctg cctcgtagta 60
ggtggtgagc tgaaggccct gtgcgttgat gaccggcaca gcaggcaggg tatcggcgct 120
gagctggtac gggccgctga gctggctggt gccgagtatc tgacctgctt cgagttcctg 180
gagccgttct acgccgactt gggctggagc accacccacc gcgaggcgaa ctggacagca 240
ggagagccgg acgtgctgca catgagggca cccggtcatg acgtatga 288
< 210> 2 < 211> 756 < 212> ДНК < 213> Phikmvlikevirus LUZ19 <220>
- 116 038595 < 221> misc_feature < 223> gp38 LUZ19 дикого типа <400> 2
gtggctcggt tcaagaatcc cgagaccatc cacgttgcag atggggtcga ggctgtcttc 60
agtctcgact tcccgttcct gcggcgtgag gacgtattcg tccaggtcga taagatactc 120
gtcaccgact atacgtgggt agacgacacc aacatccaat tggccgtggt gccgaagaag 180
gaccaagagg tccgcatctt ccgcgacacg cccgcccagg tcccggacac acagttcagc 240
caggacatcc cgttcctgcc tcgatacatc gacgcgaaca acaagcagct cctgtacgct 300
gtgcaggaag gcatcaacac cgcgaacctc gctctcgatg gcgtactcga cgcgatccgt 360
atcgccgagg aggctcgtcg cctggcgcag gaagcactcg acgccgccaa tgaggcgctt 420
cgccgtgccc tgggcttcgc tgagattcgc accgtgaccg aggactcgga catcgatccg 480
agctggcgcg gttactggaa ccgttgcatc accgccgata aacctctgac cctgaccatg 540
cagatggaag acccggatgc accgtgggtc gagttcagcg aggttcactt cgagcaggcc 600
ggtgtgcgtg acctaaacat cgtagccggt cctggcgtta ccatcaaccg tttgcagaac 660
accaccatgc agctctacgg cgagaatggc gtgtgtactc tcaagcggct gggcgctaac 720
cactggatcg tgttcggggc catggaggac gaataa 756
< 210> 3 < 211> 906 < 212> ДНК < 213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature < 223> gp40 LUZ19 дикого типа <400> 3
atgtttaaga ccgaagtaaa gggacgttac accctgattc gccgcaaggc ggacggcact 60
ccggtggaga ctctggagtt cgacaacatc attacgaatg cgggcctgga ttggatcgcc 120
gctatggata ccgacctcat gggcgaaccc gtagcggtca gcacttctac agccgatccc 180
aacccgagcg cacccgccat cccggaggtt gtgcaacgca cgtccgcatc tgcccctggt 240
ggaggtacta cgtcgggcct ggatggcgag tggctgttct ggcggaggcg ttggagattc 300
- 117 038595
ccgcagggca ccctagctgg tcaagtcctg gccaccgtgg gcctcatctg caactcggat 360
cgtcgcttcg agagtaacac gggtgagctg atcccgaagg ataccccgct gtcgtacact 420
cgcatcaagg acgccgccgg gcagcctact actctggtgg tggccgctga cgagattctg 480
gatgtccagt acgagttccg cagccggccc gtaggaacgg ctgaggccaa gttcgtgatc 540
tccggcgtgg aacgcacctt ccggctgatc ccaaagcctt ttgcgaaccg tgctaatctc 600
tccggggaac gctacatctt ctacaacacc aacccctaca tcaacggcaa ggacgcctcc 660
ggcggcaatg tccgagacgg tcagtggcag aagaaatatc ccaagtacgt gcgcggctcc 720
tacaaggcgc agatcacgct gctggcccag gtccagaacg gcaatatggc tggcggcatc 780
accggcaccg aggaactcca gatttacaat ggacgtaact atgtgctcga tatcaacccg 840
cctgttgtga agaacaatac ccaggagttc accgtgaccc tggagtttac ggtggcgagg 900
gcataa 906
< 210> 4 < 211> 2481 < 212> ДНК < 213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature < 223> gp34 LUZ19 дикого типа <400> 4
atgagctaca agcaatccgc gtatcccaat ctgctgatgg gtgtgagcca gcaggtgccc 60
ttcgagcgcc tgccgggcca gctcagcgag cagatcaaca tggtatccga tcccgtgtca 120
ggacttcggc ggcgcagcgg tatcgagctg atggcccacc tgctgcatac cgaccagccc 180
tggccgaggc cgttcctcta ccacacgaac ctcggtggcc gcagcattgc gatgctggtg 240
gcgcagcacc gtggcgagct gtacctgttc gacgagcggg acggtcgcct gctgatgggt 300
cagcccctgg tgcatgacta cctcaaggcc aacgattaca ggcagctacg ggccgccacg 360
gtggccgatg acctgttcat cgccaacctg agtgtaaagc ccgaggccga ccgcaccgac 420
atcaagggcg tagaccccaa caaggccggc tggctgtaca tcaaggcagg ccagtattcg 480
aaggcattct ccatgaccat caaggtcaag gacaacgcca ccggcaccac ctacagccac 540
- 118 038595
acggccacct acgtgacgcc ggacaacgcc agcacgaacc ccaacctcgc tgaggcgcca 600
ttccaaacga gcgtaggcta catcgcgtgg cagctctacg gcaagttctt cggtgcgccg 660
gagtacactc tgcccaactc gacgaagaag tacccgaagg tagacccgga cgccaacgcg 720
gcaaccatag ccggttacct caaccaacgg ggcgtgcagg acgggtacat cgcgttccgt 780
ggcgacgccg atatccacgt tgaagtgtcc acggacatgg gcaacaacta cggcatagcc 840
tccggcggta tgagcctcaa cgccacggca gacctgccgg ccttactgcc gggcgcgggt 900
gctcctggcg tgggtgtgca gttcatggac ggcgctgtca tggccaccgg ctccaccaag 960
gccccggtat acttcgagtg ggattccgct aaccgccgct gggcagagcg ggccgcctac 1020
ggcaccgatt gggtcctgaa gaagatgcca ctggccctgc gctgggatga ggctaccgac 1080
acctacagct tgaacgagct ggagtatgat cgacgtggct ccggcgacga ggatacgaac 1140
cccacgttca acttcgtcac ccgaggcatc accggcatga cgaccttcca gggtcgcctc 1200
gtcctcctgt cgcaggagta cgtctgcatg tcggccagta acaatccaca ccgctggttc 1260
aagaagtcgg cagccgcgct gaacgacgat gatcctatcg agatcgcagc ccaggggagc 1320
ctgactgaac cgtacgagca cgcggtcacc ttcaacaagg acttgatcgt cttcgccaag 1380
aagtatcagg ccgtggtccc cggtggcggc attgtaactc cccggacggc ggttatcagc 1440
atcaccacgc agtacgacct cgataccagg gcggcacctg ccgtgactgg ccgcagtgtg 1500
tacttcgctg cggagcgtgc cctgggtttc atgggcctgc atgagatggc cccgtctccg 1560
tccacggaca gccactacgt cgccgaagac gttaccagcc acatcccgag ctacatgccg 1620
gggcctgctg agtacatcca ggcggcggcc tccagcggct acctggtgtt cggcaccagc 1680
acggcggacg agatgatctg ccaccagtac ctctggcagg gcaacgagaa agtgcagaac 1740
gcgtttcatc gctggacgtt gcggcatcag atcatcggcg cctacttcac tggtgacaac 1800
ctgatggttc tgattcagaa gggccaggag atcgccctgg gacggatgca cctgaacagc 1860
ctgccagccc gtgagggtct gcaataccct aaatacgact actggcggcg tatcgaggcg 1920
accgtcgatg gtgagctgga actgaccaag cagcattggg acctgatcaa ggatgcctct 1980
gccgtgtacc agctacagcc tgtggccggc gcctacatgg agcgtaccca tctcggcgtg 2040
aagcgcgaga cgaatacgaa ggtgttcctc gacgtgcccg aggccgtggt cggggcggtg 2100
- 119 038595
tatgtggtcg gctgcgagtt ctggtcgaag gtggagttca ctccgccggt tctccgggac 2160
cacaatggcc tgcccatgac ctcgacccgt gcagtgcttc atcggtacaa cgtaaacttc 2220
ggctggaccg gcgagttcct gtggcgcatc agcgacacgg ctcgacccaa ccagccgtgg 2280
tacgacacga cgcccctccg gttgttcagc cggcaactca atgccgggga gcctctggtg 2340
gatagcgctg tggtgccgct gccggcacgg gtcgatatgg ccacgtccaa gttcgagctg 2400
agctgtcaca gtccgtacga catgaacgtt cgggctgtcg agtacaactt caagtccaac 2460
caaacctaca ggagggtgtg a 2481
<210> 5 <211> 826 <212> белок <213> Phikmvlikevirus LUZ19 <220>
<221> misc_feature <223> белок Gp34 LUZ19 дикого <400> 5
Met Ser Tyr Lys Gin Ser Ala Tyr 1 5 типа
Pro Asn Leu Leu Met Gly Vai Ser
15
Gin Gin Vai Pro Phe Glu Arg Leu 20
Pro Gly Gin Leu Ser Glu Gin lie 25 30
Asn Met Vai Ser Asp Pro Vai Ser
40
Gly Leu Arg Arg Arg Ser Gly lie 45
Glu Leu Met Ala His Leu Leu His
55
Thr Asp Gin Pro Trp Pro Arg Pro 60
Phe Leu Tyr His Thr Asn Leu Gly 65 70
Gly Arg Ser lie Ala Met Leu Vai
80
Ala Gin His Arg Gly Glu Leu Tyr 85
Leu Phe Asp Glu Arg Asp Gly Arg
95
Leu Leu Met Gly Gin Pro Leu Vai
His Asp Tyr Leu Lys Ala Asn Asp
- 120 038595
100 105110
Tyr Arg Gln Leu Arg Ala Ala Thr Vai Ala Asp Asp Leu Phe lie Ala
115 120125
Asn Leu Ser Vai Lys Pro Glu Ala Asp Arg Thr Asp lie Lys Gly Vai
130 135140
Asp Pro Asn Lys Ala Gly Trp Leu Tyr lie Lys Ala Gly Gln Tyr Ser
145 150 155160
Lys Ala Phe Ser Met Thr lie Lys Vai Lys Asp Asn Ala Thr Gly Thr
165 170175
Thr Tyr Ser His Thr Ala Thr Tyr Vai Thr Pro Asp Asn Ala Ser Thr
180 185190
Asn Pro Asn Leu Ala Glu Ala Pro Phe Gln Thr Ser Vai Gly Tyr lie
195 200205
Ala Trp Gln Leu Tyr Gly Lys Phe Phe Gly Ala Pro Glu Tyr Thr Leu
210 215220
Pro Asn Ser Thr Lys Lys Tyr Pro Lys Vai Asp Pro Asp Ala Asn Ala
225 230 235240
Ala Thr lie Ala Gly Tyr Leu Asn Gln Arg Gly Vai Gln Asp Gly Tyr
245 250255 lie Ala Phe Arg Gly Asp Ala Asp lie His Vai Glu Vai Ser Thr Asp
260 265270
Met Gly Asn Asn Tyr Gly lie Ala Ser Gly Gly Met Ser Leu Asn Ala
275 280285
Thr Ala Asp Leu Pro Ala Leu Leu Pro Gly Ala Gly Ala Pro Gly Vai
290 295300
Gly Vai Gln Phe Met Asp Gly Ala Vai Met Ala Thr Gly Ser Thr Lys
- 121 038595
Ala
335
Arg
Arg
Trp
305
310
315
320
Ala
Pro
Val
Tyr
Phe
325
Glu
Trp
Asp
Ser
Ala
330
Asn
Glu
Arg
Ala
Ala
Tyr 340
Gly
Thr
Asp
Trp
Val
345
Leu
Lys
Lys
Met
Pro
350
Leu
Ala
Leu
Arg
Trp 355
Asp
Glu
Ala
Thr
Asp 360
Thr
Tyr
Ser
Leu
Asn
365
Glu
Leu
Glu
Tyr
Asp 370
Arg
Arg
Gly
Ser
Gly 375
Asp
Glu
Asp
Thr
Asn
380
Pro
Thr
Phe
Asn
Phe
385
Val
Thr
Arg
Gly lie
390
Thr
Gly
Met
Thr
Thr
395
Phe
Gln
Gly
Arg
Leu
400
Val
Leu
Leu
Ser
Gln
405
Glu
Tyr
Val
Cys
Met
410
Ser
Ala
Ser
Asn
Asn
415
Pro
His
Arg
Trp
Phe
420
Lys
Lys
Ser
Ala
Ala
425
Ala
Leu
Asn
Asp
Asp
430
Asp
Pro lie
Glu lie
435
Ala
Ala
Gln
Gly
Ser
440
Leu
Thr
Glu
Pro
Tyr 445
Glu
His
Ala
Val
Thr
450
Phe
Asn
Lys
Asp
Leu
455 lie
Val
Phe
Ala
Lys 460
Lys
Tyr
Gln
Ala
Val
465
Val
Pro
Gly
Gly
Gly 470 lie
Val
Thr
Pro
Arg 475
Thr
Ala
Val lie
Ser
480 lie
Thr
Thr
Gln
Tyr 485
Asp
Leu
Asp
Thr
Arg 490
Ala
Ala
Pro
Ala
Val
495
Thr
Gly
Arg
Ser
Val
500
Tyr
Phe
Ala
Ala
Glu
505
Arg
Ala
Leu
Gly
Phe
510
Met
Gly
Leu
His
Glu
Met
Ala
Pro
Ser
Pro
Ser
Thr
Asp
Ser
His
Tyr
Val
Ala
- 122 038595
515 520 525
Glu Asp 530 Vai Thr Ser His lie Pro Ser Tyr 535 Met Pro Gly Pro Ala Glu 540
Tyr lie 545 Gln Ala Ala Ala Ser Ser Gly Tyr 550 Leu Vai Phe Gly Thr Ser 555 560
Thr Ala Asp Glu Met 565 lie Cys His Gln Tyr 570 Leu Trp Gln Gly Asn Glu 575
Lys Vai Gln Asn Ala 580 Phe His Arg Trp Thr 585 Leu Arg His Gln lie lie 590
Gly Ala Tyr Phe Thr 595 Gly Asp Asn Leu Met 600 Vai Leu lie Gln Lys Gly 605
Gln Glu 610 lie Ala Leu Gly Arg Met His Leu 615 Asn Ser Leu Pro Ala Arg 620
Glu Gly 625 Leu Gln Tyr Pro Lys Tyr Asp Tyr 630 Trp Arg Arg lie Glu Ala 635 640
Thr Vai Asp Gly Glu 645 Leu Glu Leu Thr Lys 650 Gln His Trp Asp Leu lie 655
Lys Asp Ala Ser Ala 660 Vai Tyr Gln Leu Gln 665 Pro Vai Ala Gly Ala Tyr 670
Met Glu Arg Thr His 675 Leu Gly Vai Lys Arg 680 Glu Thr Asn Thr Lys Vai 685
Phe Leu 690 Asp Vai Pro Glu Ala Vai Vai Gly 695 Ala Vai Tyr Vai Vai Gly 700
Cys Glu 705 Phe Trp Ser Lys Vai Glu Phe Thr 710 Pro Pro Vai Leu Arg Asp 715 720
His Asn Gly Leu Pro Met Thr Ser Thr Arg Ala Vai Leu His Arg Tyr
- 123 038595
725 730735
Asn Val Asn Phe Gly Trp Thr Gly Glu Phe Leu Trp Arg lie Ser Asp
740 745750
Thr Ala Arg Pro Asn Gln Pro Trp Tyr Asp Thr Thr Pro Leu Arg Leu
755 760765
Phe Ser Arg Gln Leu Asn Ala Gly Glu Pro Leu Val Asp Ser Ala Val
770 775780
Val Pro Leu Pro Ala Arg Val Asp Met Ala Thr Ser Lys Phe Glu Leu
785 790 795800
Ser Cys His Ser Pro Tyr Asp Met Asn Val Arg Ala Val Glu Tyr Asn
805 810815
Phe Lys Ser Asn Gln Thr Tyr Arg Arg Val
820825 <210> 6 <211> 1497 < 212> ДНК < 213> Pseudomonas aeruginosa < 400> 6 atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat60 caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc120 gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt180 tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat240 ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat300 gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt360 accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg420 gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt480 gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg540 gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc600
- 124 038595
tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660
gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720
cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780
acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840
aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900
gccgaaacga cacgacgcag gacagaagca gaacgcaagg cggccgagga acaagcgttg 960
caagatgcta ttaaatttac tgccgacttt tataaggaag taactgagaa atttggcgca 1020
cgaacatcgg agatggcgcg ccaactggcc gaaggcgcca gggggaaaaa tatcaggagt 1080
tcggcggaag caatcaagtc gtttgaaaag cacaaggatg cgttaaataa aaaacttagc 1140
cttaaagata ggcaagccat tgccaaagcc tttgattctc tagacaagca gatgatggcg 1200
aagagccttg agaaatttag caaaggcttt ggagttgtag gcaaagctat tgacgccgcc 1260
agcctgtacc aagagttcaa gatatctacg gaaaccgggg actggaaacc attctttgta 1320
aaaattgaaa cactagctgc tggtgcggcc gccagttggc ttgtgggtat tgcatttgcc 1380
acggcaacag ccactcctat aggcattctg gggttcgcac tggtaatggc agttaccggg 1440
gcgatgattg acgaagacct tctagaaaaa gcaaacaatc ttgtaatatc catttaa 1497
< 210> 7 < 211> 345 < 212> ДНК < 213> Phikmvlikevirus LKD16 <400> 7
gagtaccaac tgaacacgag cgcaccctgc gctgcctgct ccaagacatc cacgggccgc 60
tgaatctgct gttcccaggt atccgggtga aggtggagga ggcgtgcctc ggatacttgg 120
gctacaggga gcggggctat tgggagctgc gcctccaggt ggactacgac cacccgaagc 180
ttgggcacct ccgctacagt caggccgtgc cggagtacgt gctgatcaac gaccgcgaca 240
gcatcatcaa gtacctgatg gaagcagtcc ctcggcaggt actagagggc atgctcaata 300
aggcccagga attcgtaacc aagaactggt attccctatg acgac 345
<210> 8
- 125 038595 <211> 204 < 212> ДНК <213> Phikmvlikevirus phi-KF77 <220>
<221> misc_feature <223> добавлена последовательность gp7 Phi KF77 <400> 8
tacaaggtgg tgacgcctag ctcggcagag ggcgccgttg tgctggcgac caagcagacg 60
cctgccctcg ctcaggcagt catcgtactg cacagcatga accccgcgca gtacgcggtg 120
ggcacggcca tactaaacac agactggcgg tgccgccgcc tgggtgccgg cgagtacatc 180
aagctcgttc aaggggaggc cgac 204
< 210> 9 < 211> 60 < 212> ДНК < 213> Lambdavirus лямбда <220>
< 221> misc_feature < 223> фаг E. coli < 400> 9 atggttcgtg caaacaaacg caacgaggct cgttctgaac aaatccagat ggagttctga 60 < 210> 10 < 211> 17757 < 212> ДНК < 213> Цитомегаловирус ЦМВ человека <220>
< 221> misc_feature < 223> предварительное редактирование фрагмента ЦМВ человека <400> 10
acgacggcca gtgaattgta atacgactca ctatagggcg aattcgagct cggtacccga 60
ttaccctgtt atccctacca ttccgggccg tgtgctgggt ccccgagggg cgggggggtg 120
tttttagcgg gggggtgaaa tttggagtct tggagccgcg tgtgctgtgg aggacggtga 180
cggtggtaag agtgtgctgc ggtgcggttg ggacggcggc ggcgaataaa agcggcgtgc 240
ggcgcgcacg gcgaaaagca gacgcgcgtc tgtgttgtgt gtctttgacc gcggcggaac 300
- 126 038595
acacgcggaa aagcgagtcc caggggacac acgacgagcg agtcccaggg ggggacgacg 360
acggccaggg acgcggaaac gacgcggaaa agaggaagtc cccaggggga cgggcggaaa 420
agaggaagcg cctaggggac cgcgggggca ggaacagacg aagtacgccg caacccgcgt 480
cgaggacaca cgcagaagcg gccgcccagg ggaggggggg ggggggactc gcgggccccg 540
gggcacactt gttgttccct ccggccgccg acacgcaccc cgaagccgcg cacaccgccg 600
acacacccct gacacacccg cgacacaccc gccacacgcc cgacacacgc ccgcgacaca 660
cccgaccgac acaccctgac acaccccgcc aacacaccca gccgcacccg ccccgccaac 720
acacccccga cacacccgac acacgcccgc gacacacccg gcacacaccc acccacccag 780
ccgcgccccc gacacacccc gaacggcgcc ggtgcgggac agggctcacg gaggtttgcg 840
ggccgtgagc acgcctccct ttgtacacac taccggtgcg tggcgtccca cgctatttgt 900
tcgcgagacc ggactaaggg aggtttgcgg tgcgtcagcg cggggcggcg tttgcggcgt 960
gtttcgacca gcgctttgtg cgcgctgcct gtgcgtgtcg tcccatggtc tttgtcagcg 1020
gcacggcgct ggggacgggg tttcaccgcg ctgagggatc tttctgcggg tgtgagggac 1080
ggagcttttt tcgcacgctg ggcaccgggc tgggggacgg ggggtgtgcg ggacggcggt 1140
ggggccgggg cgttgcgggt acggggatta cgctgggaac ggggactcgc ggacccgggc 1200
tgagggacgg gggtggcggg ggtgtttgcg gcgaggacgg gggccttttg cggcggggac 1260
ggggactcac cctcgcctat ttaacctcca cccacttcaa cacacacatg ccgcacaatc 1320
atgccagcca cagacacaaa cagcacccac accacgccgc ttcacccaga gtaccaacac 1380
acgttaccct tacaccacag caacacacaa ccgcctatcc aaacctcgga caaacacgcc 1440
aacgaagaac accgcacgca gatggagctc gacgccgcgg attacgctgc ttgcgcgcag 1500
gcccgccaac acctctacgc tcaaacacaa ccccaactac acgcataccc caacgccaac 1560
cctcaggaaa gcgctcattt ttccacagaa aatcaacatc aactcacgca tctacttcac 1620
aacattggcg aaggcgcagc gctcggctac cccgtccccc gcgcggaaat ccgccgcggc 1680
ggtggcgact gggccgacag cgcgagcgac ttcgacgccg actgctggtg catgtgggga 1740
cgcttcggaa ccatgggccg ccaacctatc gtgaccttac tgttggcgcg ccaacgcgac 1800
ggcctcgctg actggaacgt cgtacgctgc cgcggcacag gctttcgcgc acacgattcc 1860
- 127 038595
gaggacggcg tctctgtctg gcgtcagcac ttggtttttt tactcggagg ccacggccgc 1920
cgtgtacagt tagaacgtcc atccgcggga gaagcccaag ctcgaggcct attgccacgc 1980
atccggatca cccccatctc cacatctcca cgcccaaaac caccccagcc caccatatcc 2040
accgcatcgc acccacatgc tacgactcgc ccacatcaca cgctctttcc tatcccttct 2100
acaccctcag ccacggttca caatccccga aactacgccg tccaacttca cgccgaaacg 2160
acccgcacat ggcgctgggc acgacgcggt gaacgtggcg cgtggatgcc ggccgagaca 2220
tttacatgtc ccaaggataa acgtccctgg tagacggggt agggggatct accagcccag 2280
ggatcgcgta tttcgccgcc acgctgcttc accgatatcc aataaaccca tcccctcgcc 2340
acgacgtctc cgcgtatctt tgtagcctca ggaatccgtc cccacgtcca tccatcccga 2400
gcactccaca cgctataaca gaccacggac acggcaaatg catgcaaact tctcatttat 2460
tgtgtctact actctgtgtt gctacaggga gtgaaggggg tgaaggcaaa gaaaaaaaaa 2520
aggaacaaaa taatagatta gcagaaggaa taatccgtgc gaccgagctt gtgcttcttt 2580
tcttataagg aggcaaatat actagggaaa acttaagaat aggaagaaac cgaggtttgg 2640
gagaaaagct gagataaaat agcgcatttt ccatacagag gttgttgttt ttgtggatcc 2700
taagaggttt caagtgcgaa tctcaaagtt ctcacgagaa tattgtcttc aagaatcgac 2760
aactgtggtc caagattttt ttttggtctt tttaggttct gcgagggaca tcacgatgga 2820
tcgttgcgat gaagtcacgc gtacgcctct ggtgtggcgc ggtgtcgtga caggagagtg 2880
tgttttcagt gcagagctgt cttgattcct atatccgagt atctgttttc tcgtaaggac 2940
ggtaatcttc tttggtgtaa gtacatctaa aagctgcaaa ctatatttta agggctgtct 3000
ctaggtgtac tttgatgctg gagtttttcg ctgtgttgat gtgaataaat ctactactac 3060
tattatatgc agaaagagtg attatgccga gacaagattg cattggctga actgtttcaa 3120
aaacgcctac actctactta tccgtaaacc taaggtaata ctatgtgtaa gttgtttttt 3180
tttctttttg tagtaaaatg gtgatacgtg caattaaaac tgtattccat gtttccatcc 3240
tttcatttca actttaaagg cggctttgag agcgaagaag tgcgaggata aaaatggatg 3300
actccttcgt gtccagggag tcgactactg caacgctgat tgattaaaag atggtctccg 3360
atgatgatgt tgttattgat cgaatcatgg tgcagaacgg cgacggagag gagcgtgtcc 3420
- 128 038595
gccgccggga aggtggtctc tttctctttt cttttttcaa gaaatcttcc atgtgtttat 3480
cgtagtgatc gaaatcgact gatctcgggt tctttttgtt ggtttctttt cggttaatca 3540
tgtattgttt tcttttttta cagaaagata cttttttcat gagcaattcc tcgcccggcg 3600
ccggcatgcc gaggtggggc cactgcgatc agcggcatgc cgacgccgac ccggggatct 3660
tggattcacc gttttctctc ttctctctct acatacagac cgggtggcag gagcggtaag 3720
gaatcatcgt cgtctttcat tcttcgatga ttatggtaat actaaatctt atctaggagc 3780
atatacatct aagattggag tactagtagt cgtttgtggt ttctattttt tttatattta 3840
tctatgacag tttttctgtt tttcgttttg ataataatat aataaaaact catggacgtg 3900
aaatctggct tggttgtggt gatttcattc tcattattgt tgttttcttt ccgtcttgcg 3960
gatgaagatg ttgcgatgcg gttgttgttg gtgttgctat acaccgagag agatgatctt 4020
tttgttcttc tggttcattt cctatgattg tttggctgct gaccgacgcg tcaggatgtg 4080
cagggcatgc ggggaatcag gaccggacac gggataattt catctaccta tacggagatc 4140
gcggtcctcg ccatgaggat cgcgacaggc gcgtcgaggg ggcaggaaca cccttgcgga 4200
ttgacattct tggtggtgtt tcgttgttgt cggtagttgt tgttgacgat gaggataaat 4260
aaaaatgacc ttgtttttgt tctgttttct cttgttggga atcgtcgact ttgaattctt 4320
cgagttatcg gaaagctgag gtacccaaat gtctgtagct tttttctttt taccctcttg 4380
tttatcatct gcgattcgtg gtaggtagga gagggaaatg ataatccgag attaaggaaa 4440
ggagaagata aaaaataaaa aaaaaataat aaaacagaag ccgaccggcc gccgacccgt 4500
tccccaggac cagcctacga ggaatggata acgcggtggc gacggcagcg gtggtggcgc 4560
tgggggtggc ggcagtggta ctgctgatgg tagtcgggac ggaggagagg cgatgcatac 4620
atacacgcgt gcatgctgca tgggtggatg gtacggccgg gagacgcgga agagaaactc 4680
acataaaaag gtgacaaaaa gagcggttga aaaaagaaaa cgagattcga ccagacagaa 4740
gagaaggacc ggggcttggc gacccttcca cgactgctgt tgtcatctcg gctcccccgt 4800
cttctcccgg ccacgggcgg ctaagtcacc gccgttctcc ccatccgtcc gagcgccgac 4860
cgaccagccg gccgattcgc ccgccggggc ttctggagaa cgccggggca gcagcgatct 4920
ggggaagccg ctaaacccct gcgtttttat atggtagctc tgccgagcgc gggctgacgc 4980
- 129 038595
gttgagtaag cggaaagacg tgtgtgacga aaaggggtcc catggtattt cacgtgacga 5040
tgaggagatg cggtttggag cacatacggt ttagaaaaag ggagttgtcg tgacaagggc 5100
tgagggacct ctgtctccat gtgtgtataa aaagcaaggc acgttcataa tgtaaaaaag 5160
aacacgttgt aaacaagcta ttgctgtatc attcggctga ctatgcttca ttcggactga 5220
ttttcttttc ctaacggcgt aacttaaagt gattaacgta tgatatttgt tccccagagt 5280
tatactatag tcatcatcct aaaattcaga tataaatgaa cacatgtcgt atgggattat 5340
taagaaaccg aaactctcca cagttcacca tcttcttcgt cattcaaccg atgacccact 5400
ccgtacaacg aatcagtctg ctgtgtcaca ctgcaaacta ctagcgacgt atgcaaacaa 5460
cttgaaacac gggctgttgt attgacgacc gttgtaccat tactagtcac attgcataga 5520
gaccatccac cgtcatccca tctttcccac ccgatggaaa accgtcttct atcatcaact 5580
atggtaagat ttcgaccctg cgaggtattc agtttcccca tatccataac ctggatttta 5640
tcattaaacc ccaatattaa acactttttt agtacccccc cacccaccaa aaaatgtgac 5700
tggaccggtt cctagcagct ctgggagcca tgttcaggtt gaaccacagc tacagcgaaa 5760
ccgagtccag tgaccggtaa ccacgtccag cccctgcgta tgtaccagtc caagcacgtc 5820
cggtcattgt tctacacagg aaatctaact aggtcaacgc aattttattc caccgttacg 5880
cagaatacta acaaacaaac acacaaattt aacgaattac acgtagttta ttacatgaaa 5940
actgtaagaa caccaattca ctaagcgata caacatttag ctgacttcca agtgccacac 6000
atcaccactg tattcatcca tgttttcacc gaaccaacga gacagatcga agaagccaga 6060
atctcccgac tttaaattac ataaatccaa cgtattatga ccacagctcg acacacaaat 6120
agttgcgtta ctattcacag tagcattacc tatacccgta acgttgcaca accactgatc 6180
accattgtta ccaaaaacgg ttttccactt agttgtcaac ggatctttcc catgcgtaat 6240
ggtcaaatta ctaccagtcg tcgcttttag ctcattacga gtattatccg catccacata 6300
tatcaacgtc atagctaggc acgctataag tacccccccc ccacaatgga atgttgccaa 6360
accggttctt tcccgttata gccatagcgt tcccaggcaa aagcaaacgc caaacctaat 6420
gcagtgaaaa gcgcttgcag ccagaaccag cttatgtacc agccacaatc acatccggtt 6480
attgtttcca caggaaatcc taccaggcaa agccccgctt gttttgttcc tgaccatctt 6540
- 130 038595
gtttagcaat tcgtaaactg tcagcctagc gacgtccgtt tagatcaaaa gtcacgtata 6600
tagcgacgct gtttccaccc gtttccccgt cccgccgttt ccgaacaacc cacccgggtt 6660
cagacaaccg accaccaaca gaaatataca cacagaccac cgggagttca gttaaagatt 6720
tcatcaggtt tattttggct gctgctagtc ttttgcttct tagaaaaaaa atacccatat 6780
agagaaataa tgatagtttg acaacacata tggcagggat ttcttcttca tcaataagat 6840
atgcaattcc cccagggaga gactttcaac aattgaattt acaaaaacaa aattacatca 6900
ggagaaagag aggatacatt aataaatata ttatatctgg tgtatatact gaatgctgct 6960
ggttcataag gtaacgatgc tacttttttt aattccaaga tggtttttct ttgttagtct 7020
tttgttgact tgctggttcc taaaagttcg caaaaacgat tgtgtgaaga ttatgacgtt 7080
ggttgactag ttcatgagat tctgctgtac gtgtgatggt tattcgctgg ttcgttctaa 7140
gatgagtatc gtactgtgtc tgcgatggtc gtctcttact ggcattctct cggctgcctc 7200
ttgttttcat gattgaaaag gaaaaaagga ctccgagggc gcggtcatct tttacttttc 7260
ggttttctcg ttggcgggtc agaggtagtc agatcatgag actgtcgtgg tcgatgaaac 7320
tgtgtctgct caagtgacgt ccatttcttg tacggagaaa aaagtcatcg ggataaataa 7380
ggctatacaa ggcgttgtca agcgtgcggc tctaaacaaa ttaagcgata caaaattaca 7440
gtgatacgaa taataaatta ccccctcccc ctgtggtccc cccgaggcga gagccaccca 7500
tcgtgtactc tcgcaccacc cacgaccaca gggggagacg ggacgaagag acgacgcaga 7560
gcgccatctc ctcctggagg ccggcggcgt taactgctac agctgcggcg gcgacgacag 7620
ctgcgatttg tcggccgaca tgccgatggt atgggcggcg gcggcggtgg ccgcggcagc 7680
ggggaggaga ggagagagaa gaggagcggg gcgtccgaag gcgaggatgg catggtctcg 7740
ccggagcgcc cggcttttat ggaacactcg cgtccggttg ggtatcaccc acaggaagat 7800
gaatcacaac ttccaaacca tcttgagacc cgagtaacgg tttacaggtc gcacgccagt 7860
ctcagctaaa aacagcggac agtcccacgc tgtttctgtt gtggctctct ccagtttcct 7920
catcgccgtc ttggtctccg tcatcatcgg aagaatacca cccgctctca tgcggcagtc 7980
gatcagcctc gatgaacgag acgcggcgac gcctttctac ggccgactgg ttgtggtggt 8040
gaaagaagag caccagcaat cccaggagga gcaacaagcc ctcacatgtc caggaggtcg 8100
- 131 038595
gggagagggc ctgtcggaga tgaccgtgag gcatcacgta cggcagctga ggagaaacgg 8160
agaagaaagg aaaattaccg tcaggggccg gggttcttat tagagaaaca gcacgtaggt 8220
caggatccag atgctaatgg caatcatgat gacgatgatc atgcaggcca agacgcggcg 8280
caccaatgca gaatccaata gccgccgtgc ctccggttgg tggccggcgg catctagaga 8340
catgatttgg gggggggacc ggcggcgcaa aaagacaggg agatggacag tgccacggtg 8400
ttttgttatg attaggacat ggggaccgga agccgagaca gagtactaca gggtgttgaa 8460
gggtaacgtg agggagatca tgtcatgggc gggctgaaga ccgtgcgggg aggatcgacg 8520
tgtgcggtgc ttgtggaaca cggtgtttta atatgtatcc gcgtgtaatg cacgcggtgt 8580
gctttttagc actcggcttg ataagctacg tgaccgtctg cgctgaaacc atggtcgcca 8640
ccaactgtct cgtgaaaaca gaaaataccc acctagcatg taagtgcaat ccgaatagta 8700
catctaccaa tggcagcaag tgccacgcga tgtgcaaatg ccgggtcaca gaacccatta 8760
ccatgctagg cgcatactcg gcctggggcg cgggctcgtt cgtggccacg ctgatagtcc 8820
tgctggtggt cttcttcgta atttacgcgc gcgaggagga gaaaaacaac acgggcaccg 8880
aggtagatca atgtctggcc tatcggagcc tgacacgcaa aaagctggaa caacacgcgg 8940
ctaaaaagca gaacatctac gaacggattc cataccgacc ctccagacag aaagataact 9000
ccccgttgat cgaaccgacg ggcacagacg acgaagagga cgaggacgac gacgtttaac 9060
gaggaagacg agaacgtgtt ttgcaccatg cagacctaca gcaactccct cacgcttgtc 9120
atagtcacgt cgctgttttt attcacagct cagggaagtt tatcgaatgc cgtcgaacca 9180
atcaaaaaac ccctaaagct cgccaactac cgcgccactt gcgaaaaccg tacacgcacg 9240
ctggttacca ggcttaacac tagccatcac agcgtagtct ggcaacgtta tgatatctac 9300
agcagataca tgcgtcgtat gccgccactt tgcatcatta cagacgccta taaagaaacc 9360
acgcgtcagg gtggcgcaac tttcacgtgc acgcgccaaa atctcacgct gtacaatctt 9420
acggttaaag atacgggagt ctaccttcta caggatcagt ataccggcga tgtcgaagct 9480
ttctacctca tcatccaccc acgcagcttc tgccgagcct tggaaacgcg tcgatgcttt 9540
tatccgggac caggcagagt cggtgtggtc acggattccc aagaggcaga ccgagcaatt 9600
atctcggatt taaaacgcca gtggtccggc ctctcactcc attgcgcctg ggtttcggga 9660
- 132 038595
ctgatgatct ttgttggcgc actggtcatc tgctttctgc gatcgcaacg aatcggagaa 9720
caggacgttg aacatctgcg gacggacctg gatacggaac ctttgttgtt gacggtggac 9780
gggaatttgg aataaaagat gcgtaacacc tgtcgaagat gcgataactt tacatacagg 9840
caaacagtgt atacaattat agtattttgt atgttgcata aagttacatg caacagtact 9900
gctaacagta ctgcatccat tacgctatcc aacactgcct ctaccacttt tgtaaccaac 9960
atatattcaa ctccgaataa caacacatca acgacgccac acacatctgt cacctcacaa 10020
gcgtcaacca ttggcaacat caccaacgtt acctccgact tgagtacttt cacaaccgta 10080
tattctacat tcaatacatc atttgccaat atatctaata cggctgtcac tacagaattg 10140
atttcaacaa ataccaacac tatctcatct tttaccaacg taacagcaaa cgctacatca 10200
tcttataaca caacaatcac cgtaactgtc acgtcagatg aaacttcgca caacgtatcc 10260
actaataatg cacttataag cacaccatgg cctacaaatt gcagcgccac aacatacacc 10320
acgtacaacc ttactaactc ttccaacgct tgtcacacag agacaacaat catacgtttc 10380
aaggaaacca atacaacagg aatagaaggg agtaatgtca ccataaaggg taattctacg 10440
tgggactgtc tttcagtcgc ctggatacga cattacaata gatccacaca cggacatcat 10500
ctaggttatc gtaagaacgc acatacccaa tcttggtatt ggctacgcat ccttacctct 10560
cacactgtat gtcattctca acatgaaaga ccttcactgt accatgactt atgtcgttcg 10620
tgcaacaaca cagaattaca tctgtacgat ctaaatatca ccaattccgg caggtacagc 10680
agacgttgtt ttaaagaaaa ttacttcaca ggacatcacg aagatgaaaa tttctaccta 10740
ttagtaacac caaaaaatca tactgaagct attaatgcta ctttcgtttg ccctagatac 10800
aacaccgata tcgaaaatga agatagagag aaaggaagtc aacatactaa caatacacat 10860
caccacaaac gtaatctcta tcatagctcg caaagaagcc gcaccgtatg gaccatcgtg 10920
ttggtttgta tggcctgcat agttctgttt tttgcacgac gagcctttaa caaaaagtat 10980
catatgttac aagacaccgt cagtgaatca gaattcattg ttcgatatca cccagaacat 11040
gaagattgag ctacgtttcc gggcagacat cttatgaagc tgaacaataa actaaaacat 11100
tctgtaagac tcagcgttca aaggaatatt aatgcccatt gagcgaaaac taatattgca 11160
atggactggc gatttacggt tacgtggacc gttacttgtg atggtttcaa ttatacagtc 11220
- 133 038595
cataaaagat gcgatcgcag ttacgaggta atcaacgtaa caggatacgt tggtagcaac 11280
ataactctaa aaaaatgcaa tcagactgag aaatggcaca atgtagactg gattcattat 11340
gagtacccca cgcataaaat gtgcgaatta ggcaactatc accaaaccac accacggcac 11400
gacatatgtt ttgactgcaa cgacacctcc ctaactatct acaacttaac cacaaaaaac 11460
gctggaaaat ataccaggcg tcaccgtgat aacggtcaag aagaaaatta ctacgtaacg 11520
gtgttaattg gagacacaac gttattcact cttggcacat gccctgtaag atataaagaa 11580
tctacgaaca ctgaaaacac cattggaagt agcatcatag aaaccattga gaaagctaac 11640
attcccctgg gaattcatgc tgtatgggca ggcgtagtgg tatcagtggc gcttatagcg 11700
ttgtacatgg gtagccatcg cattcccaaa aagccgcatt acaccaaact tcccaaatat 11760
gatccagatg aattttggac taaggcttaa catgctgatc aataaacttt ttttaaccaa 11820
taacatgtct ccgttttttt ttgttaacaa cctatgatat aaagcgttat attcagtcgt 11880
tactaaacaa aaaaacatgg gcatgcaatg caacactaaa ttgttattgc cagtcgcact 11940
aataccggtt gcaatcatcc taattggtac tctagtgccg atacttttac atgaacaaaa 12000
aaaggcgttt tactggcgac tttttctgca aagtcaacat gtagaagcac ccattacagt 12060
aacgcaggga gacacagtct acctagacgc tagcaataat ccctgtaatt attccagctt 12120
ttggtaccac ggtaattgcg aactttgtgg atggaacgga tatctacgca atgttacaca 12180
ttactacaca aacacatcgt gttccccgca attcatctgc ataaacgaaa ctaaaggtct 12240
gcagttatat aatgtaacat taaacgattc aggcgcttat actgaacacg tttacgaatg 12300
tgacctttcg tgtaacatta ctactaataa cgaatatgaa atactcaatt attttgataa 12360
ctgtaactac accataaata gcaccaagca tattatcacc gtggtgtctt cacgtcattc 12420
taaacaaaca aattcccacg tatccactca cgctggttgg gcagtcgccg tggtgacggt 12480
aattatgatc tacgttctga tccactttaa cgtcccggca actctgagac acaaactacg 12540
aactagaaac aacgtaaatc gcatagcgtg attataaagt atcgacgcta atttctccaa 12600
gataaaattt gattactccg tgcagttctc aaaaactgta aggccccgct tttccactcc 12660
gtcatgaagg atcgcaatag aatactgcta tgtatcatct ttatttgcat tatgtgcctc 12720
atttgtattt actttaaacg tcgttgtgtt tttactccgt ctccagacaa agcagatctg 12780
- 134 038595
cgagtggaat ttccctcgtt acccccgtgt attggcatac agtgcgctgc atgagaacac 12840
gcgtgacaca tagcgtaccc ctggacggta cagtttatga taacgtaatt cagggaaagt 12900
atacattcat accaacatgt tatcacataa cacacagatt ttctgcgtgt tttataaaag 12960
agcgtctcga agcagcttga gccacactac ggtccagatg acgagcgtaa ttaaaaatat 13020
gccgcgcagt attcgaaagc cgtactgagc gtgcgaggcg ggtagggtgc cgaacgacgg 13080
atatgcgtcg ttgtcatctt cgactataag gatcgcgacc gagtcttcgg ccatggtaaa 13140
cgtcaccctg tgtggctggt atgtagcgta tccggtttgg aattgttctg ctccagctcg 13200
ggggatagtg aggaattctc aagggatacg ggacccaatg actggataag agaagggttt 13260
ttccccgtaa gatgatcctc gtatcacatg aggtctggat atgtataaat gaagagtgaa 13320
ataggcacag ggaatcagat gccagcctcg tgatgcagcc gctggttctc tcggcgaaga 13380
aactgtcgtc tttgctgact tgcaaataca tcccgcctta agcgatgagt ctataaagca 13440
ccgttgcccg agtacggtaa aagtgacccg gattgtagaa cgtccttttt ttttgttttt 13500
gcatcgttta tcgtcactac tagtgcaata ttttgattgt aaggctgaaa gagtatcgtt 13560
atgatgctta gaacgtggag attattacag atggtactgc ttgccgcgta ctgttattat 13620
gtttttgcga cttgttcaat cagcacgacg actgctcctg tggaatggaa gtctcccgac 13680
cgtcagattc ccaagaatat tacctgcgct aattactcag ggaccgtcaa cggcaacgtt 13740
acatttcgag gtcttcagaa caaaacggaa gactttttgt actggttgtt aggatggggt 13800
cataagtcca tttgttcgtt cttcccgaaa ctccagggta actatgacga acaacattac 13860
agatatgaag tagcgaacct gacgtataac tgcacctata accgcttgac gttgctgaat 13920
ctgacgacgg aaaacagcgg aaagtactat ttcaaaaggg aagatgcgaa tttcaccttc 13980
tattactctt gttacaactt gaccgtgtcc taaagatcgc acgtgaagtt tcacagagcc 14040
gcgtggctgt agctattgtg tttacgttgc ttttgaaatg ttaagcgtcc ctacggcgct 14100
aacatgtttc taggctactc tgactgtgta gatcccggcc ttgctgtgta tcgtgtatct 14160
agatcacgct taaagctcat gttgtctttt gtgtggttgg tcggtttgcg tttctatgat 14220
tgtgccgcgt tcgagtcctg ctgttacgac atcaccgagg cggagagtaa caaggctata 14280
tcaagggacg aagcagcatt cacctccagc gtgagcaccc gtacaccgtc cctggcgatc 14340
- 135 038595
gcgcctcctc ctgaccgatc gatgctgttg tcgcgagagg aagaactcgt tccgtggagt 14400
cgtctcatca tcactaagca gttctacgga ggcctgattt tccacaccac ctgggtcacc 14460
ggcttcgtcc tgctaggact cttgacgctt ttcgccagcc tgtttcgcgt accgcaatcc 14520
atctgtcgtt tctgcataga ccgtctccgg gacatcgccc gtcctctgaa ataccgctat 14580
caacgtcttg tcgctaccgt gtagctagtt agccagctgt gtgtagtgtt ttgcttttgc 14640
atatttgttt tcagtcagag agtctgaaac ggggtgggag ggacttttgc gggtagtgca 14700
tgctaagatg aacgggtggg ctggggtgtg cttgataact cactgtttga atacgcgctc 14760
acgcacatat gtagcactca acatgttagc ttttgcccgc acgccccggg gcgtgccgag 14820
ctgccttttt aataaagtct gggtttccag atacgcgctg gttctgattt tgatggtttg 14880
tgcctctgaa agctctacga gctgggccgt gacatccaat ggactgccta actgtagcac 14940
ggtaactaga acagcgggtc aagacgctga attgcacggt ccggcaccgt taagctgtaa 15000
tgtgacccag tggggacgtt acgagaatgg aagcacaccc gtgttatggt gcactttacg 15060
gggatcaagc atgcgagtct cattaggaca ccgtgtagcg tttggctgtt cttggaaaac 15120
attttttatt tataacgttt ctgaaagtag cggtggcact tactatcaaa aaggttacaa 15180
ctgcaccgac aaacatataa cactatcttg tttcaactta acggtggttc ctcgagcggt 15240
tcaaagcaca accaccgtaa tgacacccac gctggttaca aactccacat tcagtgtgtc 15300
acttgttccg ttgagactga cgacaaattc cagcgcgttt ggacacgcta tttatcaacg 15360
acaacagcgt gttgaaaacg ggacgttatc caagaacata actaacttgg cattcaccta 15420
tggcagctgg ggcgttgcga tgctgctgtt tgccgccgtg atggtgctcg ttgatttggg 15480
tttgcctcaa tcggcttggc gacgctggcg aagccacgtg gacgatgaag aacgtggttt 15540
gttaatgtag gaaataaaag gcagtttgag catgactgtt tccaaaccgt aacgtggtaa 15600
ataaatcatg gcttccgacg tgggttctca tcctctgacg gttacacgat ttcgctgcag 15660
agtgcattat gtgtacaata aactgttgat tttaactttg tttgcccccg tgattctgga 15720
atccgtcatc tacgtgtccg ggccacaggg agggaacgtt accctggtat ccaacttcac 15780
ttcaaacatc agcgcacggt ggttccgctg ggacggcaac gatagccatc tcatttgctt 15840
ttacaaacgt ggagagggtc tttctacgcc ctatgtgggt ttaagcctaa gttgtgcggc 15900
- 136 038595
taaccaaatc accatcttca acctcacgtt gaacgactcc ggtcgttacg gagcagaagg 15960
ttttacgaga agcggcgaaa atgaaacgtt cctgtggtat aatttgaccg tgaaacccaa 16020
acctttggaa actactccag ctagtaacgt aacaaccatc gtcacgacga catcgacgat 16080
gatcgacgcg aaaagtaacg ttacagggaa cgccagttta gcaccacaat tacgtgccgt 16140
cgctggattc tccaatcaga cgcctttgga aaacaacacg cacctggcct tggtaggtgt 16200
tgttgtgttt ttagttctga tagttgtttg cattatgggg tggtggaaat tgttgtgtgg 16260
taaaccagag ttatagtaat gtgcttttta tcagggagaa ggttttgtgc caacaatgac 16320
tagcccggga ctatctgcgt cagaaaatta tgacggaaat tatgaattca cggaaaccgc 16380
caatacaacg cgtacaaata gaagtgactg gacaacgtta gaaaccagtg cattgctatt 16440
gaaaaacacg gagactgcag tgaacctcag caacgcgact acggtcatcc cacaacctgt 16500
agaatacccg gctggggaag tacaatatca aagaacggca acgcattatt cttggatgct 16560
aatcattgtc atcattctca tcatttttat tatcatctgt ctacgagcac ctcgaaaaat 16620
ctaccatcac tggaaagaca gtaaacagta cggacaagtg tttatgacag acacggaact 16680
gtgacagtga tgtctaagcg tttgcaggta tttccatgga taacaatttt attttacaca 16740
tcaaaatccc agtattggaa ctatatggca ataccatgta cccctacagt tggatacggc 16800
agtcataata ttagcttgca tccgcttaat aactcattat ttcaagacga tgtttttgaa 16860
tggtacatag acaaaccaat ggttacaagt tatgtcttta tcaaagtaat gaacgcacaa 16920
aatccaatct agactctcca aatattgtgt ggcaatgcac agataatcgt acactaattc 16980
tcatgaactt aaccacaaca tacagtagaa actattattt tcaatccttt aaatatctcg 17040
gacgaggagt accaaaaccg aataacttgt gttataacgt tagtgtacac tttacccacc 17100
aaacacattg ccatacaact acatcatccc tgtatccacc tacatctgta cacgattcat 17160
tagaaatatc acagtcattc acctcaacca acttcacaca taccgcggtc cactacgcca 17220
ccggtaacgt tgaagcacaa cacgacacta ccactccaca tacaatgtgg atcatacccc 17280
tagttatcgt tataacaatc atcgttttaa cttgtttcaa attcccccag aaagcttgga 17340
ataaattcac acaatacaga tacagcggta tgctcgccgc cgcttaaaga atcaacgcca 17400
aggaaaccaa aacgtaaaaa gaatagatat gtacgtttat ttttcagctc actgtttgaa 17460
- 137 038595
taccgtaaac ataatgacgt acatatacgt ggttatacaa caggtgtttg tgttatgcgg 17520
cgactgatta accatatcgt gaaccatgat cttttccgat ggtccgtcgt gaccgcaatg 17580
atattttaca gatattccga aacctgtatg gaggtcactg tcagagtagg tgatccagtt 17640
accctcggta gtggacatgg ttatcatcca ggtagggata acagggtaat gatcctctag 17700
agtcgacctg caggcatgca agcttgagta ttctatagtc tcacctaaat agcttgg 17757
<210> 11 <211> 18036 <212> ДНК <213> Цитомегаловирус ЦМВ человека
<220> <221> misc_feature <223> предварительное редактирование фрагмента ЦМВ человека
<400> 11 acgacggcca gtgaattgta atacgactca ctatagggcg aattcgagct cggtacccga 60
ttaccctgtt atccctacca ttccgggccg tgtgctgggt ccccgagggg cgggggggtg 120
tttttagcgg gggggtgaaa tttggagtct tggagccgcg tgtgctgtgg aggacggtga 180
cggtggtaag agtgtgctgc ggtgcggttg ggacggcggc ggcgaataaa agcggcgtgc 240
ggcgcgcacg gcgaaaagca gacgcgcgtc tgtgttgtgt gtctttgacc gcggcggaac 300
acacgcggaa aagcgagtcc caggggacac acgacgagcg agtcccaggg ggggacgacg 360
acggccaggg acgcggaaac gacgcggaaa agaggaagtc cccaggggga cgggcggaaa 420
agaggaagcg cctaggggac cgcgggggca ggaacagacg aagtacgccg caacccgcgt 480
cgaggacaca cgcagaagcg gccgcccagg ggaggggggg ggggggactc gcgggccccg 540
gggcacactt gttgttccct ccggccgccg acacgcaccc cgaagccgcg cacaccgccg 600
acacacccct gacacacccg cgacacaccc gccacacgcc cgacacacgc ccgcgacaca 660
cccgaccgac acaccctgac acaccccgcc aacacaccca gccgcacccg ccccgccaac 720
acacccccga cacacccgac acacgcccgc gacacacccg gcacacaccc acccacccag 780
ccgcgccccc gacacacccc gaacggcgcc ggtgcgggac agggctcacg gaggtttgcg 840
ggccgtgagc acgcctccct ttgtacacac taccggtgcg tggcgtccca cgctatttgt 900
- 138 038595
tcgcgagacc ggactaaggg aggtttgcgg tgcgtcagcg cggggcggcg tttgcggcgt 960
gtttcgacca gcgctttgtg cgcgctgcct gtgcgtgtcg tcccatggtc tttgtcagcg 1020
gcacggcgct ggggacgggg tttcaccgcg ctgagggatc tttctgcggg tgtgagggac 1080
ggagcttttt tcgcacgctg ggcaccgggc tgggggacgg ggggtgtgcg ggacggcggt 1140
ggggccgggg cgttgcgggt acggggatta cgctgggaac ggggactcgc ggacccgggc 1200
tgagggacgg gggtggcggg ggtgtttgcg gcgaggacgg gggccttttg cggcggggac 1260
ggggactcac cctcgcctat ttaacctcca cccacttcaa cacacacatg ccgcacaatc 1320
atgccagcca cagacacaaa cagcacccac accacgccgc ttcacccaga gtaccaacac 1380
acgttaccct tacaccacag caacacacaa ccgcctatcc aaacctcgga caaacacgcc 1440
aacgaagaac accgcacgca gatggagctc gacgccgcgg attacgctgc ttgcgcgcag 1500
gcccgccaac acctctacgc tcaaacacaa ccccaactac acgcataccc caacgccaac 1560
cctcaggaaa gcgctcattt ttccacagaa aatcaacatc aactcacgca tctacttcac 1620
aacattggcg aaggcgcagc gctcggctac cccgtccccc gcgcggaaat ccgccgcggc 1680
ggtggcgact gggccgacag cgcgagcgac ttcgacgccg actgctggtg catgtgggga 1740
cgcttcggaa ccatgggccg ccaacctatc gtgaccttac tgttggcgcg ccaacgcgac 1800
ggcctcgctg actggaacgt cgtacgctgc cgcggcacag gctttcgcgc acacgattcc 1860
gaggacggcg tctctgtctg gcgtcagcac ttggtttttt tactcggagg ccacggccgc 1920
cgtgtacagt tagaacgtcc atccgcggga gaagcccaag ctcgaggcct attgccacgc 1980
atccggatca cccccatctc cacatctcca cgcccaaaac caccccagcc caccatatcc 2040
accgcatcgc acccacatgc tacgactcgc ccacatcaca cgctctttcc tatcccttct 2100
acaccctcag ccacggttca caatccccga aactacgccg tccaacttca cgccgaaacg 2160
acccgcacat ggcgctgggc acgacgcggt gaacgtggcg cgtggatgcc ggccgagaca 2220
tttacatgtc ccaaggataa acgtccctgg tagacggggt agggggatct accagcccag 2280
ggatcgcgta tttcgccgcc acgctgcttc accgatatcc aataaaccca tcccctcgcc 2340
acgacgtctc cgcgtatctt tgtagcctca ggaatccgtc cccacgtcca tccatcccga 2400
gcactccaca cgctataaca gaccacggac acggcaaatg catgcaaact tctcatttat 2460
- 139 038595
tgtgtctact actctgtgtt gctacaggga gtgaaggggg tgaaggcaaa gaaaaaaaaa 2520
aggaacaaaa taatagatta gcagaaggaa taatccgtgc gaccgagctt gtgcttcttt 2580
tcttataagg aggcaaatat actagggaaa acttaagaat aggaagaaac cgaggtttgg 2640
gagaaaagct gagataaaat agcgcatttt ccatacagag gttgttgttt ttgtggatcc 2700
taagaggttt caagtgcgaa tctcaaagtt ctcacgagaa tattgtcttc aagaatcgac 2760
aactgtggtc caagattttt ttttggtctt tttaggttct gcgagggaca tcacgatgga 2820
tcgttgcgat gaagtcacgc gtacgcctct ggtgtggcgc ggtgtcgtga caggagagtg 2880
tgttttcagt gcagagctgt cttgattcct atatccgagt atctgttttc tcgtaaggac 2940
ggtaatcttc tttggtgtaa gtacatctaa aagctgcaaa ctatatttta agggctgtct 3000
ctaggtgtac tttgatgctg gagtttttcg ctgtgttgat gtgaataaat ctactactac 3060
tattatatgc agaaagagtg attatgccga gacaagattg cattggctga actgtttcaa 3120
aaacgcctac actctactta tccgtaaacc taaggtaata ctatgtgtaa gttgtttttt 3180
tttctttttg tagtaaaatg gtgatacgtg caattaaaac tgtattccat gtttccatcc 3240
tttcatttca actttaaagg cggctttgag agcgaagaag tgcgaggata aaaatggatg 3300
actccttcgt gtccagggag tcgactactg caacgctgat tgattaaaag atggtctccg 3360
atgatgatgt tgttattgat cgaatcatgg tgcagaacgg cgacggagag gagcgtgtcc 3420
gccgccggga aggtggtctc tttctctttt cttttttcaa gaaatcttcc atgtgtttat 3480
cgtagtgatc gaaatcgact gatctcgggt tctttttgtt ggtttctttt cggttaatca 3540
tgtattgttt tcttttttta cagaaagata cttttttcat gagcaattcc tcgcccggcg 3600
ccggcatgcc gaggtggggc cactgcgatc agcggcatgc cgacgccgac ccggggatct 3660
tggattcacc gttttctctc ttctctctct acatacagac cgggtggcag gagcggtaag 3720
gaatcatcgt cgtctttcat tcttcgatga ttatggtaat actaaatctt atctaggagc 3780
atatacatct aagattggag tactagtagt cgtttgtggt ttctattttt tttatattta 3840
tctatgacag tttttctgtt tttcgttttg ataataatat aataaaaact catggacgtg 3900
aaatctggct tggttgtggt gatttcattc tcattattgt tgttttcttt ccgtcttgcg 3960
gatgaagatg ttgcgatgcg gttgttgttg gtgttgctat acaccgagag agatgatctt 4020
- 140 038595
tttgttcttc tggttcattt cctatgattg tttggctgct gaccgacgcg tcaggatgtg 4080
cagggcatgc ggggaatcag gaccggacac gggataattt catctaccta tacggagatc 4140
gcggtcctcg ccatgaggat cgcgacaggc gcgtcgaggg ggcaggaaca cccttgcgga 4200
ttgacattct tggtggtgtt tcgttgttgt cggtagttgt tgttgacgat gaggataaat 4260
aaaaatgacc ttgtttttgt tctgttttct cttgttggga atcgtcgact ttgaattctt 4320
cgagttatcg gaaagctgag gtacccaaat gtctgtagct tttttctttt taccctcttg 4380
tttatcatct gcgattcgtg gtaggtagga gagggaaatg ataatccgag attaaggaaa 4440
ggagaagata aaaaataaaa aaaaaataat aaaacagaag ccgaccggcc gccgacccgt 4500
tccccaggac cagcctacga ggaatggata acgcggtggc gacggcagcg gtggtggcgc 4560
tgggggtggc ggcagtggta ctgctgatgg tagtcgggac ggaggagagg cgatgcatac 4620
atacacgcgt gcatgctgca tgggtggatg gtacggccgg gagacgcgga agagaaactc 4680
acataaaaag gtgacaaaaa gagcggttga aaaaagaaaa cgagattcga ccagacagaa 4740
gagaaggacc ggggcttggc gacccttcca cgactgctgt tgtcatctcg gctcccccgt 4800
cttctcccgg ccacgggcgg ctaagtcacc gccgttctcc ccatccgtcc gagcgccgac 4860
cgaccagccg gccgattcgc ccgccggggc ttctggagaa cgccggggca gcagcgatct 4920
ggggaagccg ctaaacccct gcgtttttat atggtagctc tgccgagcgc gggctgacgc 4980
gttgagtaag cggaaagacg tgtgtgacga aaaggggtcc catggtattt cacgtgacga 5040
tgaggagatg cggtttggag cacatacggt ttagaaaaag ggagttgtcg tgacaagggc 5100
tgagggacct ctgtctccat gtgtgtataa aaagcaaggc acgttcataa tgtaaaaaag 5160
aacacgttgt aaacaagcta ttgctgtatc attcggctga ctatgcttca ttcggactga 5220
ttttcttttc ctaacggcgt aacttaaagt gattaacgta tgatatttgt tccccagagt 5280
tatactatag tcatcatcct aaaattcaga tataaatgaa cacatgtcgt atgggattat 5340
taagaaaccg aaactctcca cagttcacca tcttcttcgt cattcaaccg atgacccact 5400
ccgtacaacg aatcagtctg ctgtgtcaca ctgcaaacta ctagcgacgt atgcaaacaa 5460
cttgaaacac gggctgttgt attgacgacc gttgtaccat tactagtcac attgcataga 5520
gaccatccac cgtcatccca tctttcccac ccgatggaaa accgtcttct atcatcaact 5580
- 141 038595
atggtaagat ttcgaccctg cgaggtattc agtttcccca tatccataac ctggatttta 5640
tcattaaacc ccaatattaa acactttttt agtacccccc cacccaccaa aaaatgtgac 5700
tggaccggtt cctagcagct ctgggagcca tgttcaggtt gaaccacagc tacagcgaaa 5760
ccgagtccag tgaccggtaa ccacgtccag cccctgcgta tgtaccagtc caagcacgtc 5820
cggtcattgt tctacacagg aaatctaact aggtcaacgc aattttattc caccgttacg 5880
cagaatacta acaaacaaac acacaaattt aacgaattac acgtagttta ttacatgaaa 5940
actgtaagaa caccaattca ctaagcgata caacatttag ctgacttcca agtgccacac 6000
atcaccactg tattcatcca tgttttcacc gaaccaacga gacagatcga agaagccaga 6060
atctcccgac tttaaattac ataaatccaa cgtattatga ccacagctcg acacacaaat 6120
agttgcgtta ctattcacag tagcattacc tatacccgta acgttgcaca accactgatc 6180
accattgtta ccaaaaacgg ttttccactt agttgtcaac ggatctttcc catgcgtaat 6240
ggtcaaatta ctaccagtcg tcgcttttag ctcattacga gtattatccg catccacata 6300
tatcaacgtc atagctaggc acgctataag tacccccccc ccacaatgga atgttgccaa 6360
accggttctt tcccgttata gccatagcgt tcccaggcaa aagcaaacgc caaacctaat 6420
gcagtgaaaa gcgcttgcag ccagaaccag cttatgtacc agccacaatc acatccggtt 6480
attgtttcca caggaaatcc taccaggcaa agccccgctt gttttgttcc tgaccatctt 6540
gtttagcaat tcgtaaactg tcagcctagc gacgtccgtt tagatcaaaa gtcacgtata 6600
tagcgacgct gtttccaccc gtttccccgt cccgccgttt ccgaacaacc cacccgggtt 6660
cagacaaccg accaccaaca gaaatataca cacagaccac cgggagttca gttaaagatt 6720
tcatcaggtt tattttggct gctgctagtc ttttgcttct tagaaaaaaa atacccatat 6780
agagaaataa tgatagtttg acaacacata tggcagggat ttcttcttca tcaataagat 6840
atgcaattcc cccagggaga gactttcaac aattgaattt acaaaaacaa aattacatca 6900
ggagaaagag aggatacatt aataaatata ttatatctgg tgtatatact gaatgctgct 6960
ggttcataag gtaacgatgc tacttttttt aattccaaga tggtttttct ttgttagtct 7020
tttgttgact tgctggttcc taaaagttcg caaaaacgat tgtgtgaaga ttatgacgtt 7080
ggttgactag ttcatgagat tctgctgtac gtgtgatggt tattcgctgg ttcgttctaa 7140
- 142 038595
gatgagtatc gtactgtgtc tgcgatggtc gtctcttact ggcattctct cggctgcctc 7200
ttgttttcat gattgaaaag gaaaaaagga ctccgagggc gcggtcatct tttacttttc 7260
ggttttctcg ttggcgggtc agaggtagtc agatcatgag actgtcgtgg tcgatgaaac 7320
tgtgtctgct caagtgacgt ccatttcttg tacggagaaa aaagtcatcg ggataaataa 7380
ggctatacaa ggcgttgtca agcgtgcggc tctaaacaaa ttaagcgata caaaattaca 7440
gtgatacgaa taataaatta ccccctcccc ctgtggtccc cccgaggcga gagccaccca 7500
tcgtgtactc tcgcaccacc cacgaccaca gggggagacg ggacgaagag acgacgcaga 7560
gcgccatctc ctcctggagg ccggcggcgt taactgctac agctgcggcg gcgacgacag 7620
ctgcgatttg tcggccgaca tgccgatggt atgggcggcg gcggcggtgg ccgcggcagc 7680
ggggaggaga ggagagagaa gaggagcggg gcgtccgaag gcgaggatgg catggtctcg 7740
ccggagcgcc cggcttttat ggaacactcg cgtccggttg ggtatcaccc acaggaagat 7800
gaatcacaac ttccaaacca tcttgagacc cgagtaacgg tttacaggtc gcacgccagt 7860
ctcagctaaa aacagcggac agtcccacgc tgtttctgtt gtggctctct ccagtttcct 7920
catcgccgtc ttggtctccg tcatcatcgg aagaatacca cccgctctca tgcggcagtc 7980
gatcagcctc gatgaacgag acgcggcgac gcctttctac ggccgactgg ttgtggtggt 8040
gaaagaagag caccagcaat cccaggagga gcaacaagcc ctcacatgtc caggaggtcg 8100
gggagagggc ctgtcggaga tgaccgtgag gcatcacgta cggcagctga ggagaaacgg 8160
agaagaaagg aaaattaccg tcaggggccg gggttcttat tagagaaaca gcacgtaggt 8220
caggatccag atgctaatgg caatcatgat gacgatgatc atgcaggcca agacgcggcg 8280
caccaatgca gaatccaata gccgccgtgc ctccggttgg tggccggcgg catctagaga 8340
catgatttgg gggggggacc ggcggcgcaa aaagacaggg agatggacag tgccacggtg 8400
ttttgttatg attaggacat ggggaccgga agccgagaca gagtactaca gggtgttgaa 8460
gggtaacgtg agggagatca tgtcatgggc gggctgaaga ccgtgcgggg aggatcgacg 8520
tgtgcggtgc ttgtggaaca cggtgtttta atatgtatcc gcgtgtaatg cacgcggtgt 8580
gctttttagc actcggcttg ataagctacg tgaccgtctg cgctgaaacc atggtcgcca 8640
ccaactgtct cgtgaaaaca gaaaataccc acctagcatg taagtgcaat ccgaatagta 8700
- 143 038595
catctaccaa tggcagcaag tgccacgcga tgtgcaaatg ccgggtcaca gaacccatta 8760
ccatgctagg cgcatactcg gcctggggcg cgggctcgtt cgtggccacg ctgatagtcc 8820
tgctggtggt cttcttcgta atttacgcgc gcgaggagga gaaaaacaac acgggcaccg 8880
aggtagatca atgtctggcc tatcggagcc tgacacgcaa aaagctggaa caacacgcgg 8940
ctaaaaagca gaacatctac gaacggattc cataccgacc ctccagacag aaagataact 9000
ccccgttgat cgaaccgacg ggcacagacg acgaagagga cgaggacgac gacgtttaac 9060
gaggaagacg agaacgtgtt ttgcaccatg cagacctaca gcaactccct cacgcttgtc 9120
atagtcacgt cgctgttttt attcacagct cagggaagtt tatcgaatgc cgtcgaacca 9180
atcaaaaaac ccctaaagct cgccaactac cgcgccactt gcgaaaaccg tacacgcacg 9240
ctggttacca ggcttaacac tagccatcac agcgtagtct ggcaacgtta tgatatctac 9300
agcagataca tgcgtcgtat gccgccactt tgcatcatta cagacgccta taaagaaacc 9360
acgcgtcagg gtggcgcaac tttcacgtgc acgcgccaaa atctcacgct gtacaatctt 9420
acggttaaag atacgggagt ctaccttcta caggatcagt ataccggcga tgtcgaagct 9480
ttctacctca tcatccaccc acgcagcttc tgccgagcct tggaaacgcg tcgatgcttt 9540
tatccgggac caggcagagt cggtgtggtc acggattccc aagaggcaga ccgagcaatt 9600
atctcggatt taaaacgcca gtggtccggc ctctcactcc attgcgcctg ggtttcggga 9660
ctgatgatct ttgttggcgc actggtcatc tgctttctgc gatcgcaacg aatcggagaa 9720
caggacgttg aacatctgcg gacggacctg gatacggaac ctttgttgtt gacggtggac 9780
gggaatttgg aataaaagat gcgtaacacc tgtcgaagat gcgataactt tacatacagg 9840
caaacagtgt atacaattat agtattttgt atgttgcata aagttacatg caacagtact 9900
gctaacagta ctgcatccat tacgctatcc aacactgcct ctaccacttt tgtaaccaac 9960
atatattcaa ctccgaataa caacacatca acgacgccac acacatctgt cacctcacaa 10020
gcgtcaacca ttggcaacat caccaacgtt acctccgact tgagtacttt cacaaccgta 10080
tattctacat tcaatacatc atttgccaat atatctaata cggctgtcac tacagaattg 10140
atttcaacaa ataccaacac tatctcatct tttaccaacg taacagcaaa cgctacatca 10200
tcttataaca caacaatcac cgtaactgtc acgtcagatg aaacttcgca caacgtatcc 10260
- 144 038595
actaataatg cacttataag cacaccatgg cctacaaatt gcagcgccac aacatacacc 10320
acgtacaacc ttactaactc ttccaacgct tgtcacacag agacaacaat catacgtttc 10380
aaggaaacca atacaacagg aatagaaggg agtaatgtca ccataaaggg taattctacg 10440
tgggactgtc tttcagtcgc ctggatacga cattacaata gatccacaca cggacatcat 10500
ctaggttatc gtaagaacgc acatacccaa tcttggtatt ggctacgcat ccttacctct 10560
cacactgtat gtcattctca acatgaaaga ccttcactgt accatgactt atgtcgttcg 10620
tgcaacaaca cagaattaca tctgtacgat ctaaatatca ccaattccgg caggtacagc 10680
agacgttgtt ttaaagaaaa ttacttcaca ggacatcacg aagatgaaaa tttctaccta 10740
ttagtaacac caaaaaatca tactgaagct attaatgcta ctttcgtttg ccctagatac 10800
aacaccgata tcgaaaatga agatagagag aaaggaagtc aacatactaa caatacacat 10860
caccacaaac gtaatctcta tcatagctcg caaagaagcc gcaccgtatg gaccatcgtg 10920
ttggtttgta tggcctgcat agttctgttt tttgcacgac gagcctttaa caaaaagtat 10980
catatgttac aagacaccgt cagtgaatca gaattcattg ttcgatatca cccagaacat 11040
gaagattgag ctacgtttcc gggcagacat cttatgaagc tgaacaataa actaaaacat 11100
tctgtaagac tcagcgttca aaggaatatt aatgcccatt gagcgaaaac taatattgca 11160
atggactggc gatttacggt tacgtggacg atactaatgt ccgcgttgtc agaaagctgc 11220
aatcaaacct gttcttgtca atgtccctgt agtactaccg ttaactattc aactagtact 11280
gagacagcca catcaacata cagtacaaca gttatcagca ataaaagcac ttcagaatct 11340
ataaattgct ctactgcaac tacaccagca aacaccgttt ctacaaaacc gtcggaaaca 11400
accacacaga tatccacaac gacgaacaca aacgttgaga ctaccacatg taccaacacc 11460
accacgaccg ttacttgtga tggtttcaat tatacagtcc ataaaagatg cgatcgcagt 11520
tacgaggtaa tcaacgtaac aggatacgtt ggtagcaaca taactctaaa aaaatgcaat 11580
cagactgaga aatggcacaa tgtagactgg attcattatg agtaccccac gcataaaatg 11640
tgcgaattag gcaactatca ccaaaccaca ccacggcacg acatatgttt tgactgcaac 11700
gacacctccc taactatcta caacttaacc acaaaaaacg ctggaaaata taccaggcgt 11760
caccgtgata acggtcaaga agaaaattac tacgtaacgg tgttaattgg agacacaacg 11820
- 145 038595
ttattcactc ttggcacatg ccctgtaaga tataaagaat ctacgaacac tgaaaacacc 11880
attggaagta gcatcataga aaccattgag aaagctaaca ttcccctggg aattcatgct 11940
gtatgggcag gcgtagtggt atcagtggcg cttatagcgt tgtacatggg tagccatcgc 12000
attcccaaaa agccgcatta caccaaactt cccaaatatg atccagatga attttggact 12060
aaggcttaac atgctgatca ataaactttt tttaaccaat aacatgtctc cgtttttttt 12120
tgttaacaac ctatgatata aagcgttata ttcagtcgtt actaaacaaa aaaacatggg 12180
catgcaatgc aacactaaat tgttattgcc agtcgcacta ataccggttg caatcatcct 12240
aattggtact ctagtgccga tacttttaca tgaacaaaaa aaggcgtttt actggcgact 12300
ttttctgcaa agtcaacatg tagaagcacc cattacagta acgcagggag acacagtcta 12360
cctagacgct agcaataatc cctgtaatta ttccagcttt tggtaccacg gtaattgcga 12420
actttgtgga tggaacggat atctacgcaa tgttacacat tactacacaa acacatcgtg 12480
ttccccgcaa ttcatctgca taaacgaaac taaaggtctg cagttatata atgtaacatt 12540
aaacgattca ggcgcttata ctgaacacgt ttacgaatgt gacctttcgt gtaacattac 12600
tactaataac gaatatgaaa tactcaatta ttttgataac tgtaactaca ccataaatag 12660
caccaagcat attatcaccg tggtgtcttc acgtcattct aaacaaacaa attcccacgt 12720
atccactcac gctggttggg cagtcgccgt ggtgacggta attatgatct acgttctgat 12780
ccactttaac gtcccggcaa ctctgagaca caaactacga actagaaaca acgtaaatcg 12840
catagcgtga ttataaagta tcgacgctaa tttctccaag ataaaatttg attactccgt 12900
gcagttctca aaaactgtaa ggccccgctt ttccactccg tcatgaagga tcgcaataga 12960
atactgctat gtatcatctt tatttgcatt atgtgcctca tttgtattta ctttaaacgt 13020
cgttgtgttt ttactccgtc tccagacaaa gcagatctgc gagtggaatt tccctcgtta 13080
cccccgtgta ttggcataca gtgcgctgca tgagaacacg cgtgacacat agcgtacccc 13140
tggacggtac agtttatgat aacgtaattc agggaaagta tacattcata ccaacatgtt 13200
atcacataac acacagattt tctgcgtgtt ttataaaaga gcgtctcgaa gcagcttgag 13260
ccacactacg gtccagatga cgagcgtaat taaaaatatg ccgcgcagta ttcgaaagcc 13320
gtactgagcg tgcgaggcgg gtagggtgcc gaacgacgga tatgcgtcgt tgtcatcttc 13380
- 146 038595
gactataagg atcgcgaccg agtcttcggc catggtaaac gtcaccctgt gtggctggta 13440
tgtagcgtat ccggtttgga attgttctgc tccagctcgg gggatagtga ggaattctca 13500
agggatacgg gacccaatga ctggataaga gaagggtttt tccccgtaag atgatcctcg 13560
tatcacatga ggtctggata tgtataaatg aagagtgaaa taggcacagg gaatcagatg 13620
ccagcctcgt gatgcagccg ctggttctct cggcgaagaa actgtcgtct ttgctgactt 13680
gcaaatacat cccgccttaa gcgatgagtc tataaagcac cgttgcccga gtacggtaaa 13740
agtgacccgg attgtagaac gtcctttttt tttgtttttg catcgtttat cgtcactact 13800
agtgcaatat tttgattgta aggctgaaag agtatcgtta tgatgcttag aacgtggaga 13860
ttattacaga tggtactgct tgccgcgtac tgttattatg tttttgcgac ttgttcaatc 13920
agcacgacga ctgctcctgt ggaatggaag tctcccgacc gtcagattcc caagaatatt 13980
acctgcgcta attactcagg gaccgtcaac ggcaacgtta catttcgagg tcttcagaac 14040
aaaacggaag actttttgta ctggttgtta ggatggggtc ataagtccat ttgttcgttc 14100
ttcccgaaac tccagggtaa ctatgacgaa caacattaca gatatgaagt agcgaacctg 14160
acgtataact gcacctataa ccgcttgacg ttgctgaatc tgacgacgga aaacagcgga 14220
aagtactatt tcaaaaggga agatgcgaat ttcaccttct attactcttg ttacaacttg 14280
accgtgtcct aaagatcgca cgtgaagttt cacagagccg cgtggctgta gctattgtgt 14340
ttacgttgct tttgaaatgt taagcgtccc tacggcgcta acatgtttct aggctactct 14400
gactgtgtag atcccggcct tgctgtgtat cgtgtatcta gatcacgctt aaagctcatg 14460
ttgtcttttg tgtggttggt cggtttgcgt ttctatgatt gtgccgcgtt cgagtcctgc 14520
tgttacgaca tcaccgaggc ggagagtaac aaggctatat caagggacga agcagcattc 14580
acctccagcg tgagcacccg tacaccgtcc ctggcgatcg cgcctcctcc tgaccgatcg 14640
atgctgttgt cgcgagagga agaactcgtt ccgtggagtc gtctcatcat cactaagcag 14700
ttctacggag gcctgatttt ccacaccacc tgggtcaccg gcttcgtcct gctaggactc 14760
ttgacgcttt tcgccagcct gtttcgcgta ccgcaatcca tctgtcgttt ctgcatagac 14820
cgtctccggg acatcgcccg tcctctgaaa taccgctatc aacgtcttgt cgctaccgtg 14880
tagctagtta gccagctgtg tgtagtgttt tgcttttgca tatttgtttt cagtcagaga 14940
- 147 038595
gtctgaaacg gggtgggagg gacttttgcg ggtagtgcat gctaagatga acgggtgggc 15000
tggggtgtgc ttgataactc actgtttgaa tacgcgctca cgcacatatg tagcactcaa 15060
catgttagct tttgcccgca cgccccgggg cgtgccgagc tgccttttta ataaagtctg 15120
ggtttccaga tacgcgctgg ttctgatttt gatggtttgt gcctctgaaa gctctacgag 15180
ctgggccgtg acatccaatg gactgcctaa ctgtagcacg gtaactagaa cagcgggtca 15240
agacgctgaa ttgcacggtc cggcaccgtt aagctgtaat gtgacccagt ggggacgtta 15300
cgagaatgga agcacacccg tgttatggtg cactttacgg ggatcaagca tgcgagtctc 15360
attaggacac cgtgtagcgt ttggctgttc ttggaaaaca ttttttattt ataacgtttc 15420
tgaaagtagc ggtggcactt actatcaaaa aggttacaac tgcaccgaca aacatataac 15480
actatcttgt ttcaacttaa cggtggttcc tcgagcggtt caaagcacaa ccaccgtaat 15540
gacacccacg ctggttacaa actccacatt cagtgtgtca cttgttccgt tgagactgac 15600
gacaaattcc agcgcgtttg gacacgctat ttatcaacga caacagcgtg ttgaaaacgg 15660
gacgttatcc aagaacataa ctaacttggc attcacctat ggcagctggg gcgttgcgat 15720
gctgctgttt gccgccgtga tggtgctcgt tgatttgggt ttgcctcaat cggcttggcg 15780
acgctggcga agccacgtgg acgatgaaga acgtggtttg ttaatgtagg aaataaaagg 15840
cagtttgagc atgactgttt ccaaaccgta acgtggtaaa taaatcatgg cttccgacgt 15900
gggttctcat cctctgacgg ttacacgatt tcgctgcaga gtgcattatg tgtacaataa 15960
actgttgatt ttaactttgt ttgcccccgt gattctggaa tccgtcatct acgtgtccgg 16020
gccacaggga gggaacgtta ccctggtatc caacttcact tcaaacatca gcgcacggtg 16080
gttccgctgg gacggcaacg atagccatct catttgcttt tacaaacgtg gagagggtct 16140
ttctacgccc tatgtgggtt taagcctaag ttgtgcggct aaccaaatca ccatcttcaa 16200
cctcacgttg aacgactccg gtcgttacgg agcagaaggt tttacgagaa gcggcgaaaa 16260
tgaaacgttc ctgtggtata atttgaccgt gaaacccaaa cctttggaaa ctactccagc 16320
tagtaacgta acaaccatcg tcacgacgac atcgacgatg atcgacgcga aaagtaacgt 16380
tacagggaac gccagtttag caccacaatt acgtgccgtc gctggattct ccaatcagac 16440
gcctttggaa aacaacacgc acctggcctt ggtaggtgtt gttgtgtttt tagttctgat 16500
- 148 038595
agttgtttgc attatggggt ggtggaaatt gttgtgtggt aaaccagagt tatagtaatg 16560
tgctttttat cagggagaag gttttgtgcc aacaatgact agcccgggac tatctgcgtc 16620
agaaaattat gacggaaatt atgaattcac ggaaaccgcc aatacaacgc gtacaaatag 16680
aagtgactgg acaacgttag aaaccagtgc attgctattg aaaaacacgg agactgcagt 16740
gaacctcagc aacgcgacta cggtcatccc acaacctgta gaatacccgg ctggggaagt 16800
acaatatcaa agaacggcaa cgcattattc ttggatgcta atcattgtca tcattctcat 16860
catttttatt atcatctgtc tacgagcacc tcgaaaaatc taccatcact ggaaagacag 16920
taaacagtac ggacaagtgt ttatgacaga cacggaactg tgacagtgat gtctaagcgt 16980
ttgcaggtat ttccatggat aacaatttta ttttacacat caaaatccca gtattggaac 17040
tatatggcaa taccatgtac ccctacagtt ggatacggca gtcataatat tagcttgcat 17100
ccgcttaata actcattatt tcaagacgat gtttttgaat ggtacataga caaaccaatg 17160
gttacaagtt atgtctttat caaagtaatg aacgcacaaa atccaatcta gactctccaa 17220
atattgtgtg gcaatgcaca gataatcgta cactaattct catgaactta accacaacat 17280
acagtagaaa ctattatttt caatccttta aatatctcgg acgaggagta ccaaaaccga 17340
ataacttgtg ttataacgtt agtgtacact ttacccacca aacacattgc catacaacta 17400
catcatccct gtatccacct acatctgtac acgattcatt agaaatatca cagtcattca 17460
cctcaaccaa cttcacacat accgcggtcc actacgccac cggtaacgtt gaagcacaac 17520
acgacactac cactccacat acaatgtgga tcatacccct agttatcgtt ataacaatca 17580
tcgttttaac ttgtttcaaa ttcccccaga aagcttggaa taaattcaca caatacagat 17640
acagcggtat gctcgccgcc gcttaaagaa tcaacgccaa ggaaaccaaa acgtaaaaag 17700
aatagatatg tacgtttatt tttcagctca ctgtttgaat accgtaaaca taatgacgta 17760
catatacgtg gttatacaac aggtgtttgt gttatgcggc gactgattaa ccatatcgtg 17820
aaccatgatc ttttccgatg gtccgtcgtg accgcaatga tattttacag atattccgaa 17880
acctgtatgg aggtcactgt cagagtaggt gatccagtta ccctcggtag tggacatggt 17940
tatcatccag gtagggataa cagggtaatg atcctctaga gtcgacctgc aggcatgcaa 18000
gcttgagtat tctatagtct cacctaaata gcttgg 18036
- 149 038595 <210> 12 <211> 2310 < 212> ДНК < 213> последовательность gp49 LKA1 <400> 12
atggcgcaaa cacccagtac atgggccgac tacgtaggcg acggcgtaga ggatacgttc 60
caagtcacat tcccgtacca gaagcagcaa gaggtgtttg tgactgtggg cggcgatccg 120
gcagctttca cattcatctc ggcaggttgg attcaactgg cagcggtccc ggtaaatggg 180
gccgcaatcc gtgtacggcg cagcactgag gcattcgagc ctcggcacga gttcgccaac 240
ggcgtgccat tactgccgcg attcatagac gagaataata cccagttctt gtacactgta 300
caagaggcag tgaatgagac acatggcatt gcttccgaag cgctgagtgt cgcagaggag 360
gccagaggca ttgcgcaggc ggcatcggat aaagtggatg ctgccaccat tgactccgca 420
caccagttgc gtctagacct cgccgacccg gcgaaggggc ctgggctgct aggctacgac 480
cgagacgtaa gttatccggt cgggtcggtc ggtcaaagcc tacagtttct ggaaatgggt 540
cgggtcacac cagcgcaatt tggcgccgtt ggtgatggcg ccagccaccc cctctctgag 600
cgatacgcaa ctctagcgga agctcagact gtctatccgc atgcagtcgc actctccgac 660
gaaatagact gggccgcatt gcaagctgcc gtggattcag gggcacctgt acacataccg 720
tctggggact atcagataaa tagggggatt agcagtacgg gctctctaca gattgcgggt 780
gatggcgcta catctattat acgcccgact gctgcgttca ctggtacatc ggtcctcagt 840
tgtgtgggga gcttagttgc cttgccgaat atatcctccg tgtcggctgg gtccctaacc 900
attgactttg ccagcacccc taatcttgta gcgggggatg tattcatcat ctacaacccg 960
actgatagca gcttctcggg atttcggacg agctatcgcg caggagagtt ctgtgaggtc 1020
agggcggttt ctgggaacac cgtgacaatc cgttccgcac tctatgccgc atacgacggg 1080
gctactgttg ctatttacaa agtagtctct ggtgtagttg atatagctag catccaaatc 1140
gttggcggga cagtcccaat gaatggactg ttagtggagg ctgtcgtttc accgcgcgtc 1200
gatgacgtga cggtcaccct tgcaaacaac gccggtgtgt attttgcccg ctgctatgac 1260
gctaagatca caaacagtaa tatatcgaac atcggcgacg gtggcgatga ctatggaatc 1320
atctttggga actgtcacga cggtggggca gacaactgta aagtctacgc taggcgacat 1380
- 150 038595
gccatcgcca cgggcggcga tgcagaagta ggctgcgttc cggtccgtaa tgtgcgtatg 1440
cgtaactgca cacttaggaa tgatattacc tctggtacac actgcgcaga cttccacggt 1500
aacgccgagg attgcagcta cgaaaactgc acaatctacg gtggtgcaac ttggcagggg 1560
aaggatatca gctacagaca ctgtacaatc actaacgcgt cgggtggttg gattgttata 1620
tccgctgaga ttcttggtgg tacattcctt ctcgaccaat gcacattgta cacaaccggc 1680
gatccgcagc ctggtaaccg tggggttata gatgtaggtg ggaactccgc agtcctcact 1740
acaaatacaa cgcaaccctg taacttcctt atacaaggcg gcagtctgcg agcgcccagc 1800
ttaagtacgt ctagttacct actgcgcgca cgtcttgagg gtagtacagt tccagtaaac 1860
atacagtaca gcggacaggc tattgatgta ggctctctgg gcaaggtact acaactcgat 1920
attacctcgg gcagtacctc tcctgagtat ttgatcgtgg agaatttagc ggggttgcca 1980
tctggcatca cgctggcgtc tgctgctggt ggtttcgcaa gtgccccgat gcgtatgcct 2040
gtgctgggtg gtagggttca agtaactacg gcaaccaacg cgagtagcgt tactgctcca 2100
gtaacgttca ggtacattta tcctaaggcc ccaaccgtcc aggtcacaaa gacggacagg 2160
agctacgccg gtaacagggt cggcgttgct atcgccaatc cgacctctgc gtctggggcg 2220
acgttgggtc tgttcacgga cgacgggaca aactttagct cagccgttac taaccagttg 2280
aactggcagg caggtattta tgaggtgtaa 2310
< 210> 13 < 211> 1956 < 212> ДНК < 213> Phikmvlikevirus NTUH-K2044-K1-1 <220>
< 221> misc_feature < 223> gp34 NTUH-K2044-K1-1 <400> 13
atggccctga tccggctcgt ggcgcccgag cgcgtgttca gcgacctggc cagcatggtc 60
gcctatccga acttccaggt gcaggacaag atcaccctgc tgggctcggc cggcggcgac 120
ttcaccttca ccaccaccgc gtcggtggtg gacaacggca ccgtgttcgc cgtgcccggc 180
ggctatctcc tgcggaagtt cgtcggcccg gcgtatagct cgtggttcag caactggacc 240
- 151 038595
gggatcgtca cgttcatgag cgcgccgaac cggcacctgg tggtggacac cgtgctgcag 300
gccacgagcg tgctgaacat caagagcaac agcacgctgg aattcacgga cacgggccgc 360
atcctgcccg acgccgccgt ggcccgccag gtgctgaaca tcaccggctc cgcgccctcg 420
gtgttcgtgc ccctcgccgc cgacgccgcc gcggggtcga aggtgatcac cgtggccgcc 480
ggcgcgctgt ccgcggtgaa aggcacctac ctctatctgc gctccaacaa gctgtgcgac 540
ggcgggccga acacctatgg cgtcaagatc agccaaatcc gtaaggtggt cggcgtgagc 600
accagcgggg gcgtgacgtc catccgcctc gacaaagccc tgcactataa ctactacctc 660
tcggatgccg ccgaagtggg catcccgacc atggtggaga acgtcaccct ggtgagcccg 720
tacatcaacg agttcggcta cgacgacctg aaccgcttct tcaccagcgg catctccgcg 780
aacttcgcgg ccgacctgca catccaggac ggcgtcatca tcggcaacaa gcgtccgggc 840
gcctccgaca tcgagggccg cagcgccatc aagttcaaca actgcgtgga tagcaccgtg 900
aagggcacct gcttctataa tatcggctgg tacggcgtgg aggtcctcgg ctgctcggag 960
gacaccgagg tgcacgacat ccacgccatg gacgtgcgcc atgccatctc cctgaactgg 1020
caaagcaccg ccgacggcga taagtggggc gaaccgatcg agttcctggg cgtgaactgt 1080
gaggcgtaca gcaccaccca ggccggcttc gacacccacg acatcgggaa gcgtgtcaaa 1140
ttcgtccgct gcgtgtccta cgacagcgcg gatgacggct tccaggcccg caccaacggc 1200
gtggagtacc tcaactgccg cgcctaccgc gccgccatgg acggcttcgc ctcgaacacg 1260
ggcgtcgcct tcccgatcta ccgcgaatgc ctggcctacg acaacgtgcg cagcgggttc 1320
aactgcagct acggcggcgg gtatgtgtac gactgcgagg cgcacggcag ccagaacggc 1380
gtccgcatca acggcggccg ggtcaaaggc gggcgctaca cccgcaactc gtcgagccac 1440
atcttcgtga cgaaagatgt ggcggaaacc gcccaaacca gcctcgagat cgacggcgtc 1500
tccatgcggt acgacggcac cggccgcgcc gtgtacttcc acggcaccgt gggcatcgat 1560
ccgacgctcg tgagcatgtc caacaacgac atgaccggcc acggcctgtt ctgggccctg 1620
ctgtccggct ataccgtgca gccgaccccg ccgcgcatgt cgcgcaacct gctcgacgat 1680
accggcatcc gcggcgtcgc gaccctggtc gcgggcgaag cgaccgtcaa tgcccgcgtc 1740
cgcgggaact tcggcagcgt ggccaacagc ttcaagtggg tgtcggaggt gaagctgacg 1800
- 152 038595
cgcctcacgt tcccgtcgtc ggccggcgcc ctcacggtca ccagcgtcgc ccaaaaccag 1860
gacgtgccga cccccaaccc ggacctgaac agcttcgtca tccgcagcag caacgccgcc 1920
gacgtgtccc aagtcgcctg ggaggtctac ctgtga 1956
<210> 14 < 211> 2184 < 212> ДНК < 213> Т7-подобный Ppl5 <220>
< 221> misc_feature < 223> добавлена последовательность gp44 Ppl5 <400> 14
atggcacgaa ctatcgtcca gaacgcccta acaggcggac aacaggactt cgaggtacct 60
ttcgactaca tcttgcagcg cttcgttaag cttaccctga tcggtgacgg taaccgacaa 120
gagctggtcc tcggtaccga cttccggttc atcggtcctc gcaccgttcg cactaacgtc 180
ttctggggac cagcgcaggg gtatacctcc atcgagatcc gacgagttac cagcgcttct 240
gatcgtcgcg tagagttctc ggacgggtcc atcctgaccg caggtgatct gaacatcgcc 300
cagcttcagg ccatccacat tgccgaagaa gcgcgagact ctgccactga gaacctgagc 360
ccagatgctg atggcaacta cgatgcacgt ggtgcgcgca tttacaacct cggtgacgct 420
gttcagccga aggatgcggt caaccggtac actcttgacc tcgctatcgc agccgctctg 480
gccatgaata ccggcaaccc gaacaacgcc cagaacatct cgtacacccc taacgggcct 540
ggtcagtcga tccgaagtgt tgaaggccgt ctgcgggatg ctgtgttcgt ctcggactac 600
atgaccactc cacgtgatgg agttaccagt aaccagcagg acctcgaaaa ggcactcgct 660
gcggcgaacg ctaaaggtgc cgacctattc tggcctgacg acatcccgtt cttctccacg 720
tccccgctgg cactgatcca cgcggtctac catgttggac gtggtgtcat caacgcgaac 780
ggtacgctgt tctacgtgaa cccgaagaac ggccaacaca acaggctaca cgtgtctccc 840
gggggcaccg gggatggtct ggcagctggc cgcccactgg ggaccatctg gagtgcactc 900
gcggccctta acatgcgagc cccactgacc acgcgctggt ccttggagat gaccgctggc 960
gcctataatg aagccgttac acttccgaac tacctgacca gctgtaacga ctacttggcg 1020
- 153 038595
tttaactggc cgaacaccgg tcaggaacgt atggagccca ctgcgtaccc atcagctctc 1080
gacggcacag gccagaccgg cctcacaggt ttccacactg gcatcggcaa ccgcattacc 1140
atcaacaacg tgtgcatgtc caactggtac gacactgcgc tgactcctac ccaacaggtg 1200
cgaagagcgt tcgttgtagg tgcgtattcg actgcctacg tggtcaactg cgcgttcatt 1260
tacaacggca tcgcgagcgt gtctgtgctg cccggtggca ctgctatcgt aaccggtggc 1320
atcgtcgatg gtgggcggtt cggcctcgac aacactggcg gtcgcctgtc cctgacggca 1380
accaagagca attatacgca ggtccggaac tgcctcgaat atggactgta ctcgaagcat 1440
gacgcatcga ccgtaatgga caacaccgag ttccgcaact gcggtaatca ccctgcggct 1500
gttgcgtatg gtgctgcaat cttcgcgtac aagttcaact gttctgttga cactcgtggg 1560
gtcaagttct acggcaacaa catcgcccag cactgccgtg gcggtatcac ctcggacaat 1620
ccgggcgatc cggacatcta cggtaccggc gcagatgcta ataagcgtct attcctgtgc 1680
accggtggtg gctctgacga catccagttc tacgaagctc ggcgcgtcat ggacatcacg 1740
aagcgcactg gtggcggctc aactactgcc agcgtatcgt cgctgctact ggctgccgtt 1800
gcgtctgtcc gtaagggcta ctttgcgcac aacgatcagg tgatccggat gaccctgatg 1860
ttccgcgcta caggctcggc tggcatcttc acgccgacct tgcgcacacc tctggggact 1920
atccctctgg gtagcttcag ggtcgcatcg ggacagtacg gcgagatcaa gttgaccatt 1980
cgacctactc tgacatctga tggtctcata gtcgggttct cctgcatcaa cgccgtgcag 2040
aatcttgggt cctctgttgg tcaaatcatc gtcagcggca ccgtagacct ccgcaccgtc 2100
gaccagctgg tcgagatgtg gggctattcg gaagctggtg gcaccgcttc gtacattcaa 2160
ggcctgatcg agctggtcgg gtga 2184
< 210> 15 < 211> 1089 < 212> ДНК < 213> Aggregatibacter actinomycetemcomitans <220>
< 221> misc_feature <223> добавлена последовательность dspB
- 154 038595
<400> 15
atgaactgtt gcgtcaaggg caattccatc tacccccaga agacctccac caagcagacc 60
ggcctgatgc tcgatatcgc ccggcatttc tacagccccg aggtgatcaa gagcttcatc 120
gatacgatca gcctgagcgg cggcaacttc ctccacctgc acttctcgga ccatgaaaac 180
tatgccatcg agtcgcacct gctcaaccag cgggcggaga acgccgtcca ggggaaggat 240
ggcatctaca tcaatccgta caccgggaaa ccgttcctga gctaccgcca gctggacgac 300
atcaaggcct acgccaaggc caagggcatc gaactgatcc cggagctgga cagcccgaac 360
catatgacgg ccatcttcaa actggtccag aaggaccgcg gcgtcaagta cctgcagggg 420
ctgaaatccc gccaggtgga cgacgagatc gacatcacca acgccgatag catcaccttc 480
atgcagagcc tgatgagcga ggtcatcgat atcttcggcg acacgagcca gcacttccac 540
atcggcggcg acgaattcgg ctactccgtc gagagcaacc acgagttcat cacctacgcc 600
aacaagctgt cgtacttcct ggagaagaag gggctcaaga cccgcatgtg gaacgacggc 660
ctcatcaaga acaccttcga gcagatcaat cccaacatcg aaatcacgta ctggtcgtac 720
gacggcgaca cccaggataa gaacgaagcg gccgagcgcc gcgacatgcg cgtgagcctg 780
ccggagctgc tggcgaaggg cttcaccgtg ctgaactaca acagctacta cctctacatc 840
gtgccgaagg cgagcccgac gttctcgcag gacgccgcct tcgccgccaa agacgtgatc 900
aagaactggg atctgggcgt ctgggatggc cggaacacca agaaccgcgt gcagaacacc 960
catgagatcg ccggggcggc gctgtcgatc tggggcgagg atgcgaaggc gctcaaggac 1020
gagacgatcc agaagaacac caaaagcctg ctcgaggccg tcatccacaa gaccaacggc 1080
gacgagtga 1089
<210> 16 <211> 69 <212> ДНК <213> Staphylococcus aureus
<220>
<221> misc_feature <223> добавлена последовательность SaPSMa3 <400> 16 atggagttcg tggcgaagct cttcaagttc ttcaaggacc tgctcgggaa gttcctgggg 60
- 155 038595 aataactga < 210> 17 < 211> 135 < 212> ДНК < 213> Staphylococcus aureus <220>
< 221> misc_feature < 223> добавлена последовательность SaPAMb2 < 400> 17 atgaccggcc tggccgaggc gatcgcgaat accgtccagg cggcccagca gcacgacagc 60 gtcaagctgg gcacctcgat cgtggacatc gtcgccaacg gcgtgggcct gctgggcaaa 120 ctcttcggct tctga 135 < 210> 18 < 211> 69 < 212> ДНК < 213> Staphylococcus epidermidis <220>
< 221> misc_feature <223> добавлена последовательность SePSMa <400> 18 atggcggacg tcatcgccaa gatcgtcgag atcgtgaagg gcctgatcga ccagttcacc cagaagtga <210> 19 <211> 228 < 212> ДНК < 213> Levivirus MS2 <220>
< 221> misc_feature <223> добавлена последовательность L MS2 <400> 19 atggagaccc ggttcccgca gcagtcccag caaaccccgg ccagcaccaa ccgccgccgc 60 cccttcaagc acgaggacta cccgtgccgc cggcagcagc gcagctccac cctgtacgtg 120
- 156 038595 ctgatcttcc tggcgatctt cctgagcaag ttcaccaacc agctgctgct gtccctgctg 180 gaggcggtca tccggaccgt caccaccctg cagcagctgc tgacctga 228 <210> 20 <211> 165 < 212> ДНК <213> Levivirus PRR1 <220>
< 221> misc_feature < 223> добавлена последовательность L PRR1 < 400> 20 atgtgcaagg tgtctactaa ggtagactct aaactgactg agtcagttgg acaactcacc60 ataaggagct acctatggct acggaatatc ctagcattag caggacttct tttcgtaatc120 cttcttgcga ccaatcattt atccatcgct atctacagtc cgtaa165 < 210> 21 < 211> 52 < 212> ДНК <213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature < 223> промотор gp32 (P32) LUZ19 < 400> 21 cgaccctgcc ctactccggc cttaaaccca catccaaaag agagagaatc gc 52 < 210> 22 < 211> 96 < 212> ДНК < 213> Phikmvlikevirus LUZ19 <220>
<221> misc_feature <223> терминатор gp32 (T32) LUZ19 <400> 22 tgccacgaaa ccccgcactt cggtgtgggg tttcttcaaa gcctaacgac ccgcgcagat 60 tccctgcgtg ggtttttgcg ctttaggaga aaccct
- 157 038595 <210> 23 <211> 204 <212> ДНК <213> Phikmvlikevirus LUZ19 <220>
<221> misc_feature <223> область gp7 LUZ19 дикого типа <400> 23
tacaaggtgg tggcacccag ctcggcggaa ggtatcattg tgctggcgac caagcagacg 60
ccggcgctag cccaagcagc cgtcgtactg cacagcatga accctgcgca gtatcccgca 120
ggttcggcta tcctcaacac ggcctggaag tgccgccgcc tgggagtggg cgagtacgtc 180
aagctcgtcc aaggggagga ggac 204
<210> 24 <211> 321 <212> ДНК <213> Phikmvlikevirus LUZ19 <220>
<221> misc_feature <223> область gpl8 LUZ19 дикого типа <400> 24
gaatgccaac cgaagaagaa cgcatgatcc gctgtttact ggcggatatc cacgagccac 60
tggacctgct gttccccggc ctccgtacca aggcccatat ggacccgcaa gcagaggaac 120
tgtcgattcg aattgactac gaccatgcga agctgggccg tatgggattc tgccacgcgg 180
tatccctata tcaactgtcc atatatggcc gcgaggggat ggtccgctac ctgatgcagg 240
agattccccg ccgcgtgctg gaaggtctgc tggtcaaggc gcagcagtac agccaaagca 300
actggtacag caaatgacga c 321
<210> 25 <211> 225 <212> ДНК <213> Phikmvlikevirus LKD16
- 158 038595
<220>
<221> misc_feature <223> gp49 и межгенная область gp48-gp49 LUZ19 дикого типа
<400> 25 ggggacacca tgagcaaagc caaactacga gtcatcgccg acaccccgga gctggagtca 60
gtgctaaaag cattgctgac cgccacctac gctatcgagg acctgctcaa cgaggccgtg 120
gctagcaagg tgctaaactc ccgcctgggc tggtccgcag tcggcgagta tgtcgaactg 180
ttcaaccgca cgcaatcccg cgtggccggg ttgattcccg agtag 225
<210> 26 <211> 345 < 212> ДНК < 213> Phikmvlikevirus LKD16 <220> < 221> misc_feature < 223> ген gpl8 LKD16 дикого типа < 400> 26 gtgcgagtac caactgaaca cgagcgcacc ctgcgctgcc tgctccaaga catccacggg 60
ccgctgaatc tgctgttccc aggtatccgg gtgaaggtgg aggaggcgtg cctcggatac 120
ttgggctaca gggagcgggg ctattgggag ctgcgcctcc aggtggacta cgaccacccg 180
aagcttgggc acctccgcta cagtcaggcc gtgccggagt acgtgctgat caacgaccgc 240
gacagcatca tcaagtacct gatggaagca gtccctcggc aggtactaga gggcatgctc 300
aataaggccc aggaattcgt aaccaagaac tggtattccc tatga 345
<210> 27 <211> 4269 < 212> ДНК < 213> Искусственная последовательность <220> < 223> ген, кодирующий l\ILS-FLAG-CAS9-His <400> 27 atgcccaaga aaaagcggaa ggtcggcgac tacaaggatg acgatgacaa gttggagcct 60
ggagagaagc cctacaaatg ccctgagtgc ggaaagagct tcagccaatc tggagccttg 120
acccggcatc aacgaacgca tacacgagac aagaagtact ccatcgggct ggacatcggg 180
- 159 038595
acgaactccg tgggatgggc cgtgatcaca gacgaataca aggtgccttc caagaagttc 240
aaggtgctgg ggaacacgga cagacactcc atcaagaaga acctcatcgg ggccttgctc 300
ttcgactccg gagaaaccgc cgaagcaacg cgattgaaaa gaaccgccag aagacgatac 360
acacgacgga agaaccgcat ctgctacctc caggagatct tcagcaacga gatggccaag 420
gtggacgact cgttctttca tcgcctggag gagagcttcc tggtggagga agacaagaaa 480
catgagcgcc acccgatctt cgggaacatc gtggacgaag tggcctacca cgagaaatac 540
cccacgatct accacttgcg caagaaactc gtggactcca cggacaaagc ggacttgcgg 600
ttgatctact tggccttggc ccacatgatc aaatttcggg gccacttcct gatcgagggc 660
gacttgaatc ccgacaattc cgacgtggac aagctcttca tccagctggt gcagacctac 720
aaccagctct tcgaggagaa ccccatcaat gcctccggag tggacgccaa agccatcttg 780
tccgcccgat tgtccaaatc cagacgcttg gagaacttga tcgcacaact tcctggcgag 840
aagaagaacg gcctcttcgg caacttgatc gcgctgtcgc tgggattgac gcctaacttc 900
aagtccaact tcgacttggc cgaggacgcc aagttgcaac tgtccaagga cacctacgac 960
gacgacctcg acaacctgct ggcccaaatt ggcgaccaat acgcggactt gtttttggcg 1020
gccaagaact tgagcgacgc catcttgttg agcgacatct tgcgcgtgaa tacggagatc 1080
accaaagccc ctttgtccgc ctctatgatc aagcggtacg acgagcacca ccaagacttg 1140
accctgttga aagccctcgt gcggcaacaa ttgcccgaga agtacaagga gatcttcttc 1200
gaccagtcca agaacgggta cgccggctac atcgacggag gagcctccca agaagagttc 1260
tacaagttca tcaagcccat cctggagaag atggacggca ccgaggagtt gctcgtgaag 1320
ctgaaccgcg aagacttgtt gcgaaaacag cggacgttcg acaatggcag catcccccac 1380
caaatccatt tgggagagtt gcacgccatc ttgcgacggc aagaggactt ctacccgttc 1440
ctgaaggaca accgcgagaa aatcgagaag atcctgacgt tcagaatccc ctactacgtg 1500
ggacccttgg cccgaggcaa ttcccggttt gcatggatga cgcgcaaaag cgaagagacg 1560
atcaccccct ggaacttcga agaagtggtc gacaaaggag catccgcaca gagcttcatc 1620
gagcgaatga cgaacttcga caagaacctg cccaacgaga aggtgttgcc caagcattcg 1680
ctgctgtacg agtacttcac ggtgtacaac gagctgacca aggtgaagta cgtgaccgag 1740
- 160 038595
ggcatgcgca aacccgcgtt cctgtcggga gagcaaaaga aggccattgt ggacctgctg 1800
ttcaagacca accggaaggt gaccgtgaaa cagctgaaag aggactactt caagaagatc 1860
gagtgcttcg actccgtgga gatctccggc gtggaggacc gattcaatgc ctccttggga 1920
acctaccatg acctcctgaa gatcatcaag gacaaggact tcctggacaa cgaggagaac 1980
gaggacatcc tggaggacat cgtgctgacc ctgaccctgt tcgaggaccg agagatgatc 2040
gaggaacggt tgaaaacgta cgcccacttg ttcgacgaca aggtgatgaa gcagctgaaa 2100
cgccgccgct acaccggatg gggacgattg agccgcaaac tgattaatgg aattcgcgac 2160
aagcaatccg gaaagaccat cctggacttc ctgaagtccg acgggttcgc caaccgcaac 2220
ttcatgcagc tcatccacga cgactccttg accttcaagg aggacatcca gaaggcccaa 2280
gtgtccggac aaggagactc cttgcacgag cacatcgcca atttggccgg atcccccgca 2340
atcaaaaaag gcatcttgca aaccgtgaaa gtggtcgacg aactggtgaa ggtgatggga 2400
cggcacaagc ccgagaacat cgtgatcgaa atggcccgcg agaaccaaac cacccaaaaa 2460
ggacagaaga actcccgaga gcgcatgaag cggatcgaag agggcatcaa ggagttgggc 2520
tcccagatcc tgaaggagca tcccgtggag aatacccaat tgcaaaacga gaagctctac 2580
ctctactacc tccagaacgg gcgggacatg tacgtcgacc aagagctgga catcaaccgc 2640
ctctccgact acgatgtgga tcatattgtg ccccagagct tcctcaagga cgacagcatc 2700
gacaacaagg tcctgacgcg cagcgacaag aaccggggca agtctgacaa tgtgccttcc 2760
gaagaagtcg tgaagaagat gaagaactac tggcggcagc tgctcaacgc caagctcatc 2820
acccaacgga agttcgacaa cctgaccaag gccgagagag gaggattgtc cgagttggac 2880
aaagccggct tcattaaacg ccaactcgtg gagacccgcc agatcacgaa gcacgtggcc 2940
caaatcttgg actcccggat gaacacgaaa tacgacgaga atgacaagct gatccgcgag 3000
gtgaaggtga tcacgctgaa gtccaagctg gtgagcgact tccggaagga cttccagttc 3060
tacaaggtgc gggagatcaa caactaccat cacgcccatg acgcctacct gaacgccgtg 3120
gtcggaaccg ccctgatcaa gaaatacccc aagctggagt ccgaattcgt gtacggagat 3180
tacaaggtct acgacgtgcg gaagatgatc gcgaagtccg agcaggagat cggcaaagcc 3240
accgccaagt acttctttta ctccaacatc atgaacttct tcaagaccga gatcacgctc 3300
- 161 038595
gccaacggcg agatccgcaa gcgccccctg atcgagacca acggcgagac gggagagatt 3360
gtgtgggaca aaggaagaga ttttgccaca gtgcgcaagg tgctgtccat gcctcaggtg 3420
aacatcgtga agaagaccga ggtgcaaaca ggagggtttt ccaaagagtc cattttgcct 3480
aagaggaatt ccgacaagct catcgcccgc aagaaggact gggaccccaa gaagtacggg 3540
ggcttcgact cccccacggt ggcctactcc gtgttggtgg tggccaaagt ggagaaaggg 3600
aagagcaaga agctgaaatc cgtgaaggag ttgctcggaa tcacgatcat ggaacgatcg 3660
tcgttcgaga aaaaccccat cgacttcctc gaagccaaag ggtacaaaga ggtgaagaag 3720
gacctgatca tcaagctgcc caagtactcc ctgttcgagc tggagaacgg ccgcaagcgg 3780
atgctggcct ccgccgggga actgcagaaa gggaacgaat tggccttgcc ctccaaatac 3840
gtgaacttcc tctacttggc ctcccattac gaaaagctca aaggatcccc tgaggacaat 3900
gagcagaagc aactcttcgt ggaacaacac aagcactacc tggacgagat catcgagcag 3960
atcagcgagt tctccaagcg cgtgatcctc gccgacgcca acctggacaa ggtgctctcc 4020
gcctacaaca agcaccgcga caagcctatc cgcgagcaag ccgagaatat cattcacctg 4080
tttaccctga cgaatttggg agcccctgcc gcctttaaat actttgacac caccatcgac 4140
cgcaaaagat acacctccac caaggaagtc ttggacgcca ccctcatcca ccagtccatc 4200
acgggcctct acgagacgcg catcgacctc tcccaattgg gcggcgacca tcatcaccac 4260
caccactaa 4269 <210> 28 < 211> 507 < 212> ДНК < 213> Inovirus M13MP18 <220>
< 221> misc_feature < 223> заменена область M13MP18 дикого типа <400> 28
atgaccatga ttacgaattc gagctcggta cccggggatc ctctagagtc gacctgcagg 60
catgcaagct tggcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 120
acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag 180
- 162 038595
gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgctttgcc 240
tggtttccgg caccagaagc ggtgccggaa agctggctgg agtgcgatct tcctgaggcc 300
gatacggtcg tcgtcccctc aaactggcag atgcacggtt acgatgcgcc catctacacc 360
aacgtaacct atcccattac ggtcaatccg ccgtttgttc ccacggagaa tccgacgggt 420
tgttactcgc tcacatttaa tgttgatgaa agctggctac aggaaggcca gacgcgaatt 480
atttttgatg gcgttcctat tggttaa 507
< 210> 29 < 211> 792 < 212> ДНК < 213> Искусственная последовательность <220>
< 223> Неизвестный <220>
< 221> misc_feature < 223> последовательность Paprika <220>
< 221> misc_feature < 223> коммерчески доступный из ДНК2.0 <400> 29
atggtgtcaa agggagaaga actgatcaaa gagaatatga ggatgaaact ctacatggaa 60
ggaactgtga acaaccacca tttcaagtgc acgagcgagg gtgaagggaa accttacgaa 120
ggtacccaga ccatgcggat taaggtcgtc gaaggaggac cactcccctt cgcattcgac 180
atcctggcca cttccttcat gtacgggtcg cgcactttca tcaagtaccc aaaagggatc 240
cccgacttct tcaagcagtc ctttccggag ggattcactt gggaacgcgt cactagatac 300
gaggatggcg gagtggtcac cgtgatgcaa gacacctctt tggaagatgg atgcctggtg 360
taccacgtgc aagtcagagg agtgaacttt ccgagcaatg ggccggtgat gcagaagaaa 420
accaagggct gggaaccgaa caccgaaatg ctgtatccag cagacggagg cttggagggc 480
cggtccgaca tggctctgaa gcttgttgga ggaggacatc tgtcctgctc gttcgtgacg 540
acctaccgga gcaagaagcc ggcgaaaaac cttaagatgc cggggatcca cgcggtggat 600
catcgcctgg aaaggctcga ggagtcagac aacgagatgt ttgtcgtgca acgcgagcac 660
- 163 038595 gccgtggccc gctactgtga tctcccttca aagctgggcc acaagctgaa ttccggcctc
720 cggtcgagag cccaggcttc gaattcagcc gtggacggaa ctgcgggccc tggttcgacc
780 ggaagccgat ga
792 <210> 30 <211> 294 <212> ДНК <213> Lambdavirus лямбда <220>
< 221> misc_feature < 223> фаг дикого типа E. coli < 400> 30 atggttcgtg caaacaaacg caacgaggct ctacgaatcg agagtgcgtt gcttaacaaa60 atcgcaatgc ttggaactga gaagacagcg gaagctgtgg gcgttgataa gtcgcagatc120 agcaggtgga agagggactg gattccaaag ttctcaatgc tgcttgctgt tcttgaatgg180 ggggtcgttg acgacgacat ggctcgattg gcgcgacaag ttgctgcgat tctcaccaat240 aaaaaacgcc cggcggcaac cgagcgttct gaacaaatcc agatggagtt ctga294 <210> 31 < 211> 1422 < 212> белок < 213> Искусственная последовательность <220>
< 223> Неизвестный <220>
< 221> misc_feature < 223> NLS-ME4EHblli-CAS9-His белок, транслируемый c SEQ ID NO:27 < 400> 31
Met Pro Lys Lys Lys Arg Lys Vai Gly Asp Tyr Lys Asp Asp Asp Asp 15 10 15
Lys Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
- 164 038595
Ser Phe Ser Gin Ser Gly Ala Leu Thr Arg His Gin Arg Thr His Thr 35 4045
Arg Asp Lys Lys Tyr Ser lie Gly Leu Asp lie Gly Thr Asn Ser Vai 50 5560
Gly Trp Ala Vai lie Thr Asp Glu Tyr Lys Vai Pro Ser Lys Lys Phe 65 70 7580
Lys Vai Leu Gly Asn Thr Asp Arg His Ser lie Lys Lys Asn Leu lie 85 9095
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
100 105110
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg lie Cys
115 120125
Tyr Leu Gin Glu lie Phe Ser Asn Glu Met Ala Lys Vai Asp Asp Ser
130 135140
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Vai Glu Glu Asp Lys Lys
145 150 155160
His Glu Arg His Pro lie Phe Gly Asn lie Vai Asp Glu Vai Ala Tyr
165 170175
His Glu Lys Tyr Pro Thr lie Tyr His Leu Arg Lys Lys Leu Vai Asp
180 185190
Ser Thr Asp Lys Ala Asp Leu Arg Leu lie Tyr Leu Ala Leu Ala His
195 200205
Met lie Lys Phe Arg Gly His Phe Leu lie Glu Gly Asp Leu Asn Pro
210 215220
Asp Asn Ser Asp Vai Asp Lys Leu Phe lie Gin Leu Vai Gin Thr Tyr
225 230 235240
- 165 038595
Asn
Gln
Leu
Phe
Glu
245
Glu
Asn
Pro
He
Asn
250
Ala
Ser
Gly
Val
Asp 255
Ala
Lys
Ala
He
Leu
260
Ser
Ala
Arg
Leu
Ser
265
Lys
Ser
Arg
Arg
Leu
270
Glu
Asn
Leu
He
Ala
275
Gln
Leu
Pro
Gly
Glu
280
Lys
Lys
Asn
Gly
Leu
285
Phe
Gly
Asn
Leu
He
290
Ala
Leu
Ser
Leu
Gly 295
Leu
Thr
Pro
Asn
Phe
300
Lys
Ser
Asn
Phe
Asp 305
Leu
Ala
Glu
Asp
Ala
310
Lys
Leu
Gln
Leu
Ser
315
Lys
Asp
Thr
Tyr
Asp 320
Asp
Asp
Leu
Asp
Asn
325
Leu
Leu
Ala
Gln
He
330
Gly
Asp
Gln
Tyr
Ala
335
Asp
Leu
Phe
Leu
Ala
340
Ala
Lys
Asn
Leu
Ser
345
Asp
Ala
He
Leu
Leu
350
Ser
Asp
He
Leu
Arg 355
Val
Asn
Thr
Glu
He
360
Thr
Lys
Ala
Pro
Leu
365
Ser
Ala
Ser
Met
He
370
Lys
Arg
Tyr
Asp
Glu
375
His
His
Gln
Asp
Leu
380
Thr
Leu
Leu
Lys
Ala
385
Leu
Val
Arg
Gln
Gln
390
Leu
Pro
Glu
Lys
Tyr
395
Lys
Glu
He
Phe
Phe
400
Asp
Gln
Ser
Lys
Asn
405
Gly
Tyr
Ala
Gly
Tyr 410
He
Asp
Gly
Gly
Ala
415
Ser
Gln
Glu
Glu
Phe
420
Tyr
Lys
Phe
He
Lys
425
Pro
He
Leu
Glu
Lys 430
Met
Asp
Gly
Thr
Glu
435
Glu
Leu
Leu
Val
Lys 440
Leu
Asn
Arg
Glu
Asp 445
Leu
Leu
Arg
- 166 038595
Lys Gin Arg Thr Phe Asp Asn Gly Ser lie Pro His Gin lie His Leu
450 455460
Gly Glu Leu His Ala lie Leu Arg Arg Gin Glu Asp Phe Tyr Pro Phe
465 470 475480
Leu Lys Asp Asn Arg Glu Lys lie Glu Lys lie Leu Thr Phe Arg lie
485 490495
Pro Tyr Tyr Vai Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
500 505510
Met Thr Arg Lys Ser Glu Glu Thr lie Thr Pro Trp Asn Phe Glu Glu
515 520525
Vai Vai Asp Lys Gly Ala Ser Ala Gin Ser Phe lie Glu Arg Met Thr
530 535540
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Vai Leu Pro Lys His Ser
545 550 555560
Leu Leu Tyr Glu Tyr Phe Thr Vai Tyr Asn Glu Leu Thr Lys Vai Lys
565 570575
Tyr Vai Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gin
580 585590
Lys Lys Ala lie Vai Asp Leu Leu Phe Lys Thr Asn Arg Lys Vai Thr
595 600605
Vai Lys Gin Leu Lys Glu Asp Tyr Phe Lys Lys lie Glu Cys Phe Asp
610 615620
Ser Vai Glu lie Ser Gly Vai Glu Asp Arg Phe Asn Ala Ser Leu Gly
625 630 635640
Thr Tyr His Asp Leu Leu Lys lie lie Lys Asp Lys Asp Phe Leu Asp
645 650655
- 167 038595
Asn Glu Glu Asn Glu Asp lie Leu Glu Asp lie Vai Leu Thr Leu Thr
660 665670
Leu Phe Glu Asp Arg Glu Met lie Glu Glu Arg Leu Lys Thr Tyr Ala
675 680685
His Leu Phe Asp Asp Lys Vai Met Lys Gin Leu Lys Arg Arg Arg Tyr
690 695700
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu lie Asn Gly lie Arg Asp
705 710 715720
Lys Gin Ser Gly Lys Thr lie Leu Asp Phe Leu Lys Ser Asp Gly Phe
725 730735
Ala Asn Arg Asn Phe Met Gin Leu lie His Asp Asp Ser Leu Thr Phe
740 745750
Lys Glu Asp lie Gin Lys Ala Gin Vai Ser Gly Gin Gly Asp Ser Leu
755 760765
His Glu His lie Ala Asn Leu Ala Gly Ser Pro Ala lie Lys Lys Gly
770 775780 lie Leu Gin Thr Vai Lys Vai Vai Asp Glu Leu Vai Lys Vai Met Gly
785 790 795800
Arg His Lys Pro Glu Asn lie Vai lie Glu Met Ala Arg Glu Asn Gin
805 810815
Thr Thr Gin Lys Gly Gin Lys Asn Ser Arg Glu Arg Met Lys Arg lie
820 825830
Glu Glu Gly lie Lys Glu Leu Gly Ser Gin lie Leu Lys Glu His Pro
835 840845
Vai Glu Asn Thr Gin Leu Gin Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
850 855860
- 168 038595
Gin Asn Gly Arg Asp Met Tyr Vai Asp Gin Glu Leu Asp lie Asn Arg
865 870 875880
Leu Ser Asp Tyr Asp Vai Asp His lie Vai Pro Gin Ser Phe Leu Lys
885 890895
Asp Asp Ser lie Asp Asn Lys Vai Leu Thr Arg Ser Asp Lys Asn Arg
900 905910
Gly Lys Ser Asp Asn Vai Pro Ser Glu Glu Vai Vai Lys Lys Met Lys
915 920925
Asn Tyr Trp Arg Gin Leu Leu Asn Ala Lys Leu lie Thr Gin Arg Lys
930 935940
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
945 950 955960
Lys Ala Gly Phe lie Lys Arg Gin Leu Vai Glu Thr Arg Gin lie Thr
965 970975
Lys His Vai Ala Gin lie Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
980 985990
Glu Asn Asp Lys Leu lie Arg Glu Vai Lys Vai lie Thr Leu Lys Ser 995 10001005
Lys Leu Vai Ser Asp Phe Arg Lys Asp Phe Gin Phe Tyr Lys Vai
1010 10151020
Arg Glu lie Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1025 10301035
Ala Vai Vai Gly Thr Ala Leu lie Lys Lys Tyr Pro Lys Leu Glu
1040 10451050
Ser Glu Phe Vai Tyr Gly Asp Tyr Lys Vai Tyr Asp Vai Arg Lys
1055 10601065
- 169 038595
Met He 1070 Ala Lys Ser Glu Gin 1075 Glu lie Gly Lys Ala 1080 Thr Ala Lys
Туг Phe 1085 Phe Tyr Ser Asn He 1090 Met Asn Phe Phe Lys 1095 Thr Glu He
Thr Leu 1100 Ala Asn Gly Glu He 1105 Arg Lys Arg Pro Leu 1110 He Glu Thr
Asn Gly 1115 Glu Thr Gly Glu He 1120 Vai Trp Asp Lys Gly 1125 Arg Asp Phe
Ala Thr 1130 Vai Arg Lys Vai Leu 1135 Ser Met Pro Gin Vai 1140 Asn He Vai
Lys Lys 1145 Thr Glu Vai Gin Thr 1150 Gly Gly Phe Ser Lys 1155 Glu Ser He
Leu Pro 1160 Lys Arg Asn Ser Asp 1165 Lys Leu He Ala Arg 1170 Lys Lys Asp
Trp Asp 1175 Pro Lys Lys Tyr Gly 1180 Gly Phe Asp Ser Pro 1185 Thr Vai Ala
Tyr Ser 1190 Vai Leu Vai Vai Ala 1195 Lys Vai Glu Lys Gly 1200 Lys Ser Lys
Lys Leu 1205 Lys Ser Vai Lys Glu 1210 Leu Leu Gly He Thr 1215 He Met Glu
Arg Ser 1220 Ser Phe Glu Lys Asn 1225 Pro He Asp Phe Leu 1230 Glu Ala Lys
Gly Tyr 1235 Lys Glu Vai Lys Lys 1240 Asp Leu He He Lys 1245 Leu Pro Lys
Tyr Ser 1250 Leu Phe Glu Leu Glu 1255 Asn Gly Arg Lys Arg 1260 Met Leu Ala
- 170 038595
Ser Ala 1265 Gly Glu Leu Gln Lys 1270 Gly Asn Glu Leu Ala 1275 Leu Pro Ser
Lys Tyr 1280 Val Asn Phe Leu Tyr 1285 Leu Ala Ser His Tyr 1290 Glu Lys Leu
Lys Gly 1295 Ser Pro Glu Asp Asn 1300 Glu Gln Lys Gln Leu 1305 Phe Val Glu
Gln His 1310 Lys His Tyr Leu Asp 1315 Glu lie lie Glu Gln 1320 lie Ser Glu
Phe Ser 1325 Lys Arg Val lie Leu 1330 Ala Asp Ala Asn Leu 1335 Asp Lys Val
Leu Ser 1340 Ala Tyr Asn Lys His 1345 Arg Asp Lys Pro lie 1350 Arg Glu Gln
Ala Glu 1355 Asn lie lie His Leu 1360 Phe Thr Leu Thr Asn 1365 Leu Gly Ala
Pro Ala 1370 Ala Phe Lys Tyr Phe 1375 Asp Thr Thr lie Asp 1380 Arg Lys Arg
Tyr Thr 1385 Ser Thr Lys Glu Val 1390 Leu Asp Ala Thr Leu 1395 lie His Gln
Ser lie 1400 Thr Gly Leu Tyr Glu 1405 Thr Arg lie Asp Leu 1410 Ser Gln Leu
Gly Gly 1415 Asp His His His His 1420 His His
<210> 32 <211> 909 < 212> ДНК < 213> Цитомегаловирус ЦМВЧ <220>
< 221> misc_feature
- 171 038595 <223> пост-редактирование фрагмента RL14 ЦМВЧ <400> 32
atggactggc gatttacggt tacgtggacg atactaatgt ccgcgttgtc agaaagctgc 60
aatcaaacct gttcttgtca atgtccctgt agtactaccg ttaactattc aactagtact 120
gagacagcca catcaacata cagtacaaca gttatcagca ataaaagcac ttcagaatct 180
ataaattgct ctactgcaac tacaccagca aacaccgttt ctacaaaacc gtcggaaaca 240
accacacaga tatccacaac gacgaacaca aacgttgaga ctaccacatg taccaacacc 300
accacgaccg ttacttgtga tggtttcaat tatacagtcc ataaaagatg cgatcgcagt 360
tacgaggtaa tcaacgtaac aggatacgtt ggtagcaaca taactctaaa aaaatgcaat 420
cagactgaga aatggcacaa tgtagactgg attcattatg agtaccccac gcataaaatg 480
tgcgaattag gcaactatca ccaaaccaca ccacggcacg acatatgttt tgactgcaac 540
gacacctccc taactatcta caacttaacc acaaaaaacg ctggaaaata taccaggcgt 600
caccgtgata acggtcaaga agaaaattac tacgtaacgg tgttaattgg agacacaacg 660
ttattcactc ttggcacatg ccctgtaaga tataaagaat ctacgaacac tgaaaacacc 720
attggaagta gcatcataga aaccattgag aaagctaaca ttcccctggg aattcatgct 780
gtatgggcag gcgtagtggt atcagtggcg cttatagcgt tgtacatggg tagccatcgc 840
attcccaaaa agccgcatta caccaaactt cccaaatatg atccagatga attttggact 900
aaggcttaa 909 <210> 33 <211> 630 < 212> ДНК < 213> Цитомегаловирус ЦМВЧ <220>
< 221> misc_feature <223> пост-редактирование RL13 ЦМВЧ <400> 33 atggactggc gatttacggt tacgtggacc gttacttgtg atggtttcaa ttatacagtc60 cataaaagat gcgatcgcag ttacgaggta atcaacgtaa caggatacgt tggtagcaac120 ataactctaa aaaaatgcaa tcagactgag aaatggcaca atgtagactg gattcattat180
- 172 038595 gagtacccca cgcataaaat gtgcgaatta ggcaactatc accaaaccac accacggcac240 gacatatgtt ttgactgcaa cgacacctcc ctaactatct acaacttaac cacaaaaaac300 gctggaaaat ataccaggcg tcaccgtgat aacggtcaag aagaaaatta ctacgtaacg360 gtgttaattg gagacacaac gttattcact cttggcacat gccctgtaag atataaagaa420 tctacgaaca ctgaaaacac cattggaagt agcatcatag aaaccattga gaaagctaac480 attcccctgg gaattcatgc tgtatgggca ggcgtagtgg tatcagtggc gcttatagcg540 ttgtacatgg gtagccatcg cattcccaaa aagccgcatt acaccaaact tcccaaatat600 gatccagatg aattttggac taaggcttaa
630 <210> 34 <211> 95 < 212> белок < 213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature <223> последовательность белка <400> 34
Met Leu Ala Leu Gly Ala Phe Asp 1 5
Gpl3 LUZ19 дикого типа
Leu Ser Gly Leu Met Vai Gly Ser
15
Cys Leu Vai Vai Gly Gly Glu Leu
Lys Ala Leu Cys Vai Asp Asp Arg 25 30
His Ser Arg Gln Gly lie Gly Ala
40
Glu Leu Vai Arg Ala Ala Glu Leu 45
Ala Gly Ala Glu Tyr Leu Thr Cys
55
Phe Glu Phe Leu Glu Pro Phe Tyr 60
Ala Asp Leu Gly Trp Ser Thr Thr 65 70
His Arg Glu Ala Asn Trp Thr Ala
80
Gly Glu Pro Asp Vai Leu His Met 85
Arg Ala Pro Gly His Asp Vai
95
- 173 038595 <210> 35 <211> 251 < 212> белок <213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature < 223> последовательность белка Gp38 LUZ19 дикого типа <400> 35
Met Ala Arg Phe Lys Asn Pro Glu 1 5
Thr lie His Vai Ala Asp Gly Vai
15
Glu Ala Vai Phe Ser Leu Asp Phe
Pro Phe Leu Arg Arg Glu Asp Vai 25 30
Phe Vai Gin Vai Asp Lys lie Leu
40
Vai Thr Asp Tyr Thr Trp Vai Asp 45
Asp Thr Asn lie Gin Leu Ala Vai
55
Vai Pro Lys Lys Asp Gin Glu Vai
Arg lie Phe Arg Asp Thr Pro Ala 65 70
Gin Vai Pro Asp Thr Gin Phe Ser
80
Gin Asp lie Pro Phe Leu Pro Arg 85
Tyr lie Asp Ala Asn Asn Lys Gin
95
Leu Leu Tyr Ala Vai Gin Glu Gly
100 lie Asn Thr Ala Asn Leu Ala Leu
105 110
Asp Gly Vai Leu Asp Ala lie Arg
115 120 lie Ala Glu Glu Ala Arg Arg Leu
125
Ala Gin Glu Ala Leu Asp Ala Ala
130 135
Asn Glu Ala Leu Arg Arg Ala Leu
140
Gly Phe Ala Glu lie Arg Thr Vai
145 150
Thr Glu Asp Ser Asp lie Asp Pro
155 160
- 174 038595
Ser Trp Arg Gly Tyr Trp Asn Arg
165
Cys lie Thr Ala Asp Lys Pro Leu
170 175
Thr Leu Thr Met Gln Met Glu Asp
180
Pro Asp Ala Pro Trp Val Glu Phe
185 190
Ser Glu Val His Phe Glu Gln Ala
195 200
Gly Val Arg Asp Leu Asn lie Val
205
Ala Gly Pro Gly Val Thr lie Asn
210 215
Arg Leu Gln Asn Thr Thr Met Gln
220
Leu Tyr Gly Glu Asn Gly Val Cys
225 230
Thr Leu Lys Arg Leu Gly Ala Asn
235 240
His Trp lie Val Phe Gly Ala Met
245
Glu Asp Glu
250 <210> 36 <211> 301 <212> белок <213> Phikmvlikevirus LUZ19 <220>
<221> misc_feature <223> послеовательность белка <400> 36
Met Phe Lys Thr Glu Val Lys Gly 1 5
Gp40 LUZ19 дикого типа
Arg Tyr Thr Leu lie Arg Arg Lys
15
Ala Asp Gly Thr Pro Val Glu Thr 20
Leu Glu Phe Asp Asn lie lie Thr 25 30
Asn Ala Gly Leu Asp Trp lie Ala
40
Ala Met Asp Thr Asp Leu Met Gly
Glu Pro Val Ala Val Ser Thr Ser
55
Thr Ala Asp Pro Asn Pro Ser Ala 60
- 175 038595
Pro 65
Ala lie
Pro
Glu
Val 70
Val
Gln
Arg
Thr
Ser 75
Ala
Ser
Ala
Pro
Gly 80
Gly
Gly
Thr
Thr
Ser 85
Gly
Leu
Asp
Gly
Glu 90
Trp
Leu
Phe
Trp
Arg 95
Arg
Arg
Trp
Arg
Phe
100
Pro
Gln
Gly
Thr
Leu
105
Ala
Gly
Gln
Val
Leu
110
Ala
Thr
Val
Gly
Leu
115 lie
Cys
Asn
Ser
Asp 120
Arg
Arg
Phe
Glu
Ser
125
Asn
Thr
Gly
Glu
Leu
130 lie
Pro
Lys
Asp
Thr
135
Pro
Leu
Ser
Tyr
Thr
140
Arg lie
Lys
Asp
Ala
145
Ala
Gly
Gln
Pro
Thr
150
Thr
Leu
Val
Val
Ala
155
Ala
Asp
Glu lie
Leu
160
Asp
Val
Gln
Tyr
Glu
165
Phe
Arg
Ser
Arg
Pro
170
Val
Gly
Thr
Ala
Glu
175
Ala
Lys
Phe
Val lie
180
Ser
Gly
Val
Glu
Arg 185
Thr
Phe
Arg
Leu lie
190
Pro
Lys
Pro
Phe
Ala
195
Asn
Arg
Ala
Asn
Leu
200
Ser
Gly
Glu
Arg
Tyr 205 lie
Phe
Tyr
Asn
Thr
210
Asn
Pro
Tyr lie
Asn
215
Gly
Lys
Asp
Ala
Ser
220
Gly
Gly
Asn
Val
Arg 225
Asp
Gly
Gln
Trp
Gln
230
Lys
Lys
Tyr
Pro
Lys 235
Tyr
Val
Arg
Gly
Ser
240
Tyr
Lys
Ala
Gln lie
245
Thr
Leu
Leu
Ala
Gln
250
Val
Gln
Asn
Gly
Asn
255
Met
Ala
Gly
Gly lie
260
Thr
Gly
Thr
Glu
Glu
265
Leu
Gln lie
Tyr
Asn
270
Gly
Arg
- 176 038595
Asn Tyr Vai Leu Asp lie Asn Pro Pro Vai Vai Lys Asn Asn Thr Gin
275 280 285
Glu Phe Thr Vai Thr Leu Glu Phe Thr Vai Ala Arg Ala
290 295 300 <210> 37 <211> 498 < 212> белок < 213> Pseudomonas aeruginosa <220>
< 221> misc_feature < 223> последовательность белка PyoS5 < 400> 37
Met Ser Asn Asp Asn Glu Vai Pro Gly Ser Met Vai lie Vai Ala Gin 15 1015
Gly Pro Asp Asp Gin Tyr Ala Tyr Glu Vai Pro Pro lie Asp Ser Ala 20 2530
Ala Vai Ala Gly Asn Met Phe Gly Asp Leu lie Gin Arg Glu lie Tyr 35 4045
Leu Gin Lys Asn lie Tyr Tyr Pro Vai Arg Ser lie Phe Glu Gin Gly
5560
Thr Lys Glu Lys Lys Glu lie Asn Lys Lys Vai Ser Asp Gin Vai Asp 65 70 7580
Gly Leu Leu Lys Gin lie Thr Gin Gly Lys Arg Glu Ala Thr Arg Gin 85 9095
Glu Arg Vai Asp Vai Met Ser Ala Vai Leu His Lys Met Glu Ser Asp
100 105110
Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe lie Asp Tyr
115 120125
- 177 038595
Glu Lys Gin Ser Ser Leu Ser lie Tyr Glu Ala Trp Vai Lys lie Trp
130 135140
Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gin Gin Leu
145 150 155160
Vai Arg Asp Glu Leu Glu Arg Ala Vai Ala Tyr Tyr Lys Gin Asp Ser
165 170175
Leu Ser Glu Ala Vai Lys Vai Leu Arg Gin Glu Leu Asn Lys Gin Lys
180 185190
Ala Leu Lys Glu Lys Glu Asp Leu Ser Gin Leu Glu Arg Asp Tyr Arg
195 200205
Thr Arg Lys Ala Asn Leu Glu Met Lys Vai Gin Ser Glu Leu Asp Gin
210 215220
Ala Gly Ser Ala Leu Pro Pro Leu Vai Ser Pro Thr Pro Glu Gin Trp
225 230 235240
Leu Glu Arg Ala Thr Arg Leu Vai Thr Gin Ala lie Ala Asp Lys Lys
245 250255
Gin Leu Gin Thr Thr Asn Asn Thr Leu lie Lys Asn Ser Pro Thr Pro
260 265270
Leu Glu Lys Gin Lys Ala lie Tyr Asn Gly Glu Leu Leu Vai Asp Glu
275 280285 lie Ala Ser Leu Gin Ala Arg Leu Vai Lys Leu Asn Ala Glu Thr Thr
290 295300
Arg Arg Arg Thr Glu Ala Glu Arg Lys Ala Ala Glu Glu Gin Ala Leu
305 310 315320
Gin Asp Ala lie Lys Phe Thr Ala Asp Phe Tyr Lys Glu Vai Thr Glu
325 330335
- 178 038595
Lys Phe Gly Ala Arg Thr Ser Glu Met Ala Arg Gin Leu Ala Glu Gly
340 345350
Ala Arg Gly Lys Asn lie Arg Ser Ser Ala Glu Ala lie Lys Ser Phe
355 360365
Glu Lys His Lys Asp Ala Leu Asn Lys Lys Leu Ser Leu Lys Asp Arg
370 375380
Gin Ala lie Ala Lys Ala Phe Asp Ser Leu Asp Lys Gin Met Met Ala
385 390 395400
Lys Ser Leu Glu Lys Phe Ser Lys Gly Phe Gly Vai Vai Gly Lys Ala
405 410415 lie Asp Ala Ala Ser Leu Tyr Gin Glu Phe Lys lie Ser Thr Glu Thr
420 425430
Gly Asp Trp Lys Pro Phe Phe Vai Lys lie Glu Thr Leu Ala Ala Gly
435 440445
Ala Ala Ala Ser Trp Leu Vai Gly lie Ala Phe Ala Thr Ala Thr Ala
450 455460
Thr Pro lie Gly lie Leu Gly Phe Ala Leu Vai Met Ala Vai Thr Gly
465 470 475480
Ala Met lie Asp Glu Asp Leu Leu Glu Lys Ala Asn Asn Leu Vai lie
485 490495
Ser lie <210> 38 <211> 114 <212> белок <213> Phikmvlikevirus LKD16
- 179 038595 <220>
<221> misc_feature
<223> последовательность белка Gpl8 LKD16
<400> Met Arg 38 Val Pro Thr Glu His Glu Arg Thr Leu Arg Cys Leu Leu Gln
1 Asp He 5 His Gly Pro Leu Asn Leu 10 15 Leu Phe Pro Gly lie Arg Val Lys
Val Glu 20 Glu Ala Cys Leu Gly Tyr 25 30 Leu Gly Tyr Arg Glu Arg Gly Tyr
Trp Glu 35 40 Leu Arg Leu Gln Val Asp 45 Tyr Asp His Pro Lys Leu Gly His
50 Leu Arg 55 Tyr Ser Gln Ala Val Pro 60 Glu Tyr Val Leu lie Asn Asp Arg
65 Asp Ser 70 lie lie Lys Tyr Leu Met 75 80 Glu Ala Val Pro Arg Gln Val Leu
Glu Gly 85 Met Leu Asn Lys Ala Gln 90 95 Glu Phe Val Thr Lys Asn Trp Tyr
Ser Leu <210> <211> <212> <213> <220> <221> <223> <400> Met Ala 100 39 769 белок Phikmvlikevirus LKA1 misc_feature последовательность белка 39 Gln Thr Pro Ser Thr Trp 105 110 Gp49 LKA1 Ala Asp Tyr Val Gly Asp Gly Val
1 5 10 15
- 180 038595
Glu Asp Thr Phe Gin Vai Thr Phe Pro Tyr Gin Lys Gin Gin Glu Vai 20 2530
Phe Vai Thr Vai Gly Gly Asp Pro Ala Ala Phe Thr Phe He Ser Ala 35 4045
Gly Trp lie Gin Leu Ala Ala Vai Pro Vai Asn Gly Ala Ala lie Arg
5560
Vai Arg Arg Ser Thr Glu Ala Phe Glu Pro Arg His Glu Phe Ala Asn 65 70 7580
Gly Vai Pro Leu Leu Pro Arg Phe lie Asp Glu Asn Asn Thr Gin Phe 85 9095
Leu Tyr Thr Vai Gin Glu Ala Vai Asn Glu Thr His Gly lie Ala Ser
100 105110
Glu Ala Leu Ser Vai Ala Glu Glu Ala Arg Gly lie Ala Gin Ala Ala
115 120125
Ser Asp Lys Vai Asp Ala Ala Thr lie Asp Ser Ala His Gin Leu Arg
130 135140
Leu Asp Leu Ala Asp Pro Ala Lys Gly Pro Gly Leu Leu Gly Tyr Asp
145 150 155160
Arg Asp Vai Ser Tyr Pro Vai Gly Ser Vai Gly Gin Ser Leu Gin Phe
165 170175
Leu Glu Met Gly Arg Vai Thr Pro Ala Gin Phe Gly Ala Vai Gly Asp
180 185190
Gly Ala Ser His Pro Leu Ser Glu Arg Tyr Ala Thr Leu Ala Glu Ala
195 200205
Gin Thr Vai Tyr Pro His Ala Vai Ala Leu Ser Asp Glu lie Asp Trp
210 215220
- 181 038595
Ala Ala Leu Gin Ala Ala Vai Asp Ser Gly Ala Pro Vai His lie Pro
225 230 235240
Ser Gly Asp Tyr Gin lie Asn Arg Gly lie Ser Ser Thr Gly Ser Leu
245 250255
Gin lie Ala Gly Asp Gly Ala Thr Ser lie lie Arg Pro Thr Ala Ala
260 265270
Phe Thr Gly Thr Ser Vai Leu Ser Cys Vai Gly Ser Leu Vai Ala Leu
275 280285
Pro Asn lie Ser Ser Vai Ser Ala Gly Ser Leu Thr lie Asp Phe Ala
290 295300
Ser Thr Pro Asn Leu Vai Ala Gly Asp Vai Phe lie lie Tyr Asn Pro
305 310 315320
Thr Asp Ser Ser Phe Ser Gly Phe Arg Thr Ser Tyr Arg Ala Gly Glu
325 330335
Phe Cys Glu Vai Arg Ala Vai Ser Gly Asn Thr Vai Thr lie Arg Ser
340 345350
Ala Leu Tyr Ala Ala Tyr Asp Gly Ala Thr Vai Ala lie Tyr Lys Vai
355 360365
Vai Ser Gly Vai Vai Asp lie Ala Ser lie Gin lie Vai Gly Gly Thr
370 375380
Vai Pro Met Asn Gly Leu Leu Vai Glu Ala Vai Vai Ser Pro Arg Vai
385 390 395400
Asp Asp Vai Thr Vai Thr Leu Ala Asn Asn Ala Gly Vai Tyr Phe Ala
405 410415
Arg Cys Tyr Asp Ala Lys lie Thr Asn Ser Asn lie Ser Asn lie Gly
420 425430
- 182 038595
Asp Gly Gly Asp Asp Tyr Gly lie lie Phe Gly Asn Cys His Asp Gly
435 440445
Gly Ala Asp Asn Cys Lys Vai Tyr Ala Arg Arg His Ala lie Ala Thr
450 455460
Gly Gly Asp Ala Glu Vai Gly Cys Vai Pro Vai Arg Asn Vai Arg Met 465 470 475480
Arg Asn Cys Thr Leu Arg Asn Asp lie Thr Ser Gly Thr His Cys Ala
485 490495
Asp Phe His Gly Asn Ala Glu Asp Cys Ser Tyr Glu Asn Cys Thr lie
500 505510
Tyr Gly Gly Ala Thr Trp Gin Gly Lys Asp lie Ser Tyr Arg His Cys
515 520525
Thr lie Thr Asn Ala Ser Gly Gly Trp lie Vai lie Ser Ala Glu lie
530 535540
Leu Gly Gly Thr Phe Leu Leu Asp Gin Cys Thr Leu Tyr Thr Thr Gly
545 550 555560
Asp Pro Gin Pro Gly Asn Arg Gly Vai lie Asp Vai Gly Gly Asn Ser
565 570575
Ala Vai Leu Thr Thr Asn Thr Thr Gin Pro Cys Asn Phe Leu lie Gin
580 585590
Gly Gly Ser Leu Arg Ala Pro Ser Leu Ser Thr Ser Ser Tyr Leu Leu
595 600605
Arg Ala Arg Leu Glu Gly Ser Thr Vai Pro Vai Asn lie Gin Tyr Ser
610 615620
Gly Gin Ala lie Asp Vai Gly Ser Leu Gly Lys Vai Leu Gin Leu Asp
625 630 635640
- 183 038595 lie Thr Ser Gly Ser Thr Ser Pro Glu Tyr Leu lie Val Glu Asn Leu
645 650655
Ala Gly Leu Pro Ser Gly lie Thr Leu Ala Ser Ala Ala Gly Gly Phe
660 665670
Ala Ser Ala Pro Met Arg Met Pro Val Leu Gly Gly Arg Val Gln Val
675 680685
Thr Thr Ala Thr Asn Ala Ser Ser Val Thr Ala Pro Val Thr Phe Arg
690 695700
Tyr lie Tyr Pro Lys Ala Pro Thr Val Gln Val Thr Lys Thr Asp Arg
705 710 715720
Ser Tyr Ala Gly Asn Arg Val Gly Val Ala lie Ala Asn Pro Thr Ser
725 730735
Ala Ser Gly Ala Thr Leu Gly Leu Phe Thr Asp Asp Gly Thr Asn Phe
740 745750
Ser Ser Ala Val Thr Asn Gln Leu Asn Trp Gln Ala Gly lie Tyr Glu
755 760765
Val <210> 40 < 211> 651 < 212> белок <213> Phikmvlikevirus NTUH-K2044-K1-1 <220>
< 221> misc_feature < 223> последовательность белка Gp34 NTUH-K2044-K1-1 <400> 40
Met Ala Leu lie Arg Leu Val Ala Pro Glu Arg Val Phe Ser Asp Leu 15 10 15
- 184 038595
Ala Ser Met Vai Ala Tyr Pro Asn Phe Gin Vai Gin Asp Lys lie Thr 20 2530
Leu Leu Gly Ser Ala Gly Gly Asp Phe Thr Phe Thr Thr Thr Ala Ser 35 4045
Vai Vai Asp Asn Gly Thr Vai Phe Ala Vai Pro Gly Gly Tyr Leu Leu
5560
Arg Lys Phe Vai Gly Pro Ala Tyr Ser Ser Trp Phe Ser Asn Trp Thr 65 70 7580
Gly lie Vai Thr Phe Met Ser Ala Pro Asn Arg His Leu Vai Vai Asp 85 9095
Thr Vai Leu Gin Ala Thr Ser Vai Leu Asn lie Lys Ser Asn Ser Thr
100 105110
Leu Glu Phe Thr Asp Thr Gly Arg lie Leu Pro Asp Ala Ala Vai Ala
115 120125
Arg Gin Vai Leu Asn lie Thr Gly Ser Ala Pro Ser Vai Phe Vai Pro
130 135140
Leu Ala Ala Asp Ala Ala Ala Gly Ser Lys Vai lie Thr Vai Ala Ala
145 150 155160
Gly Ala Leu Ser Ala Vai Lys Gly Thr Tyr Leu Tyr Leu Arg Ser Asn
165 170175
Lys Leu Cys Asp Gly Gly Pro Asn Thr Tyr Gly Vai Lys lie Ser Gin
180 185190 lie Arg Lys Vai Vai Gly Vai Ser Thr Ser Gly Gly Vai Thr Ser lie
195 200205
Arg Leu Asp Lys Ala Leu His Tyr Asn Tyr Tyr Leu Ser Asp Ala Ala
210 215220
- 185 038595
Glu
225
Val
Gly lie
Pro
Thr
230
Met
Val
Glu
Asn
Val
235
Thr
Leu
Val
Ser
Pro
240
Tyr lie
Asn
Glu
Phe
245
Gly
Tyr
Asp
Asp
Leu
250
Asn
Arg
Phe
Phe
Thr
255
Ser
Gly lie
Ser
Ala
260
Asn
Phe
Ala
Ala
Asp 265
Leu
His lie
Gln
Asp
270
Gly
Val lie lie
Gly 275
Asn
Lys
Arg
Pro
Gly
280
Ala
Ser
Asp lie
Glu
285
Gly
Arg
Ser
Ala lie
290
Lys
Phe
Asn
Asn
Cys
295
Val
Asp
Ser
Thr
Val
300
Lys
Gly
Thr
Cys
Phe
305
Tyr
Asn lie
Gly
T rp 310
Tyr
Gly
Val
Glu
Val
315
Leu
Gly
Cys
Ser
Glu
320
Asp
Thr
Glu
Val
His
325
Asp lie
His
Ala
Met
330
Asp
Val
Arg
His
Ala
335 lie
Ser
Leu
Asn
Trp
340
Gln
Ser
Thr
Ala
Asp 345
Gly
Asp
Lys
Trp
Gly 350
Glu
Pro lie
Glu
Phe
355
Leu
Gly
Val
Asn
Cys
360
Glu
Ala
Tyr
Ser
Thr
365
Thr
Gln
Ala
Gly
Phe
370
Asp
Thr
His
Asp lie
375
Gly
Lys
Arg
Val
Lys 380
Phe
Val
Arg
Cys
Val
385
Ser
Tyr
Asp
Ser
Ala
390
Asp
Asp
Gly
Phe
Gln
395
Ala
Arg
Thr
Asn
Gly 400
Val
Glu
Tyr
Leu
Asn
405
Cys
Arg
Ala
Tyr
Arg 410
Ala
Ala
Met
Asp
Gly 415
Phe
Ala
Ser
Asn
Thr
420
Gly
Val
Ala
Phe
Pro
425 lie
Tyr
Arg
Glu
Cys 430
Leu
Ala
- 186 038595
Tyr Asp Asn Vai Arg Ser Gly Phe Asn Cys Ser Tyr Gly Gly Gly Tyr
435 440445
Vai Tyr Asp Cys Glu Ala His Gly Ser Gln Asn Gly Vai Arg lie Asn
450 455460
Gly Gly Arg Vai Lys Gly Gly Arg Tyr Thr Arg Asn Ser Ser Ser His
465 470 475480 lie Phe Vai Thr Lys Asp Vai Ala Glu Thr Ala Gln Thr Ser Leu Glu
485 490495 lie Asp Gly Vai Ser Met Arg Tyr Asp Gly Thr Gly Arg Ala Vai Tyr
500 505510
Phe His Gly Thr Vai Gly lie Asp Pro Thr Leu Vai Ser Met Ser Asn
515 520525
Asn Asp Met Thr Gly His Gly Leu Phe Trp Ala Leu Leu Ser Gly Tyr
530 535540
Thr Vai Gln Pro Thr Pro Pro Arg Met Ser Arg Asn Leu Leu Asp Asp
545 550 555560
Thr Gly lie Arg Gly Vai Ala Thr Leu Vai Ala Gly Glu Ala Thr Vai
565 570575
Asn Ala Arg Vai Arg Gly Asn Phe Gly Ser Vai Ala Asn Ser Phe Lys
580 585590
Trp Vai Ser Glu Vai Lys Leu Thr Arg Leu Thr Phe Pro Ser Ser Ala
595 600605
Gly Ala Leu Thr Vai Thr Ser Vai Ala Gln Asn Gln Asp Vai Pro Thr
610 615620
Pro Asn Pro Asp Leu Asn Ser Phe Vai lie Arg Ser Ser Asn Ala Ala
625 630 635640
- 187 038595
Asp Vai Ser Gin Vai Ala Trp Glu
645
Vai Tyr Leu
650 <210> 41 <211> 727 < 212> белок < 213> Т7-подобный Ppl5 <220>
< 221> misc_feature < 223> последовательность белка < 400> 41
Met Ala Arg Thr lie Vai Gin Asn 1 5
Gp44 Ppl5
Ala Leu Thr Gly Gly Gin Gin Asp
15
Phe Glu Vai Pro Phe Asp Tyr lie
Leu Gin Arg Phe Vai Lys Leu Thr 25 30
Leu lie Gly Asp Gly Asn Arg Gin
40
Glu Leu Vai Leu Gly Thr Asp Phe 45
Arg Phe lie Gly Pro Arg Thr Vai
55
Arg Thr Asn Vai Phe Trp Gly Pro 60
Ala Gin Gly Tyr Thr Ser lie Glu 65 70 lie Arg Arg Vai Thr Ser Ala Ser
80
Asp Arg Arg Vai Glu Phe Ser Asp 85
Gly Ser lie Leu Thr Ala Gly Asp
95
Leu Asn lie Ala Gin Leu Gin Ala
100 lie His lie Ala Glu Glu Ala Arg
105 110
Asp Ser Ala Thr Glu Asn Leu Ser
115 120
Pro Asp Ala Asp Gly Asn Tyr Asp
125
Ala Arg Gly Ala Arg lie Tyr Asn
130 135
Leu Gly Asp Ala Vai Gin Pro Lys
140
- 188 038595
Asp 145
Ala
Val
Asn
Arg
Tyr 150
Thr
Leu
Asp
Leu
Ala
155
He
Ala
Ala
Ala
Leu
160
Ala
Met
Asn
Thr
Gly 165
Asn
Pro
Asn
Asn
Ala
170
Gln
Asn
He
Ser
Tyr 175
Thr
Pro
Asn
Gly
Pro
180
Gly
Gln
Ser
He
Arg 185
Ser
Val
Glu
Gly
Arg 190
Leu
Arg
Asp
Ala
Val
195
Phe
Val
Ser
Asp
Tyr 200
Met
Thr
Thr
Pro
Arg 205
Asp
Gly
Val
Thr
Ser
210
Asn
Gln
Gln
Asp
Leu
215
Glu
Lys
Ala
Leu
Ala
220
Ala
Ala
Asn
Ala
Lys 225
Gly
Ala
Asp
Leu
Phe
230
Trp
Pro
Asp
Asp
He
235
Pro
Phe
Phe
Ser
Thr
240
Ser
Pro
Leu
Ala
Leu
245
He
His
Ala
Val
Tyr
250
His
Val
Gly
Arg
Gly 255
Val
He
Asn
Ala
Asn
260
Gly
Thr
Leu
Phe
Tyr 265
Val
Asn
Pro
Lys
Asn
270
Gly
Gln
His
Asn
Arg 275
Leu
His
Val
Ser
Pro
280
Gly
Gly
Thr
Gly
Asp 285
Gly
Leu
Ala
Ala
Gly
290
Arg
Pro
Leu
Gly
Thr
295
He
Trp
Ser
Ala
Leu
300
Ala
Ala
Leu
Asn
Met
305
Arg
Ala
Pro
Leu
Thr
310
Thr
Arg
Trp
Ser
Leu
315
Glu
Met
Thr
Ala
Gly
320
Ala
Tyr
Asn
Glu
Ala
325
Val
Thr
Leu
Pro
Asn
330
Tyr
Leu
Thr
Ser
Cys 335
Asn
Asp
Tyr
Leu
Ala
340
Phe
Asn
Trp
Pro
Asn
345
Thr
Gly
Gln
Glu
Arg 350
Met
Glu
- 189 038595
Pro Thr Ala Tyr Pro Ser Ala Leu Asp Gly Thr Gly Gin Thr Gly Leu
355 360365
Thr Gly Phe His Thr Gly He Gly Asn Arg lie Thr lie Asn Asn Vai
370 375380
Cys Met Ser Asn Trp Tyr Asp Thr Ala Leu Thr Pro Thr Gin Gin Vai
385 390 395400
Arg Arg Ala Phe Vai Vai Gly Ala Tyr Ser Thr Ala Tyr Vai Vai Asn
405 410415
Cys Ala Phe lie Tyr Asn Gly lie Ala Ser Vai Ser Vai Leu Pro Gly
420 425430
Gly Thr Ala lie Vai Thr Gly Gly lie Vai Asp Gly Gly Arg Phe Gly
435 440445
Leu Asp Asn Thr Gly Gly Arg Leu Ser Leu Thr Ala Thr Lys Ser Asn
450 455460
Tyr Thr Gin Vai Arg Asn Cys Leu Glu Tyr Gly Leu Tyr Ser Lys His
465 470 475480
Asp Ala Ser Thr Vai Met Asp Asn Thr Glu Phe Arg Asn Cys Gly Asn
485 490495
His Pro Ala Ala Vai Ala Tyr Gly Ala Ala lie Phe Ala Tyr Lys Phe
500 505510
Asn Cys Ser Vai Asp Thr Arg Gly Vai Lys Phe Tyr Gly Asn Asn lie
515 520525
Ala Gin His Cys Arg Gly Gly lie Thr Ser Asp Asn Pro Gly Asp Pro
530 535540
Asp lie Tyr Gly Thr Gly Ala Asp Ala Asn Lys Arg Leu Phe Leu Cys
545 550 555560
- 190 038595
Thr Gly Gly Gly Ser Asp Asp lie Gin Phe Tyr Glu Ala Arg Arg Vai
565 570575
Met Asp lie Thr Lys Arg Thr Gly Gly Gly Ser Thr Thr Ala Ser Vai
580 585590
Ser Ser Leu Leu Leu Ala Ala Vai Ala Ser Vai Arg Lys Gly Tyr Phe
595 600605
Ala His Asn Asp Gin Vai lie Arg Met Thr Leu Met Phe Arg Ala Thr
610 615620
Gly Ser Ala Gly lie Phe Thr Pro Thr Leu Arg Thr Pro Leu Gly Thr
625 630 635640 lie Pro Leu Gly Ser Phe Arg Vai Ala Ser Gly Gin Tyr Gly Glu lie
645 650655
Lys Leu Thr lie Arg Pro Thr Leu Thr Ser Asp Gly Leu lie Vai Gly
660 665670
Phe Ser Cys lie Asn Ala Vai Gin Asn Leu Gly Ser Ser Vai Gly Gin
675 680685 lie lie Vai Ser Gly Thr Vai Asp Leu Arg Thr Vai Asp Gin Leu Vai
690 695700
Glu Met Trp Gly Tyr Ser Glu Ala Gly Gly Thr Ala Ser Tyr lie Gin
705 710 715720
Gly Leu lie Glu Leu Vai Gly
725 <210> 42 <211> 362 < 212> белок < 213> Aggregatibacter actinomycetemcomitans
- 191 038595 <220>
< 221> misc_feature <223> последовательность белка DspB <400> 42
Met Asn Cys Cys Vai Lys Gly Asn Ser lie Tyr Pro Gin Lys Thr Ser
1015
Thr Lys Gin Thr Gly Leu Met Leu Asp lie Ala Arg His Phe Tyr Ser 20 2530
Pro Glu Vai lie Lys Ser Phe lie Asp Thr lie Ser Leu Ser Gly Gly 35 4045
Asn Phe Leu His Leu His Phe Ser Asp His Glu Asn Tyr Ala lie Glu
5560
Ser His Leu Leu Asn Gin Arg Ala Glu Asn Ala Vai Gin Gly Lys Asp 65 70 7580
Gly lie Tyr lie Asn Pro Tyr Thr Gly Lys Pro Phe Leu Ser Tyr Arg 85 9095
Gin Leu Asp Asp lie Lys Ala Tyr Ala Lys Ala Lys Gly lie Glu Leu
100 105110 lie Pro Glu Leu Asp Ser Pro Asn His Met Thr Ala lie Phe Lys Leu
115 120125
Vai Gin Lys Asp Arg Gly Vai Lys Tyr Leu Gin Gly Leu Lys Ser Arg
130 135140
Gin Vai Asp Asp Glu lie Asp lie Thr Asn Ala Asp Ser lie Thr Phe
145 150 155160
Met Gin Ser Leu Met Ser Glu Vai lie Asp lie Phe Gly Asp Thr Ser
165 170175
Gin His Phe His lie Gly Gly Asp Glu Phe Gly Tyr Ser Vai Glu Ser
180 185190
- 192 038595
Asn His Glu Phe lie Thr Tyr Ala Asn Lys Leu Ser Tyr Phe Leu Glu
195 200205
Lys Lys Gly Leu Lys Thr Arg Met Trp Asn Asp Gly Leu lie Lys Asn
210 215220
Thr Phe Glu Gin lie Asn Pro Asn lie Glu lie Thr Tyr Trp Ser Tyr
225 230 235240
Asp Gly Asp Thr Gin Asp Lys Asn Glu Ala Ala Glu Arg Arg Asp Met
245 250255
Arg Vai Ser Leu Pro Glu Leu Leu Ala Lys Gly Phe Thr Vai Leu Asn
260 265270
Tyr Asn Ser Tyr Tyr Leu Tyr lie Vai Pro Lys Ala Ser Pro Thr Phe
275 280285
Ser Gin Asp Ala Ala Phe Ala Ala Lys Asp Vai lie Lys Asn Trp Asp
290 295300
Leu Gly Vai Trp Asp Gly Arg Asn Thr Lys Asn Arg Vai Gin Asn Thr
305 310 315320
His Glu lie Ala Gly Ala Ala Leu Ser lie Trp Gly Glu Asp Ala Lys
325 330335
Ala Leu Lys Asp Glu Thr lie Gin Lys Asn Thr Lys Ser Leu Leu Glu
340 345350
Ala Vai lie His Lys Thr Asn Gly Asp Glu
355360 <210> 43 <211> 22 < 212> белок < 213> Staphylococcus aureus
- 193 038595 <220>
< 221> misc_feature < 223> последовательность белка SaPSMa3 <400> 43
Met Glu Phe Vai Ala Lys Leu Phe Lys Phe Phe Lys Asp Leu Leu Gly 15 10 15
Lys Phe Leu Gly Asn Asn < 210> 44 < 211> 44 < 212> белок < 213> Staphylococcus aureus <220>
< 221> misc_feature < 223> последовательность белка SaPAMb2 < 400> 44
Met Thr Gly Leu Ala Glu Ala lie Ala Asn Thr Vai Gin Ala Ala 15 Gin
1 5 10
Gin His Asp Ser Vai Lys Leu Gly Thr Ser lie Vai 20 25 Asn Gly Vai Gly Leu Leu Gly Lys Leu Phe Gly Phe 35 40 <210> 45 <211> 22 <212> белок <213> Staphylococcus epidermidis Asp lie 30 Vai Ala
<220>
< 221> misc_feature <223> последовательность белка SePSMa <400> 45
Met Ala Asp Vai lie Ala Lys lie Vai Glu lie Vai Lys Gly Leu lie
10 15
- 194 038595
Asp Gln Phe Thr Gln Lys 20 <210> 46 <211> 75 < 212> белок < 213> Levivirus MS2 <220>
< 221> misc_feature <223> последовательность белка L MS2 <400> 46
Met Glu Thr Arg Phe Pro Gln Gln Ser Gln Gln Thr Pro Ala Ser Thr 15 1015
Asn Arg Arg Arg Pro Phe Lys His Glu Asp Tyr Pro Cys Arg Arg Gln 20 2530
Gln Arg Ser Ser Thr Leu Tyr Vai Leu lie Phe Leu Ala lie Phe Leu 35 4045
Ser Lys Phe Thr Asn Gln Leu Leu Leu Ser Leu Leu Glu Ala Vai lie
5560
Arg Thr Vai Thr Thr Leu Gln Gln Leu Leu Thr 65 7075 <210> 47 <211> 54 < 212> белок <213> Levivirus PRR1 <220>
< 221> misc_feature < 223> последовательность белка L PRR1 <400> 47
Met Cys Lys Vai Ser Thr Lys Vai Asp Ser Lys Leu Thr Glu Ser Vai 15 10 15
- 195 038595
Gly Gin Leu Thr lie Arg Ser Tyr Leu Trp Leu Arg Asn lie Leu Ala 20 25 30
Leu Ala Gly Leu Leu Phe Vai lie Leu Leu Ala Thr Asn His Leu Ser 35 40 45 lie Ala lie Tyr Ser Pro 50 <210> 48 < 211> 106 < 212> белок <213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature <223> последовательность белка Gpl8 LUZ19 <400> 48
Met Arg Met Pro Thr Glu Glu Glu 1 5
Arg Met lie Arg Cys Leu Leu Ala
15
Asp lie His Glu Pro Leu Asp Leu 20
Leu Phe Pro Gly Leu Arg Thr Lys 25 30
Ala His Met Asp Pro Gin Ala Glu
40
Glu Leu Ser lie Arg lie Asp Tyr 45
Asp His Ala Lys Leu Gly Arg Met
55
Gly Phe Cys His Ala Vai Ser Leu 60
Tyr Gin Leu Ser lie Tyr Gly Arg 65 70
Glu Gly Met Vai Arg Tyr Leu Met
80
Gin Glu lie Pro Arg Arg Vai Leu 85
Glu Gly Leu Leu Vai Lys Ala Gin
95
Gin Tyr Ser Gin Ser Asn Trp Tyr
100
Ser Lys 105
- 196 038595 <210> 49 < 211> 71 < 212> белок <213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature <223> последовательность белка Gp49 LUZ19 <400> 49
Met Ser 1 Lys Ala Lys 5 Leu Arg Vai lie Ala 10 Asp Thr Pro Glu Leu 15 Glu
Ser Vai Leu Lys 20 Ala Leu Leu Thr Ala Thr 25 Tyr Ala He Glu 30 Asp Leu
Leu Asn Glu Ala 35 Vai Ala Ser Lys 40 Vai Leu Asn Ser Arg 45 Leu Gly Trp
Ser Ala 50 Vai Gly Glu Tyr Vai Glu 55 Leu Phe Asn Arg 60 Thr Gin Ser Arg
Vai Ala Gly Leu lie Pro Glu 65 70 <210> 50 <211> 321 <212> ДНК <213> Phikmvlikevirus LUZ19 <220>
<221> misc_feature <223> последовательность гена gpl8 LUZ19 <400> 50
atgagaatgc caaccgaaga agaacgcatg atccgctgtt tactggcgga tatccacgag 60
ccactggacc tgctgttccc cggcctccgt accaaggccc atatggaccc gcaagcagag 120
gaactgtcga ttcgaattga ctacgaccat gcgaagctgg gccgtatggg attctgccac 180
gcggtatccc tatatcaact gtccatatat ggccgcgagg ggatggtccg ctacctgatg 240
- 197 038595 caggagattc cccgccgcgt gctggaaggt ctgctggtca aggcgcagca gtacagccaa
300 agcaactggt acagcaaatg a
321 <210> 51 <211> 216 < 212> ДНК < 213> Phikmvlikevirus LUZ19 <220>
< 221> misc_feature < 223> последовательность гена Gp49 LUZ19 < 400> 51 atgagcaaag ccaaactacg agtcatcgcc gacaccccgg agctggagtc agtgctaaaa60 gcattgctga ccgccaccta cgctatcgag gacctgctca acgaggccgt ggctagcaag120 gtgctaaact cccgcctggg ctggtccgca gtcggcgagt atgtcgaact gttcaaccgc180 acgcaatccc gcgtggccgg gttgattccc gagtag216

Claims (15)

  1. ФОРМУЛА ИЗОБРЕТЕНИЯ
    1. Сконструированный вирус, способный при введении в клетку-хозяина продуцировать не встречающиеся в природе вирусные частицы с одним или более улучшенными вирусными свойствами, содержащий:
    (i) весь или часть сконструированного гена gp34, где сконструированный ген gp34 кодирует аминокислотную последовательность, содержащую делецию в положении, соответствующем аминокислотному положению 55 в SEQ ID NO: 5 (белок gp34); и/или (ii) модификацию одной или более последовательностей нуклеиновых кислот, кодирующих аминокислотную последовательность, имеющую по меньшей мере 85% идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 34 (белок gp13), SEQ ID NO: 35 (белок gp38), SEQ ID NO: 36 (белок gp40) и SEQ ID NO: 48 (белок gp18), где модификации включают замену С на Y в положении, соответствующем аминокислотному положению 17 в SEQ ID NO: 34 (белок gp13), замену D на Y в положении, соответствующем аминокислотному положению 36 в SEQ ID NO: 48 (белок gp18), замену D на G в положении, соответствующем аминокислотному положению 82 в SEQ ID NO: 35 (белок gp38), замену I на S в положении, соответствующем аминокислотному положению 83 в SEQ ID NO: 35 (белок gp38), и замену N на D в положении, соответствующем аминокислотному положению 253 в SEQ ID NO: 36 (белок gp40); и/или (iii) вставку гетерологичной молекулы нуклеиновой кислоты в последовательность нуклеиновой кислоты, кодирующую аминокислотную последовательность, имеющую по меньшей мере 85% идентичность с SEQ ID NO: 49 (белок gp49), или замену последовательности нуклеиновой кислоты, содержащейся в последовательности нуклеиновой кислоты, кодирующей аминокислотную последовательность, имеющую по меньшей мере 85% идентичность с SEQ ID NO: 49 (gp49), молекулой гетерологичной нуклеиновой кислоты; и/или (iv) весь или часть гетерологичного гена gp18, где гетерологичный ген gp18 кодирует аминокислотную последовательность по меньшей мере с 85% идентичностью с SEQ ID NO: 38 (последовательность белка gp18).
  2. 2. Сконструированный вирус по п.1, причем указанный вирус содержит сконструированный ген gp34, где сконструированный ген gp34 кодирует аминокислотную последовательность, содержащую делецию в положении, соответствующем аминокислотному положению 55 в SEQ ID NO: 5 (белок gp34), причем указанный фаг проявляет повышенную литическую активность по сравнению с LUZ19 дикого типа.
  3. 3. Сконструированный вирус по любому из пп. 1 и 2, причем указанный вирус содержит модификацию одной или более последовательностей нуклеиновых кислот, кодирующих аминокислотную последовательность, имеющую по меньшей мере 85% идентичность с последовательностью, выбранной из группы, состоящей из SEQ ID NO: 34 (белок gp13), SEQ ID NO: 35 (белок gp38), SEQ ID NO: 36 (белок gp40) и SEQ ID NO: 48 (белок gp18), где модификации включают замену С на Y в положении, соответствующем аминокислотному положению 17 в SEQ ID NO: 34 (белок gp13), замену D на Y в положении, соответствующем аминокислотному положению 36 в SEQ ID NO: 48 (белок gp18), замену D на G в положе-
    - 198 038595 нии, соответствующем аминокислотному положению 82 в SEQ ID NO: 35 (белок gp38), замену I на S в положении, соответствующем аминокислотному положению 83 в SEQ ID NO: 35 (белок gp38), и замену
    N на D на положении, соответствующем аминокислотному положению 253 в SEQ ID NO: 36 (белок gp40), в результате чего указанный вирус демонстрирует улучшенный диапазон хозяев по сравнению с
    LUZ19 дикого типа.
  4. 4. Сконструированный вирус по любому из пп.1-3, причем указанный вирус содержит замену последовательности нуклеиновой кислоты, содержащей последовательность нуклеиновой кислоты, кодирующую аминокислотную последовательность, имеющую по меньшей мере 85% идентичность с SEQ ID NO: 49 (gp49), гетерологичной нуклеиновой кислотой.
  5. 5. Сконструированный вирус по п.4, в котором указанная гетерологичная нуклеиновая кислота содержит ген, который кодирует агент, диспергирующий биопленку.
  6. 6. Сконструированный вирус по п.5, в котором указанная гетерологичная нуклеиновая кислота кодирует экзополисахаридную (EPS) деполимеразу или фенолрастворимый модулин (PSM).
  7. 7. Сконструированный вирус по п.5, в котором указанная гетерологичная нуклеиновая кислота содержит ген, выбранный из группы, состоящей из деполимеразы EPS (Ppl5gp44 хвостовой шип gp44 из Pseudomonas pudita Ф15 (SEQ ID NO: 14)), NTn34 хвостовой шип gp34 из фага Klebsiella pneumoniae NTU (SEQ ID NO: 13), LKAlgp49 хвостовой шип gp49 из фага P.aeruginosa (SEQ ID NO: 12), поверхностно-активные фенол-растворимые модулины из Staphylococcus epidermidis (PSMa, SEQ ID NO: 18), Staphylococcus aureus (PSMa3 (SEQ ID NO: 16) и/или PSMb2 (SEQ ID NO: 17) и сурфактин DspB из Aggregatibacteractinomycetemcomitans (SEQ ID NO: 15).
  8. 8. Сконструированный вирус по любому из пп.5-7, где гетерологичная последовательность нуклеиновой кислоты функционально связана с основным капсидным промотором PgP32 (SEQ ID NO: 21).
  9. 9. Сконструированный вирус по любому из пп.5-8, в котором гетерологичная последовательность нуклеиновой кислоты функционально связана с терминатором Tgp32 (SEQ ID NO: 22).
  10. 10. Сконструированный вирус по любому из пи. 1-9, причем сконструированный вирус представляет собой бактериофаг, сконструированный для экспрессии противомикробного пептида.
  11. 11. Сконструированный вирус по п. 10, в котором противомикробный пептид выбран из группы, состоящей из литического фермента, ацилазы, аминопептидазы, амилазы, карбогидразы, карбоксипептидазы, каталазы, целлюлазы, хитиназы, кутиназы, циклодекстрин гликозилтрансферазы, дезоксирибонуклеазы, эстеразы, α-галактозидазы, β-галактозидазы, глюкоамилазы, α-глюкозидазы, β-глюкозидазы, галопероксидазы, инвертазы, лакказы, липазы, маннозидазы, оксидазы, пектинолитического фермента, пептидоглутаминазы, пероксидазы, фитазы, полифенолоксидазы, протеолитического фермента, рибонуклеазы, трансглутаминазы, ксиланазы, РНКазы, ДНКазы, лизостафина или порообразующего пептида.
  12. 12. Сконструированный вирус по п. 10, где противомикробный пептид представляет собой ДНКазу.
  13. 13. Сконструированный вирус по любому из пп.1-12, в котором указанный модифицированный геном представляет собой модифицированный phiKMV-подобный геном.
  14. 14. Сконструированный вирус по любому из пп.1-13, в котором указанный модифицированный геном представляет собой модифицированный геном LUZ19.
  15. 15. Сконструированный вирус по п. 14, в котором gpl8 LUZ19 дикого типа заменен на gpl8 вируса LKD16 (SEQIDNO: 7).
    А) Очистка вирусного генома непосредственно из вирусных частиц
    Б) Сайт-специфическое расщепление очищенного вирусного генома (ДНК или РНК) с очищенной РНК-управляемой нуклеазой и нацеливающей РНК(ами) __________
    В) Деактивация РНК-управляемой нуклеазы и необязательная очистка расщепленных продуктов с использованием фенольно-хпороформной экстракции
    Г) Создание вставленного фрагмента посредством прямого синтеза ДНК/РНК, сборки множества олигонуклеотидов, выделения рекомбинанатной ДНК (такой как плазмиды), или ПЦР-амплификации из матрицы
    Д) Сборка in vitro геномных фрагментов с использованием методик in vitro, таких как, но без ограничений, сборка Гибсона, SLIC, лигирование и др.
    Е) Трансформация рекомбинантного генома непосредственно в клетки хозяина для образования функциональных вирусных , частиц s
EA201791343A 2014-12-16 2015-12-15 Композиции и способы для конструирования вирусного генома in vitro EA038595B1 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462092707P 2014-12-16 2014-12-16
US201562102362P 2015-01-12 2015-01-12
US201562242811P 2015-10-16 2015-10-16
PCT/US2015/065891 WO2016100389A1 (en) 2014-12-16 2015-12-15 Compositions of and methods for in vitro viral genome engineering

Publications (2)

Publication Number Publication Date
EA201791343A1 EA201791343A1 (ru) 2018-03-30
EA038595B1 true EA038595B1 (ru) 2021-09-21

Family

ID=56127485

Family Applications (1)

Application Number Title Priority Date Filing Date
EA201791343A EA038595B1 (ru) 2014-12-16 2015-12-15 Композиции и способы для конструирования вирусного генома in vitro

Country Status (9)

Country Link
US (4) US10221398B2 (ru)
EP (1) EP3234136A4 (ru)
JP (2) JP6842417B2 (ru)
CN (2) CN113215115B (ru)
AU (2) AU2015362618B2 (ru)
CA (1) CA2971205A1 (ru)
EA (1) EA038595B1 (ru)
HK (1) HK1245838A1 (ru)
WO (1) WO2016100389A1 (ru)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112008001301T5 (de) 2007-05-14 2010-04-29 Reserach Foundation Of State University Of New York Induktion einer physiologischen Dispersions-Antwort in Bakterien-Zellen in einem Biofilm
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
SI3354732T1 (sl) 2014-06-23 2020-07-31 Regeneron Pharmaceuticals, Inc. Z nukleazo posredovan DNA sklop
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CN113215115B (zh) 2014-12-16 2024-07-02 C3J治疗公司 用于体外病毒基因组工程的组合物和方法
US20160362667A1 (en) * 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
US10513732B2 (en) * 2015-07-13 2019-12-24 New York University Sequencing methods and kits
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
US11433260B2 (en) 2015-12-21 2022-09-06 Gholam A. Peyman Cancer treatment methods using thermotherapy and/or enhanced immunotherapy
US10136820B2 (en) * 2015-12-21 2018-11-27 Gholam A. Peyman Method to visualize very early stage neoplasm or other lesions
EP3436196A2 (en) * 2016-03-28 2019-02-06 The Charles Stark Draper Laboratory, Inc. Bacteria identification and antibiotic susceptibility profiling device
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
EP3503915B1 (en) 2016-08-26 2024-02-21 Telesis Bio Inc. Genetically engineered vibrio natriegens
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US12018250B2 (en) 2016-10-14 2024-06-25 Fred Hutchinson Cancer Center Compositions and methods for evading bacterial defense mechanisms
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
WO2018148412A1 (en) 2017-02-09 2018-08-16 The Charles Stark Draper Laboratory Inc. Recombinant k1-5 bacteriophages and uses thereof
US20190070232A1 (en) 2017-03-06 2019-03-07 Massachusetts Institute Of Technology Methods of cloning prophages and producing lytic phage particles
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
SG11201908658TA (en) 2017-03-23 2019-10-30 Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2018222891A1 (en) * 2017-06-01 2018-12-06 The Charles Stark Draper Laboratory Inc. Phage engineering: protection by circularized intermediate
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US10174295B1 (en) * 2017-08-01 2019-01-08 The Charles Stark Draper Laboratory, Inc. Composition of matter: engineering of Escherichia coli phage K1E
US11891630B2 (en) 2017-08-08 2024-02-06 The Charles Stark Draper Laboratory, Inc. Bacteriophage engineering via semi-synthesis
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
JP6923862B2 (ja) * 2018-05-22 2021-08-25 学校法人自治医科大学 抗菌ファージ、治療用組成物、殺菌剤、食品、細菌判別キット、治療用組成物製造方法、細菌除去方法、細菌判別方法、及び動物治療方法
US11541105B2 (en) 2018-06-01 2023-01-03 The Research Foundation For The State University Of New York Compositions and methods for disrupting biofilm formation and maintenance
WO2020092748A1 (en) * 2018-11-01 2020-05-07 The Trustees Of Princeton University System for protein inactivation and recombinant phages for targeted bacterial killing, infection, biodetection, and as a means of protein extraction
CA3120615A1 (en) * 2018-11-27 2020-06-04 Eligo Bioscience Chimeric receptor binding proteins for use in bacterial delivery vehicles
JP2022514700A (ja) * 2018-12-21 2022-02-14 エリゴ・バイオサイエンス 細菌送達ビヒクルにおける使用のための分岐型受容体結合多サブユニットタンパク質複合体
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
WO2020206134A1 (en) 2019-04-04 2020-10-08 Regeneron Pharmaceuticals, Inc. Methods for scarless introduction of targeted modifications into targeting vectors
EP4146804A1 (en) 2020-05-08 2023-03-15 The Broad Institute Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
CN114540389B (zh) * 2020-11-26 2024-05-14 深圳华大生命科学研究院 一种制备基因工程病毒的方法及其应用
CN112778399A (zh) * 2021-01-21 2021-05-11 南开大学 一类源自毒性淀粉样纤维纳米抗菌肽的制备及性质表征方法
WO2022251644A1 (en) 2021-05-28 2022-12-01 Lyell Immunopharma, Inc. Nr4a3-deficient immune cells and uses thereof
WO2022256437A1 (en) 2021-06-02 2022-12-08 Lyell Immunopharma, Inc. Nr4a3-deficient immune cells and uses thereof
CN113755451B (zh) * 2021-09-03 2023-06-06 广西大学 一株大肠杆菌噬菌体gn6及其应用
EP4248987A1 (en) * 2022-03-21 2023-09-27 Nomad Bioscience GmbH Chimeric bacteriocins and method for the control of pseudomonas
WO2023225665A1 (en) 2022-05-19 2023-11-23 Lyell Immunopharma, Inc. Polynucleotides targeting nr4a3 and uses thereof
WO2024064958A1 (en) 2022-09-23 2024-03-28 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells
WO2024064952A1 (en) 2022-09-23 2024-03-28 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells overexpressing c-jun
WO2024077174A1 (en) 2022-10-05 2024-04-11 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996011947A1 (en) * 1994-10-13 1996-04-25 Goldberg Edward B Materials for the production of nanometer structures and use thereof
WO1999023107A1 (en) * 1997-10-31 1999-05-14 Maxygen, Incorporated Modification of virus tropism and host range by viral genome shuffling
WO1999041397A1 (en) * 1998-02-17 1999-08-19 Oxford Biomedica (Uk) Limited Anti-viral vectors
US20110104119A1 (en) * 2004-12-15 2011-05-05 Bowles Dawn E Chimeric Vectors
US20130225451A1 (en) * 2012-02-01 2013-08-29 Synthetic Genomics, Inc. Materials and methods for the synthesis of error-minimized nucleic acid molecules
US20140079671A1 (en) * 2010-09-17 2014-03-20 Technophage, Investigação E Desenvolvimento Em Biotecnologia, Sa Antibacterial Phage, Phage Peptides And Methods Of Use Thereof

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9809414D0 (en) 1998-05-02 1998-07-01 Scottish Crop Research Inst Method
US7019122B1 (en) 1998-10-30 2006-03-28 Janssen Pharmaceutica N.V. Unusual retrotransposon from the yeast Candida albicans
WO2002007742A2 (en) * 2000-07-25 2002-01-31 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Bacteriophage having multiple host range
WO2006021944A1 (en) 2004-08-12 2006-03-02 Leanway Automatic Areanas Ltd. Enhanced database structure configuration
US8182804B1 (en) * 2004-09-13 2012-05-22 Trustees Of Boston University Engineered enzymatically active bacteriophages and methods of uses thereof
WO2007005053A1 (en) 2005-06-30 2007-01-11 Codon Devices, Inc. Hierarchical assembly methods for genome engineering
DE602006015701D1 (de) 2005-12-29 2010-09-02 Abl Biotechnologies Ltd Neuer schizochytrium-limacinum-stamm, der sich für die produktion von lipiden und extrazellulären polysacchariden eignet, sowie verfahren hierfür
CA2661808A1 (en) 2006-08-29 2008-03-06 Danisco Us, Inc., Genencor Division Compositions and methods for improved protein production
US8404468B2 (en) 2007-05-23 2013-03-26 Cognis Ip Management Gmbh Efficient astaxanthin production strains derived from Haematococcus pluvialis
GB0715416D0 (en) * 2007-08-07 2007-09-19 Phico Therapeutics Ltd Modified bacteriophage
EP2238157A2 (en) 2008-01-10 2010-10-13 Trustees of Boston University Engineered bacteriophages as adjuvants for antimicrobial agents and compositions and methods of use thereof
EP3064599B1 (en) 2008-02-15 2018-12-12 Synthetic Genomics, Inc. Methods for in vitro joining and combinatorial assembly of nucleic acid molecules
US8207363B2 (en) 2009-03-19 2012-06-26 Martek Biosciences Corporation Thraustochytrids, fatty acid compositions, and methods of making and uses thereof
CN101928670B (zh) 2009-09-24 2012-02-22 上海天伟生物制药有限公司 一种抗生素的高产菌株及其制备方法和用途
US8524220B1 (en) 2010-02-09 2013-09-03 David Gordon Bermudes Protease inhibitor: protease sensitivity expression system composition and methods improving the therapeutic activity and specificity of proteins delivered by bacteria
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US9617522B2 (en) * 2013-09-05 2017-04-11 Massachusetts Institute Of Technology Tuning bacteriophage host range
AU2015330971B2 (en) * 2014-10-09 2021-05-27 Lipotek Pty Ltd Chimeric proteins
CN113215115B (zh) 2014-12-16 2024-07-02 C3J治疗公司 用于体外病毒基因组工程的组合物和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996011947A1 (en) * 1994-10-13 1996-04-25 Goldberg Edward B Materials for the production of nanometer structures and use thereof
WO1999023107A1 (en) * 1997-10-31 1999-05-14 Maxygen, Incorporated Modification of virus tropism and host range by viral genome shuffling
WO1999041397A1 (en) * 1998-02-17 1999-08-19 Oxford Biomedica (Uk) Limited Anti-viral vectors
US20110104119A1 (en) * 2004-12-15 2011-05-05 Bowles Dawn E Chimeric Vectors
US20140079671A1 (en) * 2010-09-17 2014-03-20 Technophage, Investigação E Desenvolvimento Em Biotecnologia, Sa Antibacterial Phage, Phage Peptides And Methods Of Use Thereof
US20130225451A1 (en) * 2012-02-01 2013-08-29 Synthetic Genomics, Inc. Materials and methods for the synthesis of error-minimized nucleic acid molecules

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
BI Y. et al. High-Efficiency Targeted Editing of Large Viral Genomes by RNA-Guided Nucleases. PLoS Pathogens. 1 May 2014, Vol. 10, No. 5; e1004090; DOI: 10.1371/journal.ppat.1004090 *
CEYSSENS P.J. et al. Genomic Analysis of Pseudomonas aeruginosa Phages LKD16 and LKA1: Establishment of the KMV Subgroup within the T7 Supergroup. Journal of Bacteriology. October 2006, Vol. 188, No. 19, pages 6924-6931; DOI: 10.1128/JB.00831-06. NCBI, Supplement, page 1 *
CEYSSENS P.J. Isolation and Characterization of Lytic Bacteriophage Infecting Pseudomonas Aeruginosa [online]. University in Leuven. December 2009 [retrieved on 2016-04-14]. Retrieved from the Internet; <URL: http://lirias.kuleuven.be/bitstream/123456789/250877/1/phdAERUGINOSA>; pages 1-166; page VI, page 64, third paragraph; Tables 4.2, 4.4 *
ENGLER C. et al. A One Pot, One Step, Precision Cloning Method with High Throughput Capability. PLoS ONE. 05 November 2008, Vol. 3, No. 11, pages 1-7; page 4, column 2, first paragraph. DOI: 10.1371/journal.pone.0003647. *
GLONTI T. et al. Hypothetical Protein PT2_gp16 [Pseudomonas phage PT2]. National Center for Biotechnology Information. Genbank Entry. 19 October 2007 [retrieved on 14 April 2016]; Retrieved from the Internet <URL: http://www.ncbi.nlm.nih.gov/protein/195546717>; page 1. *
GLONTI T. et al. Tail Tubular Protein B [Pseudomonas phage PT2]. National Center for Biotechnology Information. Genbank Entry. 19 October 2007 [retrieved on 14 April 2016]; Retrieved from the Internet <URL: http://www.ncbi.nlm.nih.gov/protein/195546741>; pages 1-2. *
KIM S. et al. Highly Efficient RNA-Guided Genome Editing in Human Cells via Delivery of Purified Cas9 Ribonucleoproteins. Genome Research. June 2014, Vol. 24, No. 6, pages 1012-1019; abstract. DOI: 10.1101/gr.171322.113 *
LAMMENS E. et al. Representational Difference Analysis (RDA) of Bacteriophage Genomes. Journal of Microbiological Methods. 20 February 2009, Vol. 77, pages 207-213; DOI:10.1016/j.mimet.2009.02.006. NCBI Supplement *
LIU B.L. et al. ICP34.5 Deleted Herpes Simplex Virus with Enhanced Oncolytic, Immune Stimulating, and Anti-tumour Properties. Gene Therapy. 2003, Vol. 10, pages 292-303; abstract; page 293, second column, second paragraph; 298, first column, second paragraph; page 301, first column, third paragraph - second column, first paragraph; Figures 1, 2, 4, DOI: 10.1038/sj.gt.3301885 *
MARTEL B. et al. CRISPR-Cas: An Efficient Tool for Genome Engineering of Virulent Bacteriophages. Nucleic Acids Research. 24 July 2014, Vol. 14, No. 42, pages 1-10; abstract. DOI: 10.1093/nar/gku628 *
PINGOUD A. Spermidine Increases the Accuracy of Type II Restriction Endonucleases. Suppression of Cleavage at Degenerate, Non-Symmetrical Sites. European Journal of Biochemistry, 1985, Vol. 147, pages 105-109; abstract; page 106, second column, first-second paragraphs *
SUENAGA T. et al. Engineering Large Viral DNA Genomes Using the CRISPR-Cas9 System. Microbiology and Immunology. September 2014, Vol. 50, pages 513-522; abstract; page 514, second column, second paragraph; page 515, second column, first paragraph. DOI: 10.1111/1348-0421.12180. *

Also Published As

Publication number Publication date
US20160186147A1 (en) 2016-06-30
AU2015362618B2 (en) 2022-01-27
CN113215115B (zh) 2024-07-02
US10221398B2 (en) 2019-03-05
EP3234136A1 (en) 2017-10-25
CN107278227A (zh) 2017-10-20
US20190322988A1 (en) 2019-10-24
AU2015362618A1 (en) 2017-07-13
US20210087538A1 (en) 2021-03-25
WO2016100389A1 (en) 2016-06-23
HK1245838A1 (zh) 2018-08-31
AU2022202713A1 (en) 2022-05-19
US20190211312A1 (en) 2019-07-11
CN107278227B (zh) 2021-05-28
JP2021074024A (ja) 2021-05-20
JP7133671B2 (ja) 2022-09-08
US10837004B2 (en) 2020-11-17
US11913032B2 (en) 2024-02-27
US10711253B2 (en) 2020-07-14
EP3234136A4 (en) 2018-10-10
JP6842417B2 (ja) 2021-03-17
EA201791343A1 (ru) 2018-03-30
CA2971205A1 (en) 2016-06-23
JP2017537643A (ja) 2017-12-21
CN113215115A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
JP7133671B2 (ja) インビトロウイルスゲノム工学のための組成物及びその方法
AU2021200010B2 (en) Novel CRISPR enzymes and systems
CN110564663B (zh) 微生物的受控生长
KR20190116407A (ko) 고-충실도 Cas9 변이체 및 그의 적용
KR20240036729A (ko) 클래스 ii, 타입 v crispr 시스템
WO2022068912A1 (en) Engineered crispr/cas13 system and uses thereof
WO2018220616A2 (en) Genetic systems that defend against foreign dna and uses thereof
CN112513251A (zh) 改造的抗微生物肽
AU2017252409B2 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides
KR20240017367A (ko) 클래스 ii, v형 crispr 시스템
WO2022188039A1 (en) Engineered crispr/cas13 system and uses thereof
EP4222253A1 (en) Engineered crispr/cas13 system and uses thereof
CA2413612A1 (fr) Vecteurs d&#39;expression comprenant un fragment modifie de l&#39;operon tryptophane
US20210093679A1 (en) Engineered gut microbes and uses thereof
US7981670B2 (en) Method of assessing DNA mutability
Harrison Engineering Bacteriophages to Combat Antimicrobial Resistance
WO2021152092A1 (en) Tools and methods for mycoplasma engineering
WO2002008431A1 (en) Compositions and methods for use thereof in modifying the genomes of microorganisms