RU2812852C2 - Non-viral dna vectors and options for their use for expression of therapeutic agent based on factor viii (fviii) - Google Patents

Non-viral dna vectors and options for their use for expression of therapeutic agent based on factor viii (fviii) Download PDF

Info

Publication number
RU2812852C2
RU2812852C2 RU2021129628A RU2021129628A RU2812852C2 RU 2812852 C2 RU2812852 C2 RU 2812852C2 RU 2021129628 A RU2021129628 A RU 2021129628A RU 2021129628 A RU2021129628 A RU 2021129628A RU 2812852 C2 RU2812852 C2 RU 2812852C2
Authority
RU
Russia
Prior art keywords
vector
itr
sequence
cccdna
fviii
Prior art date
Application number
RU2021129628A
Other languages
Russian (ru)
Other versions
RU2021129628A (en
Inventor
Дуглас Антони КЕРР
Дебра КЛАТТЕ
Филлип САМАЙОА
Натаниел СИЛВЕР
Original Assignee
Дженерейшен Био Ко.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Дженерейшен Био Ко. filed Critical Дженерейшен Био Ко.
Publication of RU2021129628A publication Critical patent/RU2021129628A/en
Application granted granted Critical
Publication of RU2812852C2 publication Critical patent/RU2812852C2/en

Links

Abstract

FIELD: biotechnology.
SUBSTANCE: following is described: a group of inventions including a capsid-free vector based on closed-ended DNA (ceDNA) for the expression of factor VIII (FVIII) protein, a method of expressing the FVIII protein in a cell, a pharmaceutical composition for gene therapy, a method of treating a subject suffering from hemophilia A, a cell for producing the protein FVIII, a ceDNA vector delivery composition and a ceDNA vector delivery kit. In one embodiment, the capsidless vector comprises at least one nucleic acid sequence located between flanking inverted terminal repeats (ITRs), wherein the at least one nucleic acid sequence encodes at least one factor VIII (FVIII) protein and is codon optimized for expression in the cell.
EFFECT: invention expands the range of agents for expressing factor VIII (FVIII) protein.
53 cl, 16 dwg, 15 tbl, 14 ex

Description

РОДСТВЕННЫЕ ЗАЯВКИRELATED APPLICATIONS

[0001] Настоящая заявка испрашивает приоритет согласно предварительной заявке США №62/817904, поданной 13 марта 2019 г., и предварительной заявке США №62/856432, поданной 3 июня 2019 г., содержание каждой из которых полностью включено в данный документ посредством ссылки.[0001] This application claims benefit to US Provisional Application No. 62/817904, filed March 13, 2019, and US Provisional Application No. 62/856432, filed June 3, 2019, the contents of each of which are incorporated herein by reference in their entirety. .

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES

[0002] Настоящая заявка включает перечень последовательностей, который был подан в электронном виде в формате ASCII, а также последовательности в Таблицах 1-9 в данном документе, каждая из которых полностью включена в данный документ посредством ссылки. Указанная копия в формате ASCII, созданная 11 марта 2020 г., названа 131698-06020_SL.txt и имеет размер 116781 байтов.[0002] This application includes a sequence listing that has been filed electronically in ASCII format, as well as the sequences in Tables 1-9 herein, each of which is incorporated herein by reference in its entirety. The listed ASCII copy, created on March 11, 2020, is named 131698-06020_SL.txt and is 116781 bytes in size.

ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD

[0003] Настоящее изобретение относится к области генной терапии, включая невирусные векторы для экспрессии трансгена или выделенных полинуклеотидов у субъекта или в клетке. Настоящее раскрытие также относится к конструкциям нуклеиновых кислот, промоторам, векторам и клеткам-хозяевам, включая полинуклеотиды, а также к способам доставки экзогенных последовательностей ДНК в целевую клетку, ткань, орган или организм. Например, настоящее раскрытие обеспечивает способы применения невирусных зкДНК-векторов для экспрессии фактора VIII (FVIII) из клетки, например, экспрессии терапевтического белка FVIII для лечения субъекта, страдающего гемофилией А. Способы и композиции можно применять, например, для лечения заболевания путем экспрессии FVIII в клетке или ткани субъекта, нуждающегося в этом.[0003] The present invention relates to the field of gene therapy, including non-viral vectors for expression of a transgene or isolated polynucleotides in a subject or cell. The present disclosure also relates to nucleic acid constructs, promoters, vectors and host cells, including polynucleotides, as well as methods for delivering exogenous DNA sequences to a target cell, tissue, organ or organism. For example, the present disclosure provides methods of using non-viral cccDNA vectors to express factor VIII (FVIII) from a cell, for example, expressing a therapeutic FVIII protein for treating a subject suffering from hemophilia A. The methods and compositions can be used, for example, to treat a disease by expressing FVIII in cell or tissue of the subject in need.

УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE ART

[0004] Целью генной терапии является улучшение клинических исходов у пациентов, страдающих либо генетическими мутациями, либо приобретенными заболеваниями, вызванными аберрацией в профиле экспрессии генов. Генная терапия включает лечение или предотвращение медицинских состояний, вызванных дефектными генами или аномальной регуляцией или экспрессией, например, недостаточной экспрессией или избыточной экспрессией, что может привести к нарушению, заболеванию, злокачественному новообразованию и т.д. Например, заболевание или нарушение, вызванное дефектным геном, можно лечить, предотвращать или облегчать путем доставки пациенту корректирующего генетического материала, или можно лечить, предотвращать или облегчать путем изменения или подавления у пациента дефектного гена, например, с помощью корректирующего генетического материала, приводящего к терапевтической экспрессии генетического материала в организме пациента.[0004] The goal of gene therapy is to improve clinical outcomes in patients suffering from either genetic mutations or acquired diseases caused by aberrations in the gene expression profile. Gene therapy involves the treatment or prevention of medical conditions caused by defective genes or abnormal regulation or expression, such as underexpression or overexpression, which can lead to a disorder, disease, malignancy, etc. For example, a disease or disorder caused by a defective gene may be treated, prevented, or ameliorated by delivering corrective genetic material to a patient, or may be treated, prevented, or ameliorated by modifying or suppressing a defective gene in a patient, for example, by providing corrective genetic material resulting in a therapeutic effect. expression of genetic material in the patient’s body.

[0005] Основой генной терапии является обеспечение транскрипционной кассеты с активным генным продуктом (иногда называемым трансгеном), например, который может приводить к положительному эффекту усиления функции, отрицательному эффекту потери функции или другому исходу. Такие исходы можно отнести к экспрессии терапевтического белка, такого как антитело, функциональный фермент или слитый белок. Генную терапию также можно применять для лечения заболевания или злокачественного новообразования, вызванного другими факторами. Моногенные нарушения у человека можно лечить путем доставки нормального гена в целевые клетки и его экспрессии в них. Доставку и экспрессию корректирующего гена в клетках-мишенях пациента можно осуществлять с применением многочисленных способов, включая применение сконструированных вирусов и вирусных векторов для доставки генов. Среди многочисленных доступных векторов вирусного происхождения (например, рекомбинантный ретровирус, рекомбинантный лентивирус, рекомбинантный аденовирус и т.п.) рекомбинантный аденоассоциированный вирус (рААВ) приобретает все большую популярность в генной терапии в качестве многоцелевого вектора.[0005] The basis of gene therapy is the provision of a transcription cassette with an active gene product (sometimes called a transgene), for example, which can lead to a positive gain-of-function effect, a negative loss-of-function effect, or other outcome. Such outcomes may be attributed to the expression of a therapeutic protein, such as an antibody, functional enzyme, or fusion protein. Gene therapy can also be used to treat a disease or malignancy caused by other factors. Monogenic disorders in humans can be treated by delivering a normal gene to target cells and expressing it in them. Delivery and expression of the corrective gene in target cells of a patient can be achieved using numerous methods, including the use of engineered viruses and viral vectors for gene delivery. Among the numerous viral vectors available (eg, recombinant retrovirus, recombinant lentivirus, recombinant adenovirus, etc.), recombinant adeno-associated virus (rAAV) is gaining increasing popularity in gene therapy as a multi-purpose vector.

[0006] Аденоассоциированные вирусы (ААВ) принадлежат к семейству Parvoviridae и, более конкретно, составляют род депендопареоеирусое. Векторы, происходящие из ААВ (т.е. рекомбинантные ААВ (рААВ) или ААВ-векторы), являются привлекательным способом доставки генетического материала, поскольку (i) они способны инфицировать (трансдуцировать) широкий спектр типов неделящихся и делящихся клеток, включая миоциты и нейроны; (ii) они лишены вирусных структурных генов, что уменьшает ответы клеток хозяина на вирусную инфекцию, например, опосредуемые интерфероном ответы; (iii) вирусы дикого типа считаются непатологичными у человека; (iv) в отличие от ААВ дикого типа, которые способны интегрироваться в геном клетки хозяина, дефектные по репликации ААВ-векторы лишены гена rep и обычно персистируют в виде эписом, что ограничивает риск инсерционного мутагенеза или генотоксичности; и (ν) по сравнению с другими векторными системами ААВ-векторы обычно считаются относительно слабыми иммуногенами и, следовательно, не вызывают значительного иммунного ответа (см. ii), обеспечивая, таким образом, персистенцию векторной ДНК и, потенциально, долговременную экспрессию терапевтических трансгенов.[0006] Adeno-associated viruses (AAVs) belong to the family Parvoviridae and, more specifically, constitute the genus Dependopareoviridae. AAV-derived vectors (i.e., recombinant AAV (rAAV) or AAV vectors) are an attractive method of delivering genetic material because (i) they are capable of infecting (transducing) a wide range of nondividing and dividing cell types, including myocytes and neurons ; (ii) they lack viral structural genes, which reduces host cell responses to viral infection, such as interferon-mediated responses; (iii) wild-type viruses are considered non-pathological in humans; (iv) unlike wild-type AAVs, which are capable of integrating into the host cell genome, replication-defective AAV vectors lack the rep gene and usually persist as episomes, which limits the risk of insertional mutagenesis or genotoxicity; and (ν) compared to other vector systems, AAV vectors are generally considered to be relatively weak immunogens and therefore do not elicit a significant immune response (see ii), thus allowing vector DNA persistence and potentially long-term expression of therapeutic transgenes.

[0007] Однако применение частиц ААВ в качестве вектора для доставки генов имеет несколько серьезных недостатков. Одним из основных недостатков, ассоциированных с рААВ, является ограниченная емкость вирусной упаковки, составляющая примерно 4,5 тыс.п.о. гетерологичной ДНК (Dong et al, 1996; Athanasopoulos et al, 2004; Lai et al, 2010), вследствие этого применение ААВ-векторов ограничено их способностью кодировать белки размером менее 150000 Да. Вторым недостатком является то, что в результате распространенности инфекции ААВ дикого типа среди населения кандидаты на генную терапию с использованием рААВ должны проходить скрининг на наличие нейтрализующих антител, устраняющих вектор из организма пациента. Третий недостаток связан с иммуногенностью капсида, которая препятствует повторному введению пациентам, которые не были отстранены от начального лечения. Иммунная система пациента может отвечать на вектор, который фактически выступает в роли «бустерной» прививки, стимулирующей выработку высоких титров антител к ААВ иммунной системой, которые исключают возможность лечения в будущем. В некоторых недавних сообщениях выражены опасения, касающиеся иммуногенности в ситуациях, подразумевающих применение высоких доз. Другой заметный недостаток заключается в относительно медленном начале ААВ-опосредуемой экспрессии генов, учитывая, что одноцепочечная ДНК ААВ должна быть преобразована в двухцепочечную ДНК до экспрессии гетерологичного гена.[0007] However, the use of AAV particles as a vector for gene delivery has several serious disadvantages. One of the major disadvantages associated with rAAV is the limited viral packaging capacity of approximately 4.5 kb. heterologous DNA (Dong et al, 1996; Athanasopoulos et al, 2004; Lai et al, 2010), therefore the use of AAV vectors is limited by their ability to encode proteins smaller than 150,000 Da. A second disadvantage is that, as a result of the prevalence of wild-type AAV infection in the population, candidates for gene therapy using rAAV must be screened for the presence of neutralizing antibodies that eliminate the vector from the patient. A third disadvantage relates to the immunogenicity of the capsid, which precludes re-administration in patients who have not been withdrawn from initial treatment. The patient's immune system may respond to the vector, which essentially acts as a "booster" shot, stimulating the immune system to produce high titers of anti-AAV antibodies, which preclude future treatment. Some recent reports have raised concerns regarding immunogenicity in situations involving high doses. Another notable disadvantage is the relatively slow onset of AAV-mediated gene expression, given that single-stranded AAV DNA must be converted to double-stranded DNA before expression of the heterologous gene.

[0008] Кроме того, обычные вирионы ААВ с капсидами получают путем введения плазмиды или плазмид, содержащих геном ААВ, гены rep и гены cap (Grimm et al., 1998). Однако было обнаружено, что такие вирусные векторы на основе заключенного в капсид ААВ неэффективно трансдуцируют определенные типы клеток и тканей, а капсиды также индуцируют иммунный ответ.[0008] In addition, conventional AAV capsid virions are produced by introducing a plasmid or plasmids containing the AAV genome, rep genes and cap genes (Grimm et al., 1998). However, such capsidized AAV viral vectors have been found to ineffectively transduce certain types of cells and tissues, and capsids also induce an immune response.

[0009] Соответственно, применение векторов на основе аденоассоциированного вируса (ААВ) для генной терапии ограничено из-за однократного введения пациентам (вследствие иммунного ответа пациента), ограниченного диапазона трансгенного генетического материала, подходящего для доставки в ААВ-векторах ввиду минимальной емкости вирусной упаковки (около 4,5 тыс.п.о.), и медленной ААВ-опосредуемой экспрессии генов.[0009] Accordingly, the use of adeno-associated virus (AAV) vectors for gene therapy is limited due to single administration to patients (due to the patient's immune response), a limited range of transgenic genetic material suitable for delivery in AAV vectors due to the minimal capacity of the viral packaging ( about 4.5 kb), and slow AAV-mediated gene expression.

[0010] Существует большая неудовлетворенная потребность в модифицирующих заболевание видах терапии при гемофилии А. Современные виды терапии обременительны и требуют внутривенных (в/в) введений. Во-первых, эти инъекционные препараты фактора VIII не обеспечивают непрерывную доставку факторов, при этом минимальные уровни допускают эпизоды кровотечения. Во-вторых, отсутствуют одобренные виды генной терапии гемофилии А, а виды терапии на основе ААВ не могут применяться у 25%-40% пациентов из-за уже существующих антител. ААВ может быть введен только один раз, и полученные уровни фактора VIII могут быть недостаточно высокими, чтобы быть эффективными, или могут превышать нормальные, уровни доз не поддаются титрованию. В-третьих, многие пациенты, страдающие гемофилией А, не могут использовать эти виды терапии из-за выработки нейтрализующих антител к этим экзогенным, искусственным факторам свертывания крови.[0010] There is a large unmet need for disease-modifying therapies for hemophilia A. Current therapies are cumbersome and require intravenous (IV) administrations. First, these injectable factor VIII preparations do not provide continuous factor delivery, with minimal levels allowing bleeding episodes. Second, there are no approved gene therapies for hemophilia A, and AAV-based therapies cannot be used in 25% to 40% of patients due to pre-existing antibodies. AAV may only be administered once, and the resulting levels of factor VIII may not be high enough to be effective or may be higher than normal dose levels that cannot be titrated. Third, many patients with hemophilia A are unable to use these therapies due to the production of neutralizing antibodies to these exogenous, man-made clotting factors.

[0011] Соответственно, в данной области существует потребность в технологии, которая обеспечивает экспрессию терапевтического белка FVIII в клетке, ткани или организме субъекта для лечения гемофилии А.[0011] Accordingly, there is a need in the art for technology that enables expression of a therapeutic FVIII protein in a cell, tissue, or body of a subject for the treatment of hemophilia A.

КРАТКОЕ ОПИСАНИЕSHORT DESCRIPTION

[0012] Технология, описанная в данном документе, относится к способам и композициям для лечения гемофилии А путем экспрессии белка фактора VIII (FVIII) с бескапсидного (например, невирусного) ДНК-вектора с ковалентно замкнутыми концами (называемого в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), причем указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты FVIII или ее варианты, оптимизированные по кодонам. Этот зкДНК-вектор можно применять для получения белков FVIII для лечения, мониторинга и диагностики. Применение зкДНК-векторов, экспрессирующих FVIII, у субъекта для лечения гемофилии А подходит для: (i) обеспечения модифицирующих заболевание уровней фермента FVIII, (ii) минимально инвазивной доставки, (iii) повторяемости и дозирования до достижения эффекта, (iv) быстрого начала терапевтического эффекта, (v) устойчивой экспрессии корректирующего фермента FVIII в печени, (vi) восстановления функции цикла мочевины, и/или (vii) титрования для достижения соответствующих фармакологических уровней дефектного фермента.[0012] The technology described herein relates to methods and compositions for treating hemophilia A by expressing factor VIII (FVIII) protein from a capsidless (e.g., non-viral) DNA vector with covalently closed ends (referred to herein as a “DNA vector closed ends" or "ccDNA vector"), wherein said cccDNA vector contains a FVIII nucleic acid sequence or codon optimized variants thereof. This cccDNA vector can be used to produce FVIII proteins for treatment, monitoring and diagnosis. The use of cccDNA vectors expressing FVIII in a subject for the treatment of hemophilia A is suitable for: (i) providing disease-modifying levels of the FVIII enzyme, (ii) minimally invasive delivery, (iii) repeatability and dosing until effect is achieved, (iv) rapid onset of therapeutic effect, (v) sustained expression of the corrective FVIII enzyme in the liver, (vi) restoration of urea cycle function, and/or (vii) titration to achieve appropriate pharmacological levels of the defective enzyme.

[0013] Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий FVIII, необязательно присутствует в составе липосомных наночастиц (ЛНЧ) для лечения гемофилии А. ЗкДНК-векторы, описанные в данном документе, могут обеспечивать одно или более преимуществ, включая, но не ограничиваясь перечисленными, обеспечение модифицирующих заболевание уровней фактора VIII, минимальную инвазивность при доставке, повторяемость и дозирование до достижения эффекта, обеспечение быстрого начала терапевтического эффекта в течение нескольких дней после терапевтического вмешательства, устойчивую экспрессию корректирующих уровней фактора VIII в кровотоке, возможность титрования для достижения соответствующих фармакологических уровней дефектного фактора коагуляции и/или обеспечение способов лечения другого типа гемофилии, включая, но не ограничиваясь этим, дефицит фактора VIII.[0013] In some embodiments, a cccDNA vector expressing FVIII is optionally present in liposomal nanoparticles (LNPs) for the treatment of hemophilia A. The cccDNA vectors described herein may provide one or more benefits, including, but not limited to, the following: , providing disease-modifying levels of factor VIII, minimal invasiveness in delivery, repeatability and dosing until effect is achieved, ensuring rapid onset of therapeutic effect within days of therapeutic intervention, sustained expression of corrective levels of factor VIII in the bloodstream, ability to titrate to achieve appropriate pharmacological levels of the defective coagulation factor and/or providing treatments for another type of hemophilia, including, but not limited to, factor VIII deficiency.

[0014] Соответственно, настоящее изобретение, описанное в данном документе, относится к бескапсидному (например, невирусному) ДНК-вектору с ковалентно замкнутыми концами (называемому в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), содержащему гетерогенный ген, кодирующий FVIII, чтобы обеспечить экспрессию терапевтического белка FVIII в клетке. В соответствии с одним аспектом в настоящем раскрытии предложен бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетер о логичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из любой из последовательностей в Таблице 1. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из любой из последовательностей в Таблице 9. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из группы, состоящей из SEQ ID NO: 207, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 199, SEQ ID NO: 208, SEQ ID NO: 211 и SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 214.[0014] Accordingly, the present invention described herein relates to a capsid-free (e.g., non-viral) covalently closed-end DNA vector (referred to herein as a “closed-end DNA vector” or “ccDNA vector”) comprising a heterogeneous gene encoding FVIII to allow expression of the therapeutic FVIII protein in the cell. In accordance with one aspect, the present disclosure provides a capsidless closed-end DNA (ccDNA) vector comprising at least one heterologous nucleotide sequence between flanking inverted terminal repeats (ITRs), wherein at least one heterologous nucleotide sequence encodes at least one FVIII protein, wherein the at least one heterologous nucleotide sequence that encodes the at least one FVIII protein is selected from any of the sequences in Table 1. In accordance with some embodiments, the ccDNA vector comprises a nucleic acid sequence selected from any of the sequences in Table 9. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence selected from the group consisting of SEQ ID NO: 207, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 199, SEQ ID NO: 208, SEQ ID NO: 211, and SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 85% identical to SEQ ID NO: 210. In accordance in some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 90% identical to SEQ ID NO: 210. In some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 95% identical to SEQ ID NO: 210. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least 96% identical to SEQ ID NO: 210. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least is 97% identical to SEQ ID NO: 210. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 98% identical to SEQ ID NO: 210. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence acid that is at least 99% identical to SEQ ID NO: 210. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 85% identical to SEQ ID NO: 214. In accordance with some embodiments The cccDNA vector contains a nucleic acid sequence that is at least 90% identical to SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 95% identical to SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 96% identical to SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 97% identical to SEQ ID NO: 214. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least 98% identical to SEQ ID NO: 214. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least 99% identical to SEQ ID NO: 214.

[0015] Согласно одному варианту реализации в данном документе раскрыт бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетерологичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1.[0015] In one embodiment, disclosed herein is a capsidless closed-end DNA (ccDNA) vector comprising at least one heterologous nucleotide sequence between flanking inverted terminal repeats (ITRs), wherein the at least one heterologous nucleotide sequence encodes at least one FVIII protein, wherein the at least one heterologous nucleotide sequence that encodes the at least one FVIII protein is selected from a sequence having at least 85% identity with any sequence in Table 1. In one embodiment, the specified at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 90% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 91% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence, having at least 92% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 93% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 94% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 95% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 96% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence, having at least 97% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 98% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 99% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence comprising any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence containing any sequence in Table 1.

[0016] Согласно одному варианту реализации последовательность в Таблице 1 выбрана из группы, состоящей из SEQ ID NO: 380, SEQ ID NO: 381, SEQ ID NO: 382, SEQ ID NO: 383, SEQ ID NO: 384, SEQ ID NO: 385, SEQ ID NO: 386, SEQ ID NO: 387, SEQ ID NO: 388, SEQ ID NO: 389, SEQ ID NO: 390, SEQ ID NO: 391, SEQ ID NO: 392, SEQ ID NO: 393, SEQ ID NO: 394, SEQ ID NO: 395, SEQ ID NO: 396 и SEQ ID NO: 397. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 380. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 381. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 382. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 383. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 384. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 385. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 386. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 387. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 388. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 389. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 390. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 391. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 392. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 393. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 394. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 395. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 396. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 397.[0016] In one embodiment, the sequence in Table 1 is selected from the group consisting of SEQ ID NO: 380, SEQ ID NO: 381, SEQ ID NO: 382, SEQ ID NO: 383, SEQ ID NO: 384, SEQ ID NO : 385, SEQ ID NO: 386, SEQ ID NO: 387, SEQ ID NO: 388, SEQ ID NO: 389, SEQ ID NO: 390, SEQ ID NO: 391, SEQ ID NO: 392, SEQ ID NO: 393 , SEQ ID NO: 394, SEQ ID NO: 395, SEQ ID NO: 396, and SEQ ID NO: 397. In one embodiment, the sequence is SEQ ID NO: 380. In one embodiment, the sequence is SEQ ID NO: 381 In one embodiment, the sequence is SEQ ID NO: 382. In one embodiment, the sequence is SEQ ID NO: 383. In one embodiment, the sequence is SEQ ID NO: 384. In one embodiment, the sequence is SEQ ID NO: : 385. In one embodiment, the sequence is SEQ ID NO: 386. In one embodiment, the sequence is SEQ ID NO: 387. In one embodiment, the sequence is SEQ ID NO: 388. In one embodiment, the sequence is SEQ ID NO: 389. In one embodiment, the sequence is SEQ ID NO: 390. In one embodiment, the sequence is SEQ ID NO: 391. In one embodiment, the sequence is SEQ ID NO: 392. In one embodiment, the sequence is is SEQ ID NO: 393. In one embodiment, the sequence is SEQ ID NO: 394. In one embodiment, the sequence is SEQ ID NO: 395. In one embodiment, the sequence is SEQ ID NO: 396. In one embodiment, the sequence is SEQ ID NO: 397.

[0017] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую последовательность в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из последовательности в Таблице 9.[0017] In one embodiment, the ccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 85% identity to any sequence in Table 9. In one embodiment, the ccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 90% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 91% identity to any sequence in Table 9. In one embodiment, the cccDNA vector contains a nucleic acid sequence selected from a sequence having at least 92% identity with any sequence in Table 9. In one embodiment, the cccDNA vector contains a nucleic acid sequence selected from a sequence having at least 93% identity with any sequence in Table 9. In one embodiment, the cccDNA vector contains a nucleic acid sequence selected from a sequence having at least 94% identity with any sequence in Table 9. In one embodiment, the ccDNA vector contains a nucleic acid sequence selected from a sequence having at least 95% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 96% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 97% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 98% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 99% identity to any sequence in Table 9. In one embodiment, the ccDNA vector comprises a nucleic acid sequence comprising a sequence in Table 9 In one embodiment, the cccDNA vector contains a nucleic acid sequence consisting of the sequence in Table 9.

[0018] Согласно одному варианту реализации последовательность в Таблице 9 выбрана из группы, состоящей из SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 204, SEQ ID NO: 205, SEQ ID NO: 206, SEQ ID NO: 207, SEQ ID NO: 208, SEQ ID NO: 209, SEQ ID NO: 210, SEQ ID NO: 211, SEQ ID NO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ ID NO: 216 и SEQ ID NO: 217. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 197. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 198. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 199. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 200. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 201. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 202. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 203. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 204. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 205. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 206. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 207. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 208. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 209. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 210. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 211. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 212. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 213. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 214. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 215. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 216. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 217.[0018] In one embodiment, the sequence in Table 9 is selected from the group consisting of SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO : 202, SEQ ID NO: 203, SEQ ID NO: 204, SEQ ID NO: 205, SEQ ID NO: 206, SEQ ID NO: 207, SEQ ID NO: 208, SEQ ID NO: 209, SEQ ID NO: 210 , SEQ ID NO: 211, SEQ ID NO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ ID NO: 216, and SEQ ID NO: 217. In one embodiment, the sequence in the Table 9 represents SEQ ID NO: 197. In one embodiment, the sequence in Table 9 is SEQ ID NO: 198. In one embodiment, the sequence in Table 9 is SEQ ID NO: 199. In one embodiment, the sequence in Table 9 represents is 200. In one embodiment, the sequence in Table 9 is 201. In one embodiment, the sequence in Table 9 is 202. In one embodiment, the sequence in Table 9 is 203. In one embodiment, the sequence in Table 9 is 204 According to one implementation, the sequence in Table 9 is 205. According to one implementation, the sequence in Table 9 is 206. According to one implementation, the sequence in Table 9 is 207. According to one implementation, the sequence in Table 9 is 208. According to In one embodiment, the sequence in Table 9 is 209. In one embodiment, the sequence in Table 9 is 210. In one embodiment, the sequence in Table 9 is 211. In one embodiment, the sequence in Table 9 is 212. In one embodiment According to one implementation, the sequence in Table 9 is 213. In one implementation, the sequence in Table 9 is 214. In one implementation, the sequence in Table 9 is 215. In one implementation, the sequence in Table 9 is 216. In one implementation, the sequence in Table 9 is 217.

[0019] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 210.[0019] In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 85% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 90% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 91% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 92% identity with SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 93% identity with SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 94 % identity to SEQ ID NO: 210. In one embodiment, the cccDNA vector contains a nucleic acid sequence having at least 95% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least at least 96% identity with SEQ ID NO: 210. In one embodiment, the cccDNA vector contains a nucleic acid sequence having at least 97% identity with SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 98% identity to SEQ ID NO: 210. In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 99% identity to SEQ ID NO: 210. In one embodiment, the cccDNA vector comprises a nucleic acid sequence comprising SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence consisting of SEQ ID NO: 210.

[0020] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 214.[0020] In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 85% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 90% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 91% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 92% identity with SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 93% identity with SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 94 % identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 95% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least at least 96% identity with SEQ ID NO: 214. In one embodiment, the cccDNA vector contains a nucleic acid sequence having at least 97% identity with SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 98% identity to SEQ ID NO: 214. In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 99% identity to SEQ ID NO: 214. In one embodiment, the cccDNA vector comprises a nucleic acid sequence comprising SEQ ID NO: 214. In one embodiment, the ccDNA vector comprises a nucleic acid sequence consisting of SEQ ID NO: 214.

[0021] ЗкДНК-векторы для экспрессии продукции белка FVIII, описанные в данном документе, представляют собой бескапсидные линейные дуплексные молекулы ДНК, образованные из непрерывной цепи комплементарной ДНК с ковалентно замкнутыми концами (линейная, непрерывная и неинкапсидированная структура), которые содержат последовательность 5' инвертированного концевого повтора (ITR) и последовательность 3'-ITR, причем указанные 5-ITR и 3'-ITR могут иметь одинаковую симметричную трехмерную организацию по отношению друг к другу (т.е. симметричную или по существу симметричную) или, альтернативно, 5'-ITR и 3'-ITR могут иметь различную трехмерную организацию по отношению друг к другу (т.е. асимметричные ITR). Кроме того, ITR могут происходить из одного и того же или разных серотипов. Согласно некоторым вариантам реализации зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и В-В' в трехмерном пространстве (т.е. они одинаковы или являются зеркальными отображениями по отношению друг к другу). Согласно некоторым вариантам реализации один ITR может происходить из одного серотипа ААВ, а другой ITR может происходить из другого серотипа ААВ.[0021] The cccDNA vectors for expression of FVIII protein production described herein are non-capsidated linear duplex DNA molecules formed from a continuous strand of complementary DNA with covalently closed ends (linear, continuous and unencapsidated structure) that contain a 5' inverted sequence terminal repeat (ITR) and a 3'-ITR sequence, wherein said 5-ITR and 3'-ITR may have the same symmetrical three-dimensional organization with respect to each other (i.e., symmetrical or substantially symmetrical) or, alternatively, 5' -ITR and 3'-ITR may have different three-dimensional organization relative to each other (i.e., asymmetric ITRs). In addition, ITRs may originate from the same or different serotypes. In some embodiments, the cccDNA vector may contain ITR sequences that have a symmetrical three-dimensional spatial organization such that their structure has the same shape in geometric space, or have the same A, C-C', and B-B' loops in three-dimensional space (i.e. i.e. they are the same or are mirror images of each other). In some embodiments, one ITR may be derived from one AAV serotype, and the other ITR may be derived from a different AAV serotype.

[0022] Соответственно, некоторые аспекты технологии, описанной в данном документе, относятся к зкДНК-вектору для улучшенной экспрессии и/или продукции белка описанного выше белка FVIII, который содержит последовательности ITR, фланкирующие гетерологичную последовательность нуклеиновой кислоты, содержащую любую последовательность нуклеиновой кислоты FVIII, раскрытую в Таблицах 5, при этом указанные последовательности ITR выбраны из любых из: (i) по меньшей мере одного ITR дикого типа (WT) и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию. ЗкДНК-векторы, раскрытые в данном документе, могут быть получены в эукариотических клетках и поэтому лишены прокариотических модификаций ДНК и загрязнения бактериальными эндотоксинами в клетках насекомых.[0022] Accordingly, certain aspects of the technology described herein relate to a cccDNA vector for improved expression and/or protein production of the FVIII protein described above, which contains ITR sequences flanking a heterologous nucleic acid sequence containing any FVIII nucleic acid sequence, disclosed in Tables 5, wherein said ITR sequences are selected from any of: (i) at least one wild-type (WT) ITR and at least one modified AAV inverted terminal repeat (mod-ITR) (e.g., asymmetric modified ITRs) ; (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization relative to each other (e.g., asymmetric modified ITRs), or (iii) pairs of symmetric or substantially symmetric WT-WT ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetric or substantially symmetric modified ITRs, each mod-ITR having the same three-dimensional spatial organization. The cccDNA vectors disclosed herein can be produced in eukaryotic cells and are therefore free from prokaryotic DNA modifications and bacterial endotoxin contamination in insect cells.

[0023] Способы и композиции, описанные в данном документе, частично относятся к открытию невирусного бескапсидного ДНК-вектора с ковалентно замкнутыми концами (зкДНК-векторы), который можно применять для экспрессии по меньшей мере одного белка FVIII или более чем одного белка FVIII из клетки, включая, но не ограничиваясь ими, клетки печени.[0023] The methods and compositions described herein relate in part to the discovery of non-viral non-capsid DNA vectors with covalently closed ends (ccDNA vectors) that can be used to express at least one FVIII protein or more than one FVIII protein from a cell , including, but not limited to, liver cells.

[0024] Соответственно, в данном документе в одном аспекте предложены ДНК-векторы (например, зкДНК-векторы), содержащие по меньшей мере одну гетерологичную последовательность нуклеиновой кислоты, кодирующую по меньшей мере один трансген, кодирующий белки FVIII, функционально связанный с промотором, расположенную между двумя различными последовательностями инвертированных концевых повторов (ITR) ААВ, причем один из ITR содержит функциональный сайт концевого разрешения ААВ и сайт связывания Rep, и один из ITR содержит делецию, вставку или замену относительно другого ITR; при этом указанный трансген кодирует белок FVIII; и при этом указанная ДНК при расщеплении рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, отличается наличием характерных полос линейной и непрерывной ДНК по сравнению с контрольными линейными и прерывистыми ДНК при анализе на неденатурирующем геле. Другие аспекты включают доставку белка FVIII путем его экспрессии in vivo с зкДНК-вектора, описанного в данном документе, и, кроме того, лечение гемофилии А с применением зкДНК-векторов, кодирующих FVIII. В данном документе также предусмотрены клетки, содержащие зкДНК-вектор, кодирующий FVIII, описанный в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.[0024] Accordingly, this document provides in one aspect DNA vectors (e.g., cccDNA vectors) comprising at least one heterologous nucleic acid sequence encoding at least one transgene encoding FVIII proteins operably linked to a promoter located between two different AAV inverted terminal repeat (ITR) sequences, wherein one of the ITRs contains a functional AAV end resolution site and a Rep binding site, and one of the ITRs contains a deletion, insertion or substitution relative to the other ITR; wherein said transgene encodes the FVIII protein; and wherein said DNA, when digested by a restriction enzyme having one recognition site on the DNA vector, is distinguished by the presence of characteristic bands of linear and continuous DNA compared to control linear and discontinuous DNA when analyzed on a non-denaturing gel. Other aspects include delivery of FVIII protein by expressing it in vivo from a cccDNA vector described herein, and further, treatment of hemophilia A using cccDNA vectors encoding FVIII. Also provided herein are cells containing a cccDNA vector encoding FVIII described herein. In some embodiments, the ccDNA vector is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20, and ccDNA FVIII vector 2 3. In some embodiments, the ccDNA vector is ccDNAFVIII vector 19 or ccDNA FVIII vector 23.

[0025] Аспекты настоящего изобретения относятся к способам получения зкДНК-векторов, которые можно применять для экспрессии белка FVIII в клетке, как описано в данном документе. Другие варианты реализации относятся к зкДНК-вектору, полученному с помощью способа, предложенного в данном документе. Согласно одному варианту реализации бескапсидный (например, невирусный) ДНК-вектор (зкДНК-вектор) для продукции белка FVIII получают из плазмиды (называемой в данном документе «зкДНК-плазмидой»), содержащей полинуклеотидную матрицу экспрессионной конструкции, содержащую, в указанном порядке: первый 5'-инвертированный концевой повтор (например, ITR ААВ); гетерологичную последовательность нуклеиновой кислоты; и 3'-ITR (например, ITR ААВ), причем указанные 5'-ITR и 3'-ITR могут быть асимметричными по отношению друг к другу или симметричными (например, WT-ITR или модифицированные симметричные ITR), как определено в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.[0025] Aspects of the present invention relate to methods for producing cDNA vectors that can be used to express FVIII protein in a cell, as described herein. Other embodiments relate to a cccDNA vector obtained using the method proposed herein. In one embodiment, a capsid-free (e.g., non-viral) DNA vector (ccDNA vector) for producing FVIII protein is derived from a plasmid (referred to herein as a “ccDNA plasmid”) containing a polynucleotide expression construct template comprising, in this order: first 5'-inverted terminal repeat (eg, AAB ITR); heterologous nucleic acid sequence; and 3'-ITR (e.g., AAB ITR), wherein said 5'-ITR and 3'-ITR may be asymmetric to each other or symmetric (e.g., WT-ITR or modified symmetric ITR) as defined herein . In some embodiments, the ccDNA vector is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20, and ccDNA FVIII vector 2 3. In some embodiments, the ccDNA vector is ccDNAFVIII vector 19 or ccDNA FVIII vector 23.

[0026] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с помощью ряда средств, которые будут известны обычному квалифицированному специалисту после прочтения этого раскрытия. Например, полинуклеотидная матрица экспрессионной конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус. Согласно одному варианту реализации зкДНК-плазмида содержит сайт рестрикционного клонирования (например, SEQ ID NO: 123 и/или 124), функционально расположенный между ITR, в который может быть вставлена экспрессионная кассета, содержащая, например, промотор, функционально связанный с трансгеном, например, нуклеиновой кислотой, кодирующей FVIII. Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII получают из полинуклеотидной матрицы (например, зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса), содержащей симметричные или асимметричные ITR (модифицированные ITR или WT ITR).[0026] The cDNA FVIII protein expression vector disclosed herein can be produced by a number of means that will be known to one of ordinary skill in the art upon reading this disclosure. For example, the polynucleotide expression construct template used to produce the ccDNA vectors of the present invention may be a ccDNA plasmid, a ccDNA bacmid, and/or a ccDNA baculovirus. In one embodiment, the cccDNA plasmid contains a restriction cloning site (e.g., SEQ ID NO: 123 and/or 124) operably located between the ITR, into which an expression cassette can be inserted, containing, for example, a promoter operably linked to the transgene, e.g. , a nucleic acid encoding FVIII. In some embodiments, cccDNA vectors for FVIII protein expression are derived from a polynucleotide template (eg, ccDNA plasmid, ccDNA bacmid, ccDNA baculovirus) containing symmetric or asymmetric ITRs (modified ITRs or WT ITRs).

[0027] В пермиссивной клетке-хозяине, в присутствии, например, Rep, полинуклеотидная матрица, имеющая по меньшей мере два ITR, реплицируется с получением зкДНК-векторов, экспрессирующих белок FVIII. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.д.) посредством белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора. Белки Rep и сайты связывания Rep различных серотипов ААВ хорошо известны обычным специалистам в данной области техники. Обычный специалист в данной области техники понимает необходимость выбора белка Rep из серотипа, который связывается с последовательностью нуклеиновой кислоты и реплицирует ее, на основе по меньшей мере одного функционального ITR. Например, если компетентный по репликации ITR происходит из серотипа 2 ААВ, соответствующий Rep будет из серотипа ААВ, который работает с этим серотипом, такого как ITR ААВ2 с Rep ААВ2 или ААВ4, но не Rep ААВ5, который не работает. После репликации зкДНК-вектор с ковалентно замкнутыми концами продолжает накапливаться в пермиссивных клетках, и зкДНК-вектор предпочтительно является достаточно стабильным с течением времени в присутствии белка Rep в стандартных условиях репликации, например, для накопления в количестве, составляющем по меньшей мере 1 пг/клетку, предпочтительно по меньшей мере 2 пг/клетку, предпочтительно по меньшей мере 3 пг/клетку, более предпочтительно по меньшей мере 4 пг/клетку, еще более предпочтительно по меньшей мере 5 пг/клетку.[0027] In a permissive host cell, in the presence of, for example, Rep, a polynucleotide template having at least two ITRs is replicated to produce cccDNA vectors expressing the FVIII protein. Obtaining a cDNA vector takes place in two stages: first, excision (“extraction”) of the template from the matrix backbone (for example, the genome of a cDNA plasmid, ccDNA bacmid, ccDNA baculovirus, etc.) through Rep proteins, and, second, Rep-mediated replication of the excised cccDNA vector. The Rep proteins and Rep binding sites of various AAV serotypes are well known to those of ordinary skill in the art. One of ordinary skill in the art will appreciate the need to select a Rep protein from a serotype that binds to and replicates a nucleic acid sequence based on at least one functional ITR. For example, if a replication competent ITR is from AAB serotype 2, the corresponding Rep will be from an AAB serotype that works with that serotype, such as the AAB2 ITR with Rep AAB2 or AAB4, but not Rep AAB5, which does not work. After replication, the cccDNA vector with covalently closed ends continues to accumulate in permissive cells, and the cccDNA vector is preferably sufficiently stable over time in the presence of the Rep protein under standard replication conditions, for example, to accumulate at an amount of at least 1 pg/cell , preferably at least 2 pg/cell, preferably at least 3 pg/cell, more preferably at least 4 pg/cell, even more preferably at least 5 pg/cell.

[0028] Соответственно, один аспект настоящего изобретения относится к способу получения зкДНК-вектора для экспрессии таких белков FVIII, включающему этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в клетках-хозяевах и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR с получением зкДНК-вектора для экспрессии белка FVIII в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, налагаемое вирионами. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.[0028] Accordingly, one aspect of the present invention relates to a method of producing a cccDNA vector for the expression of such FVIII proteins, comprising the steps of: a) incubating a population of host cells (e.g., insect cells) bearing a polynucleotide expression construct template (e.g., a ccDNA plasmid , cccDNA bacmid and/or ccDNA baculovirus) lacking sequences encoding the viral capsid, in the presence of the Rep protein, under conditions effective to induce the production of said ccDNA vector in host cells and for a period of time sufficient to do so, wherein said host cells do not contain sequences encoding the viral capsid; and b) collecting and isolating the cDNA vector from the host cells. The presence of the Rep protein induces replication of the ITR-modified vector polynucleotide to produce a cccDNA vector for expression of the FVIII protein in the host cell. However, viral particles (eg, AAV virions) are not expressed. Thus, there is no size limitation imposed by virions. In some embodiments, the ccDNA vector is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20, and ccDNA FVIII vector 2 3. In some embodiments, the ccDNA vector is ccDNAFVIII vector 19 or ccDNA FVIII vector 23.

[0029] Наличие пригодного для экспрессии белка FVIII зкДНК-вектора, выделенного из клеток-хозяев, можно подтвердить путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на денатурирующем и неденатурирующем гелях для подтверждения наличия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.[0029] The presence of a cDNA vector isolated from host cells suitable for expression of the FVIII protein can be confirmed by digesting DNA isolated from the host cell with a restriction enzyme having a single recognition site on the cDNA vector and analyzing the digested DNA material for denaturing and non-denaturing gels to confirm the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA.

[0030] В данном документе также предложены способы экспрессии белка FVIII, который имеет терапевтическое применение, с применением зкДНК-вектора в клетке или у субъекта. Такие белки FVIII можно применять для лечения гемофилии А. Соответственно, в данном документе предложены способы лечения гемофилии А, включающие введение зкДНК-вектора, кодирующего терапевтический белок FVIII, субъекту, нуждающемуся в этом. В соответствии с некоторыми вариантами реализации зкДНК-вектор, кодирующий терапевтический белок FVIII, выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-векгора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23. В соответствии с некоторыми вариантами реализации уровни FVIII в сыворотке субъекта повышены у субъектов, которым ввели зкДНК-вектор, по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40% по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40%, примерно 45%, примерно 50%, примерно 55%, примерно 60%, примерно 65%, примерно 70%, примерно 75% по сравнению с контролем.[0030] Also provided herein are methods for expressing FVIII protein that has therapeutic use using a cccDNA vector in a cell or subject. Such FVIII proteins can be used to treat hemophilia A. Accordingly, provided herein are methods of treating hemophilia A comprising administering a cccDNA vector encoding a therapeutic FVIII protein to a subject in need thereof. In accordance with some embodiments, the cccDNA vector encoding the therapeutic FVIII protein is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20 and cccDNAFVIII vector 23. In some embodiments, the cccDNA vector is cccDNAFVIII vector 19 or ccDNAFVIII vector 23. In some embodiments, serum FVIII levels in the subject are increased in subjects administered the cccDNA vector compared to with control. In some embodiments, the increase in FVIII levels is greater than about 40% compared to control. In some embodiments, the increase in FVIII levels is greater than about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about 75% compared to control.

[0031] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к невирусному бескапсидному ДНК-вектору с ковалентно замкнутыми концами (зкДНК-вектору), причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, функционально расположенную между двумя последовательностями инвертированных концевых повторов, при этом указанные последовательности ITR могут быть асимметричными или симметричными, или по существу симметричными, в соответствии с определением этих терминов в данном документе, при этом по меньшей мере один из ITR содержит функциональный сайт концевого разрешения и сайт связывания Rep, и необязательно указанная гетер о логичная последовательность нуклеиновой кислоты кодирует трансген (например, белок FVIII), и при этом указанный вектор не находится в вирусном капсиде.[0031] In some embodiments, one aspect of the technology described herein relates to a non-viral, capsid-free, covalently closed-end DNA vector (ccDNA vector), wherein the cccDNA vector contains at least one heterologous nucleotide sequence operably located between two inverted terminal repeat sequences, wherein said ITR sequences may be asymmetric or symmetric or substantially symmetric as those terms are defined herein, wherein at least one of the ITRs comprises a functional end resolution site and a Rep binding site, and optionally, said heterologous nucleic acid sequence encodes a transgene (eg, FVIII protein), and wherein said vector is not located in a viral capsid.

[0032] Эти и другие аспекты настоящего изобретения более подробно описаны ниже.[0032] These and other aspects of the present invention are described in more detail below.

ОПИСАНИЕ ЧЕРТЕЖЕЙDESCRIPTION OF DRAWINGS

[0033] Варианты реализации настоящего раскрытия, кратко обобщенные выше и более подробно обсуждаемые ниже, будут понятны со ссылкой на иллюстративные варианты реализации раскрытия, представленные на прилагаемых чертежах. Однако прилагаемые чертежи иллюстрируют только типичные варианты реализации настоящего раскрытия и поэтому не должны рассматриваться, как ограничивающие объем, поскольку раскрытие может допускать другие не менее эффективные варианты реализации.[0033] The embodiments of the present disclosure summarized briefly above and discussed in more detail below will be understood with reference to the illustrative embodiments of the disclosure shown in the accompanying drawings. However, the accompanying drawings illustrate only exemplary embodiments of the present disclosure and therefore should not be construed as limiting the scope, since the disclosure may permit other equally effective embodiments.

[0034] ФИГ. 1А иллюстрирует примерную структуру зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, содержащего асимметричные ITR. Согласно этому варианту реализации примерный зкДНК-вектор содержит экспрессионную кассету, содержащую промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования (R3/R4) между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - ITR дикого типа ААВ2 слева (на 5'-конце) и модифицированным ITR справа (на 3'-конце) от экспрессионной кассеты, поэтому два ITR, фланкирующие экспрессионную кассету, асимметричны по отношению друг к другу.[0034] FIG. 1A illustrates an exemplary structure of a cccDNA vector for expression of the FVIII protein disclosed herein containing asymmetric ITRs. In this embodiment, an exemplary cccDNA vector contains an expression cassette containing a CAG promoter, WPRE, and BGHpA. An open reading frame (ORF) encoding the FVIII transgene can be inserted into the cloning site (R3/R4) between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs) - the wild-type AAB2 ITR on the left (at the 5' end) and the modified ITR on the right (at the 3' end) of the expression cassette, therefore the two ITRs flanking the expression cassette are asymmetric with respect to each other to friend.

[0035] ФИГ. 1 В иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - модифицированным ITR слева (на 5'-конце) и ITR дикого типа справа (на 3'-конце) от экспрессионной кассеты.[0035] FIG. 1B illustrates the exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing asymmetric ITRs with an expression cassette containing a CAG promoter, WPRE and BGHpA. An open reading frame (ORF) encoding the FVIII transgene can be inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs) - a modified ITR on the left (at the 5' end) and a wild-type ITR on the right (at the 3' end) of the expression cassette.

[0036] ФИГ. 1С иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR, с экспрессионной кассетой, содержащей энхансер/промотор, трансген FVIII, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет встраивать трансген FVIII в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR), которые асимметричны по отношению друг к другу; модифицированным ITR слева (на 5'-конце) и модифицированным ITR справа (на 3-конце) от экспрессионной кассеты, причем указанные 5'-ITR и 3'-ITR оба представляют собой модифицированные ITR, но имеют разные модификации (т.е. они не имеют одинаковых модификаций).[0036] FIG. 1C illustrates an exemplary structure of a cccDNA FVIII expression vector disclosed herein containing asymmetric ITRs, with an expression cassette containing an enhancer/promoter, an FVIII transgene, a post-transcriptional element (WPRE), and a poly(A) signal. The open reading frame (ORF) allows the FVIII transgene to be inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs) that are asymmetrical to each other; a modified ITR to the left (5' end) and a modified ITR to the right (3 end) of the expression cassette, wherein the 5' ITR and 3' ITR are both modified ITRs but have different modifications (i.e. they do not have the same modifications).

[0037] ФИГ. 1D иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем 849849949 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.[0037] FIG. 1D illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing symmetrical modified ITRs or substantially symmetrical modified ITRs as defined herein, with an expression cassette containing a CAG promoter, WPRE and BGHpA. The open reading frame (ORF) encoding the FVIII transgene is inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two modified inverted terminal repeats (ITRs), with the 849849949 5' modified ITR and 3' modified ITR being symmetrical or substantially symmetrical.

[0038] ФИГ. 1Е иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем указанные 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.[0038] FIG. 1E illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing symmetrical modified ITRs or substantially symmetrical modified ITRs as defined herein, with an expression cassette comprising an enhancer/promoter, a transgene, a post-transcriptional element (WPRE), and poly(A) signal. The open reading frame (ORF) allows the insertion of a transgene (eg FVIII) into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two modified inverted terminal repeats (ITRs), wherein the 5' modified ITR and the 3' modified ITR are symmetrical or substantially symmetrical.

[0039] ФИГ. 1F иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные WT-ITR или по существу симметричные WT-ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген (например, FVIII), вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.[0039] FIG. 1F illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing symmetrical WT-ITRs or substantially symmetrical WT-ITRs as defined herein, with an expression cassette containing a CAG promoter, WPRE and BGHpA. An open reading frame (ORF) encoding a transgene (eg, FVIII) is inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two wild-type inverted terminal repeats (WT-ITRs), the 5' WT-ITR and 3' WT-ITR being symmetrical or substantially symmetrical.

[0040] ФИГ. 1G иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген (например, FVIII), посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.[0040] FIG. 1G illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein, containing symmetrical modified ITRs or substantially symmetrical modified ITRs as defined herein, with an expression cassette containing an enhancer/promoter, transgene (e.g., FVIII), post-transcriptional element (WPRE) and poly(A) signal. The open reading frame (ORF) allows the insertion of a transgene (eg FVIII) into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two wild-type inverted terminal repeats (WT-ITRs), the 5' WT-ITR and 3' WT-ITR being symmetrical or substantially symmetrical.

[0041] ФИГ. 2А представляет Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 (SEQ ID NO: 52) с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE'), а также показывает сайт концевого разрешения (TRS). RBE содержит группу из 4 дуплексных тетрамеров, которые, как полагают, взаимодействуют либо с Rep 78, либо с Rep 68. Кроме того, также полагают, что RBE' взаимодействует с комплексом Rep, собранным на ITR дикого типа или мутированном ITR в конструкции. Области D и D' содержат сайты связывания факторов транскрипции и другую консервативную структуру. ФИГ. 2 В показывает предполагаемую Rep-катализируемую никирующую и лигирующую активность в левом ITR дикого типа (SEQ ID NO: 53), включая Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE), а также показывает сайт концевого разрешения (TRS) и область D и D', содержащую несколько сайтов связывания факторов транскрипции и другую консервативную структуру.[0041] FIG. 2A shows a T-shaped stem-loop structure of the left ITR of wild type AAB2 (SEQ ID NO: 52) identifying arm A-A', arm B-B', arm C-C', two Rep binding sites (RBE and RBE' ), and also shows the terminal resolution site (TRS). RBE contains a group of 4 duplex tetramers that are believed to interact with either Rep 78 or Rep 68. In addition, RBE' is also believed to interact with the Rep complex assembled on a wild-type ITR or a mutated ITR in the construct. Regions D and D' contain transcription factor binding sites and other conserved structure. FIG. 2B shows putative Rep-catalyzed nicking and ligation activity in the wild-type left ITR (SEQ ID NO: 53), including the T-shaped stem-loop structure of the AAB2 wild-type left ITR with identification of arm A-A', arm B-B' , the C-C' arm, two Rep binding sites (RBE and RBE), and also shows a terminal resolution site (TRS) and a region D and D' containing several transcription factor binding sites and other conserved structure.

[0042] ФИГ. 3А представляет первичную структуру (полинуклеотидную последовательность) (слева) и вторичную структуру (справа) RBE-содержащих частей плеча А-А', а также плеча С-С' и В-В' левого ITR дикого типа ААВ2 (SEQ ID NO: 54). ФИГ. 3В показывает примерную последовательность мутированного ITR (также называемого модифицированным ITR) для левого ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) части RBE плеча А-А', плеча С и плеча В-В' примерного мутированного левого ITR (ITR-1, слева) (SEQ ID NO: 113). ФИГ. 3С показывает первичную структуру (слева) и вторичную структуру (справа) RBE-содержащей части петли А-А' и плеч В-В' и С-С' правого ITR дикого типа ААВ2 (SEQ ID NO: 55). ФИГ. 3D показывает примерный правый модифицированный ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) RBE-содержащей части плеча А-А', В-В' и плеча С примерного мутантного правого ITR (ITR-1, справа) (SEQ ID NO: 114). Любая комбинация левого и правого ITR (например, ITR ААВ2 или другого вирусного серотипа или синтетических ITR) может использоваться, как описано в данном документе. Каждая из полинуклеотидных последовательностей на ФИГ. 3A-3D относится к последовательности, используемой в геноме плазмиды или бакмиды/бакуловируса, применяемых для получения зкДНК, как описано в данном документе. Также на каждой из ФИГ. 3A-3D приведены соответствующие вторичные структуры зкДНК, выведенные на основании конфигураций зкДНК-вектора в геноме плазмиды или бакмиды/бакуловируса и предсказанных значений свободной энергии Гиббса.[0042] FIG. 3A shows the primary structure (polynucleotide sequence) (left) and secondary structure (right) of the RBE-containing portions of the A-A' arm, as well as the C-C' and B-B' arms of the left wild-type AAB2 ITR (SEQ ID NO: 54 ). FIG. 3B shows an example sequence of a mutated ITR (also called a modified ITR) for the left ITR. Shown is the primary structure (left) and predicted secondary structure (right) of the RBE portion of the A-A' arm, C arm, and B-B' arm of the exemplary mutated left ITR (ITR-1, left) (SEQ ID NO: 113). FIG. 3C shows the primary structure (left) and secondary structure (right) of the RBE-containing portion of the A-A' loop and arms B-B' and C-C' of the right wild-type AAB2 ITR (SEQ ID NO: 55). FIG. 3D shows an example right modified ITR. Shown is the primary structure (left) and predicted secondary structure (right) of the RBE-containing portion of the A-A', B-B' and C arms of the exemplary mutant right ITR (ITR-1, right) (SEQ ID NO: 114). Any combination of left and right ITRs (eg, AAB2 or other viral serotype ITRs or synthetic ITRs) can be used as described herein. Each of the polynucleotide sequences in FIG. 3A-3D refers to the sequence used in the genome of the plasmid or bacmid/baculovirus used to produce cccDNA as described herein. Also in each of FIGS. 3A-3D show the corresponding cccDNA secondary structures deduced from the configurations of the cccDNA vector in the plasmid or bacmid/baculovirus genome and predicted Gibbs free energy values.

[0043] ФИГ. 4А представляет собой схему, иллюстрирующую подготовительный способ получения инфицированных бакуловирусом клеток насекомых (ВИС), которые можно применять для получения зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, в способе, описанном на схеме на ФИГ. 4В. ФИГ. 4В представляет собой схему примерного способа получения зкДНК, и ФИГ. 4С иллюстрирует биохимический метод и способ подтверждения получения зкДНК-вектора. ФИГ. 4D и ФИГ. 4Е представляют собой схематические иллюстрации, описывающие способ идентификации наличия зкДНК в ДНК, собранной из осадков клеток, полученных во время способов продуцирования зкДНК на ФИГ. 4В. ФИГ. 4D схематически показывает ожидаемые полосы примерной зкДНК, оставленной неразрезанной или расщепленной рестрикционной эндонуклеазой, а затем подвергнутой электрофорезу либо на нативном геле, либо на денатурирующем геле. Самая левая схема представляет собой нативный гель и показывает несколько полос, свидетельствующих о том, что в дуплексной и неразрезанной форме зкДНК существует по меньшей мере в мономерном и димерном состояниях, наблюдаемых как быстрее мигрирующий мономер меньшего размера и медленнее мигрирующий димер, размер которого в два раза превышает размер мономера. На второй слева схеме показано, что при разрезании зкДНК рестрикционной эндонуклеазой исходные полосы исчезают и появляются быстрее мигрирующие (например, меньшие по размеру) полосы, соответствующие ожидаемым размерам фрагментов, оставшихся после расщепления. В денатурирующих условиях исходная дуплексная ДНК является одноцепочечной и мигрирует как молекула, размер которой в два раза превышает размер, наблюдаемый на нативном геле, поскольку комплементарные цепи ковалентно связаны. Таким образом, на второй схеме справа расщепленная зкДНК показывает распределение полос, сходное с наблюдаемым на нативном геле, но полосы мигрируют как фрагменты, размер которых в два раза превышает размер их аналогов на нативном геле. На самой правой схеме показано, что неразрезанная зкДНК в денатурирующих условиях мигрирует в виде одноцепочечного раскрытого кольца, поэтому размер наблюдаемых полос в два раза превышает размер полос, наблюдаемых в нативных условиях, в которых кольцо не раскрыто. На этой фигуре «тыс.п.о.» используется для обозначения относительного размера нуклеотидных молекул на основании, в зависимости от контекста, либо длины нуклеотидной цепи (например, для одноцепочечных молекул, наблюдаемых в денатурирующих условиях), либо числа пар оснований (например, для двухцепочечных молекул, наблюдаемых в нативных условиях). ФИГ. 4Е показывает ДНК, имеющую прерывистую структуру. ЗкДНК может быть разрезана рестрикционной эндонуклеазой, имеющей один сайт распознавания в зкДНК-векторе, с получением двух фрагментов ДНК с разными размерами (1 тыс.п.о. и 2 тыс.п.о.) как в нейтральных, так и в денатурирующих условиях. ФИГ. 4Е также показывает зкДНК, имеющую линейную и непрерывную структуру. ЗкДНК-вектор может быть разрезан рестрикционной эндонуклеазой с получением двух фрагментов ДНК, которые мигрируют как 1 тыс. п. о. и 2 тыс. п. о. в нейтральных условиях, но в денатурирующих условиях цепи остаются соединенными и образуют одиночные цепи, которые мигрируют как 2 тыс. п. о. и 4 тыс. п. о.[0043] FIG. 4A is a diagram illustrating a preparatory method for producing baculovirus-infected insect cells (BICs) that can be used to produce the cDNA expression vector for FVIII disclosed herein in the method described in the diagram of FIG. 4B. FIG. 4B is a diagram of an exemplary method for producing cccDNA, and FIG. 4C illustrates the biochemical method and method for confirming the production of the cccDNA vector. FIG. 4D and FIG. 4E are schematic illustrations describing a method for identifying the presence of cccDNA in DNA collected from cell pellets obtained during the ccDNA production methods of FIG. 4B. FIG. 4D schematically shows the expected bands of exemplary cccDNA left uncut or digested with a restriction endonuclease and then electrophoresed on either a native gel or a denaturing gel. The leftmost diagram is a native gel and shows several bands indicating that in duplex and uncut form, ccDNA exists in at least monomeric and dimeric states, observed as a faster migrating monomer of smaller size and a slower migrating dimer that is twice the size exceeds the size of the monomer. The second diagram from the left shows that when cccDNA is cut with a restriction endonuclease, the initial bands disappear and faster migrating (i.e., smaller) bands appear, corresponding to the expected sizes of fragments remaining after cleavage. Under denaturing conditions, the original duplex DNA is single-stranded and migrates as a molecule twice the size observed on a native gel because the complementary strands are covalently linked. Thus, in the second diagram on the right, digested ccDNA shows a band distribution similar to that observed on the native gel, but the bands migrate as fragments that are twice the size of their counterparts on the native gel. The rightmost diagram shows that uncut cccDNA under denaturing conditions migrates as a single-stranded open ring, so the size of the observed bands is twice the size of the bands observed under native conditions in which the ring is not opened. In this figure, “kb.” used to indicate the relative size of nucleotide molecules based on, depending on the context, either the length of the nucleotide chain (for example, for single-stranded molecules observed under denaturing conditions) or the number of base pairs (for example, for double-stranded molecules observed under native conditions). FIG. 4E shows DNA having a discontinuous structure. CCDNA can be cut with a restriction endonuclease having one recognition site in the CCDNA vector to produce two DNA fragments of different sizes (1 kb and 2 kb) under both neutral and denaturing conditions . FIG. 4E also shows cccDNA having a linear and continuous structure. The cDNA vector can be cut with a restriction endonuclease to produce two DNA fragments that migrate as 1 kb. and 2 thousand p.o. under neutral conditions, but under denaturing conditions the chains remain connected and form single chains that migrate as 2 kb. and 4 thousand p.o.

[0044] ФИГ. 5 представляет собой примерное изображение анализа на денатурирующем геле примеров зкДНК-векторов с (+) или без (-) расщепления эндонуклеазами (EcoRI для зкДНК-конструкций 1 и 2; BamH1 для зкДНК-конструкций 3 и 4; SpeI для зкДНК-конструкций 5 и 6; и XhoI для зкДНК-конструкций 7 и 8). Конструкции 1-8 описаны в Примере 1 международной заявки РСТ PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Размеры выделенных звездочкой полос были определены и указаны внизу рисунка.[0044] FIG. 5 is an exemplary denaturing gel analysis of example cccDNA vectors with (+) or without (-) endonuclease digestion (EcoRI for cccDNA constructs 1 and 2; BamH1 for cccDNA constructs 3 and 4; SpeI for cccDNA constructs 5 and 6; and XhoI for cccDNA constructs 7 and 8). Structures 1-8 are described in Example 1 of PCT International Application PCT/US18/49996, which is incorporated herein by reference in its entirety. The dimensions of the stripes highlighted with an asterisk were determined and indicated at the bottom of the figure.

[0045] ФИГ. 6 отображает результаты экспериментов, описанных в Примере 7, и конкретно показывает изображения IVIS, полученные у мышей, получавших контроль ЛНЧ-поли(С) (крайняя слева мышь), и четырех мышей, получавших ЛНЧ-зкДНК-люциферазу (все, кроме крайней слева мыши). У четырех мышей, обработанных зкДНК, наблюдается значительная флуоресценция в области печени мыши.[0045] FIG. 6 displays the results of the experiments described in Example 7 and specifically shows IVIS images obtained from mice treated with LNP-poly(C) control (far left mouse) and four mice treated with LNP-cDNA luciferase (all except far left mice). Four mice treated with cccDNA showed significant fluorescence in the mouse liver region.

[0046] ФИГ. 7 отображает результаты эксперимента, описанного в Примере 8. Темные точки указывают на наличие белка, полученного в результате экспрессии трансгена с зкДНК, и демонстрируют ассоциацию введенной ЛНЧ-зкДНК с гепатоцитами.[0046] FIG. 7 shows the results of the experiment described in Example 8. Dark dots indicate the presence of protein resulting from expression of the cccDNA transgene and demonstrate the association of the introduced LNP-ccDNA with hepatocytes.

[0047] ФИГ. 8А и 8В отображают результаты исследований на глазах, описанных в Примере 9. ФИГ. 8А показывает типичные изображения IVIS из глаз крысы, в которые инъецировали JetPEI®-зкДНК-люциферазу (вверху слева), по сравнению с неинъецированным глазом той же крысы (вверху справа) или глазом крысы, в который инъецировали плазмиду-ДНК люциферазы (внизу слева), и неинъецированным глазом той же крысы (внизу справа). ФИГ. 8В показывает график средней светимости, наблюдаемой в обработанных глазах или соответствующих необработанных глазах в каждой из групп обработки. Крысы, обработанные зкДНК, демонстрировали длительную значительную флуоресценцию (и, следовательно, экспрессию трансгена люциферазы) в течение 99 дней, что существенно разнилось с крысами, получавшими плазмиду-люциферазу, у которых наблюдалась минимальная относительная флуоресценция (и, следовательно, экспрессия трансгена люциферазы).[0047] FIG. 8A and 8B depict the results of the eye studies described in Example 9. FIG. 8A shows representative IVIS images from rat eyes injected with JetPEI®- ccDNA-luciferase (top left), compared to an uninjected eye of the same rat (top right) or a rat eye injected with luciferase DNA plasmid (bottom left). , and the uninjected eye of the same rat (bottom right). FIG. 8B shows a plot of the average luminosity observed in the treated eyes or the corresponding untreated eyes in each of the treatment groups. Rats treated with cccDNA exhibited prolonged significant fluorescence (and hence luciferase transgene expression) for 99 days, which was significantly different from rats treated with the luciferase plasmid, which showed minimal relative fluorescence (and therefore luciferase transgene expression).

[0048] ФИГ. 9А и 9В отображают результаты исследования устойчивости зкДНК и повторного введения дозы у мышей Rag2, описанного в Примере 10. ФИГ. 9А показывает график зависимости полного потока от времени, наблюдаемой у получавших ЛНЧ-зкДНК-Luc мышей c57bl/6 дикого типа или мышей Rag2. ФИГ. 9В представляет график, показывающий влияние повторной дозы на уровни экспрессии трансгена люциферазы у мышей Rag2, при этом после введения повторной дозы наблюдали повышенную стабильную экспрессию (стрелка указывает время введения повторной дозы).[0048] FIG. 9A and 9B depict the results of the cccDNA stability and repeat dosing study in Rag2 mice described in Example 10. FIG. 9A shows a plot of total flux versus time observed in LNP-ccDNA-Luc-treated wild-type c57bl/6 mice or Rag2 mice. FIG. 9B is a graph showing the effect of repeated dosing on luciferase transgene expression levels in Rag2 mice, with increased stable expression observed after repeated dosing (arrow indicates time of repeated dosing).

[0049] ФИГ. 10 представляет данные исследования экспрессии люциферазы с зкДНК у обработанных мышей, описанного в Примере 11, показывающие полный поток в каждой группе мышей на протяжении исследования. Высокие уровни неметилированного CpG коррелировали с более низким полным потоком, наблюдаемым у мышей с течением времени, в то время как использование специфического для печени промотора коррелировало с продолжительной стабильной экспрессией трансгена с зкДНК-вектора на протяжении по меньшей мере 77 дней.[0049] FIG. 10 presents data from the cDNA luciferase expression study in treated mice described in Example 11, showing total flux in each group of mice throughout the study. High levels of unmethylated CpG correlated with lower total flux observed in mice over time, while liver-specific promoter usage correlated with prolonged stable expression of the cccDNA vector transgene for at least 77 days.

[0050] ФИГ. 11А и 11В показывают гидродинамическую доставку зкДНК-вектора, экспрессирующего FVIII. ФИГ. 11А показывает уровни экспрессии FVIII в образцах сыворотки на день 3 и 7 от мышей после гидродинамической инъекции трех различных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или контрольного зкДНК-вектора (только зкДНК, экспрессирующая люциферазу) (показано как Носитель). Два из трех зкДНК-векторов, экспрессирующих FVIII, показали экспрессию FVIII. ФИГ. 11В представляет собой график зависимости ответа от дозы для уровней экспрессии FVIII в образцах сыворотки в течение 30-дневного периода от мышей после гидродинамической инъекции небольшого или большого количества трех разных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или небольших количеств зкДНК-вектора в качестве контроля носителя (экспрессирующего только люциферазу).[0050] FIG. 11A and 11B show hydrodynamic delivery of a cDNA vector expressing FVIII. FIG. 11A shows FVIII expression levels in day 3 and day 7 serum samples from mice following hydrodynamic injection of three different cccDNA vectors expressing FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) or a control ccDNA vector (ccDNA expressing luciferase only) (shown as Vehicle). Two of the three cccDNA vectors expressing FVIII showed FVIII expression. FIG. 11B is a dose response plot of FVIII expression levels in serum samples over a 30-day period from mice following hydrodynamic injection of small or large amounts of three different cccDNA vectors expressing FVIII (LPS1-F8-v1; LPS1-F8-v2 ; LPS1-F8-v3) or small amounts of cDNA vector as a vehicle control (expressing luciferase only).

[0051] ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.[0051] FIG. 12 is a graph depicting plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cccDNA vectors expressing FVIII (ccDNA FVIII vector 4, ccDNA FVIII vector 6, ccDNA FVIII vector 12, ccDNA FVIII vector 14 , cDNAFVIII-vector 16, ccDNAFVIII-vector 18, ccDNAFVIII-vector 19, ccDNAFVIII-vector 21, ccDNAFVIII-vector 22). CccDNAFVIII-vector 16, ccDNAFVIII-vector 19, and ccDNAFVIII-vector 21 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control.

[0052] ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.[0052] FIG. 13 is a graph showing plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII-vector 1, ccDNA FVIII-vector 2, ccDNA FVIII-vector 3, ccDNA FVIII-vector 5 , cDNAFVIII-vector 7, ccDNAFVIII-vector 8, ccDNAFVIII-vector 12, ccDNAFVIII-vector 13, ccDNAFVIII-vector 15). CctDNAFVIII vector 8 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control.

[0053] ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.[0053] FIG. 14 is a graph showing plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII vector 9, ccDNA FVIII vector 10, ccDNA FVIII vector 11, ccDNA FVIII vector 12 , cDNAFVIII-vector 17, ccDNAFVIII-vector 20, ccDNAFVIII-vector 24, ccDNAFVIII-vector 25, ccDNAFVIII-vector 26). CccDNAFVIII-vector 17 and ccDNAFVIII-vector 20 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control.

[0054] ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005 мкг-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.[0054] FIG. 15 is a graph that depicts plasma FVIII concentration (IU/ml) 1 day after hydrodynamic delivery of increasing doses of cDNAFVIII vector 23 (0.005 μg-50 μg). As shown in FIG. 15, FVIII in plasma increased in a dose-dependent manner with increasing dosage of cDNAFVIII vector 23. Vehicle alone was used as a control.

[0055] ФИГ. 16 представляет собой график, который отображает концентрацию FVIII в плазме (MP/мл) через 7 дней после гидродинамической доставки исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23.[0055] FIG. 16 is a graph that displays plasma FVIII concentration (MP/ml) 7 days after hydrodynamic delivery of the LNP:ccDNAFVIII-vector 23 study drug.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

[0056] В данном документе предложен способ лечения гемофилии А с применением зкДНК-вектора, содержащего одну или более нуклеиновых кислот, которые кодируют терапевтический белок FVIII или его фрагмент. В данном документе также предложены зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие одну или более гетер о логичных нуклеиновых кислот, которые кодируют белок FVIII. Согласно некоторым вариантам реализации экспрессия белка FVIII может включать секрецию терапевтического белка из клетки, в которой он экспрессируется. В качестве альтернативы, в некоторых вариантах реализации экспрессированный белок FVIII может действовать или функционировать (например, оказывать свой эффект) внутри клетки, в которой он экспрессируется. Согласно некоторым вариантам реализации зкДНК-вектор экспрессирует белок FVIII в печени, мышце (например, скелетной мышце) субъекта или в другой части тела, которая может функционировать как депо для продукции и секреции терапевтического белка FVIII во многие системные компартменты.[0056] Provided herein is a method of treating hemophilia A using a cccDNA vector containing one or more nucleic acids that encode a therapeutic FVIII protein or fragment thereof. Also provided herein are cccDNA vectors for expression of the FVIII protein described herein containing one or more heterologous nucleic acids that encode the FVIII protein. In some embodiments, expression of the FVIII protein may involve secretion of the therapeutic protein from the cell in which it is expressed. Alternatively, in some embodiments, the expressed FVIII protein may act or function (eg, exert its effect) within the cell in which it is expressed. In some embodiments, the cccDNA vector expresses the FVIII protein in the liver, muscle (eg, skeletal muscle) of the subject, or other part of the body that can function as a depot for production and secretion of the therapeutic FVIII protein into multiple systemic compartments.

I. ОпределенияI. Definitions

[0057] Если в данном документе не указано иное, научные и технические термины, используемые применительно к настоящей заявке, должны иметь значения, обычно известные обычным специалистам в области техники, к которой относится данное раскрытие. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения. Определения обычных терминов в иммунологии и молекулярной биологии можно найти в The Merck Manual of Diagnosis and Therapy, 19 изд., опубликовано Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ред.), Fields Virology, 6 изд., опубликовано Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ред.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, опубликовано Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); и Robert A. Meyers (ред.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, опубликовано VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, опубликовано Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (ред.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, опубликовано Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4 изд., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al, Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ред.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ред.), John Wiley and Sons, Inc., 2005; и Current Protocols in Immunology (CPI) (John E. Coligan, ADA Μ Kruisbeek, David Η Margulies, Ethan Μ Shevach, Warren Strobe, (ред.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), содержание которых полностью включено в данный документ посредством ссылки).[0057] Unless otherwise defined herein, scientific and technical terms used in connection with this application shall have the meanings commonly known to those of ordinary skill in the art to which this disclosure pertains. It should be understood that the present invention is not limited to the specific methodology, protocols and reagents, etc. described herein and is therefore subject to variations. The terminology used herein is intended solely to describe specific embodiments and is not intended to limit the scope of the present invention, which is defined solely by the claims. Definitions of common terms in immunology and molecular biology can be found in The Merck Manual of Diagnosis and Therapy, 19th ed., published by Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ed.), Fields Virology, 6th ed., published by Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ed.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, published by Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); and Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, published by Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, published by Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al, Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005; and Current Protocols in Immunology (CPI) (John E. Coligan, ADA Μ Kruisbeek, David Η Margulies, Ethan Μ Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), contents which are incorporated herein by reference in their entirety).

[0058] В данном документе термины «введение», «введенный» и их варианты относятся к введению субъекту композиции или агента (например, терапевтической нуклеиновой кислоты или иммуносупрессора, описанных в данном документе) и включают одновременное и последовательное введение одной или более композиций или агентов. «Введение» может относиться, например, к терапевтическим, фармакокинетическим, диагностическим, исследовательским методам, к плацебо и к экспериментальным методам. «Введение» также включает способы лечения in vitro и ex vivo. Введение композиции или агента субъекту осуществляют любым подходящим путем, включая перорально, через легкие, интраназально, парентерально (внутривенно, внутримышечно, внутрибрюшинно или подкожно), ректально, введение в лимфатическую систему, внутрь опухоли или местно. Введение субъекту композиции или агента осуществляют с помощью электропорации. Введение включает самостоятельное введение и введение другим лицом. Введение может быть осуществлено любым подходящим путем. Подходящий путь введения позволяет композиции или агенту выполнять их предусмотренную функцию. Например, если подходящим путем является внутривенный, композицию вводят путем введения указанной композиции или агента в вену субъекта.[0058] As used herein, the terms “administration,” “administered,” and variations thereof refer to the administration to a subject of a composition or agent (e.g., a therapeutic nucleic acid or immunosuppressant described herein) and include simultaneous and sequential administration of one or more compositions or agents . “Administration” may refer to, for example, therapeutic, pharmacokinetic, diagnostic, research, placebo, and experimental methods. "Introduction" also includes in vitro and ex vivo treatment methods. Administration of the composition or agent to a subject is accomplished by any suitable route, including orally, pulmonaryly, intranasally, parenterally (intravenous, intramuscular, intraperitoneal, or subcutaneous), rectal, lymphatic, intratumoral, or topical. Administration of the composition or agent to the subject is accomplished by electroporation. Administration includes self-administration and administration by another person. Administration may be accomplished by any suitable route. A suitable route of administration allows the composition or agent to perform its intended function. For example, if the appropriate route is intravenous, the composition is administered by administering said composition or agent into a vein of the subject.

[0059] В данном документе выражения «терапевтическое средство на основе нуклеиновой кислоты», «терапевтическая нуклеиновая кислота» и «ТНК» используются взаимозаменяемо и относятся к любому варианту терапевтического средства с использованием нуклеиновых кислот в качестве активного компонента терапевтического агента для лечения заболевания или нарушения. В данном документе указанные выражения относятся к терапевтическим средствам на основе РНК и терапевтическим средствам на основе ДНК. Неограничивающие примеры терапевтических средств на основе РНК включают мРНК, антисмысловую РНК и олигонуклеотиды, рибозимы, аптамеры, интерферирующие РНК (РНКи), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК). Неограничивающие примеры терапевтических средств на основе ДНК включают миникольцо ДНК, миниген, вирусную ДНК (например, геном лентивируса или ААВ) или невирусные синтетические ДНК-векторы, линейную дуплексную ДНК с замкнутыми концами (зкДНК/CELiD), плазмиды, бакмиды, ДНК-векторы doggybone (dbDNA™), минималистичный вектор для иммунологически определенной экспрессии гена (MIDGE), невирусный ДНК-вектор с минимальной цепью (линейный ковалентно замкнутый ДНК-вектор) или гантелеобразный минимальный ДНК-вектор («гантелеобразную ДНК»).[0059] As used herein, the terms “nucleic acid therapeutic,” “therapeutic nucleic acid,” and “TNA” are used interchangeably and refer to any therapeutic option using nucleic acids as the active component of a therapeutic agent for treating a disease or disorder. As used herein, these expressions refer to RNA-based therapeutics and DNA-based therapeutics. Non-limiting examples of RNA therapeutics include mRNA, antisense RNA and oligonucleotides, ribozymes, aptamers, RNA interfering (RNAi), Dicer dsRNA substrate, short hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA). Non-limiting examples of DNA-based therapeutics include minicircle DNA, minigene, viral DNA (eg, lentivirus or AAV genome) or non-viral synthetic DNA vectors, closed-end linear duplex DNA (ccDNA/CELiD), plasmids, bacmids, doggybone DNA vectors (dbDNA™), minimalist vector for immunologically defined gene expression (MIDGE), non-viral minimal strand DNA vector (linear covalently closed DNA vector), or dumbbell minimal DNA vector (“dumbbell DNA”).

[0060] В данном документе «эффективное количество» или «терапевтически эффективное количество» терапевтического агента, такого как терапевтический белок FVIII или его фрагмент, представляет собой количество, достаточное для получения целевого эффекта, например, лечения или предотвращения гемофилии А. Подходящие анализы для измерения экспрессии целевого гена или целевой последовательности включают, например, исследование уровней белка или РНК с применением методик, известных специалистам в данной области техники, таких как дот-блоттинг, Нозерн-блоттинг, гибридизация in situ, ИФА, иммунопреципитация, функциональный ферментный анализ, а также фенотипические анализы, известные специалистам в данной области техники. Однако уровни дозировки основаны на различных факторах, включая тип повреждения, возраст, массу тела, пол, медицинское состояние пациента, тяжесть состояния, путь введения и конкретный применяемый активный агент. Соответственно, схема дозирования может значительно изменяться, однако может быть определена обычным путем лечащим врачом с применением стандартных способов. Кроме того, термины «терапевтическое количество», «терапевтически эффективные количества» и «фармацевтически эффективные количества» включают профилактические или превентивные количества композиций согласно описанному изобретению. В профилактических или превентивных приложениях описанного изобретения фармацевтические композиции или лекарственные средства вводят пациенту, подверженному или по иным причинам имеющему риск развития заболевания, нарушения или состояния, в количестве, достаточном для того чтобы устранить или уменьшить риск, уменьшить степень тяжести или отсрочить начало указанного заболевания, нарушения или состояния, включая биохимические, гистологические и/или поведенческие симптомы указанного заболевания, нарушения или состояния, его осложнения, и промежуточные патологические фенотипы, возникающие в ходе развития указанного заболевания, нарушения или состояния. Обычно предпочтительным является применение максимальной дозы, т.е. самой высокой безопасной дозы в соответствии с некоторым медицинским заключением. В соответствии с некоторыми вариантами реализации заболевание, нарушение или состояние представляет собой гемофилию А. Термины «доза» и «дозировка» используются в данном документе взаимозаменяемо.[0060] As used herein, an "effective amount" or a "therapeutically effective amount" of a therapeutic agent, such as a therapeutic FVIII protein or fragment thereof, is an amount sufficient to produce the intended effect, such as treating or preventing hemophilia A. Suitable Assays for Measuring expression of a target gene or target sequence include, for example, examination of protein or RNA levels using techniques known to those skilled in the art, such as dot blot, Northern blot, in situ hybridization, ELISA, immunoprecipitation, functional enzyme assay, as well as phenotypic assays known to those skilled in the art. However, dosage levels are based on various factors, including the type of injury, age, body weight, gender, medical condition of the patient, severity of the condition, route of administration, and the specific active agent used. Accordingly, the dosage regimen may vary significantly, but can be determined in the usual way by the attending physician using standard methods. In addition, the terms “therapeutic amount”, “therapeutically effective amount” and “pharmaceutically effective amount” include prophylactic or prophylactic amounts of compositions according to the described invention. In prophylactic or prophylactic applications of the described invention, pharmaceutical compositions or drugs are administered to a patient susceptible to or otherwise at risk of developing a disease, disorder or condition, in an amount sufficient to eliminate or reduce the risk, reduce the severity or delay the onset of said disease, disorders or conditions, including biochemical, histological and/or behavioral symptoms of the specified disease, disorder or condition, its complications, and intermediate pathological phenotypes that occur during the development of the specified disease, disorder or condition. It is usually preferable to use the maximum dose, i.e. the highest safe dose according to some medical opinion. In some embodiments, the disease, disorder, or condition is hemophilia A. The terms “dose” and “dosage” are used interchangeably herein.

[0061] В данном документе термин «терапевтический эффект» относится к последствиям лечения, результаты которого оценивают как целевые и благоприятные. Терапевтический эффект может включать, прямо или опосредованно, остановку, уменьшение или устранение проявления заболевания. Терапевтический эффект также может включать, прямо или опосредованно, остановку, уменьшение или устранение прогрессирования проявления заболевания.[0061] As used herein, the term “therapeutic effect” refers to the consequences of treatment, the results of which are assessed as targeted and beneficial. The therapeutic effect may include, directly or indirectly, stopping, reducing or eliminating the manifestation of the disease. The therapeutic effect may also include, directly or indirectly, stopping, reducing or eliminating the progression of disease manifestations.

[0062] Для любого терапевтического агента, описанного в данном документе, терапевтически эффективное количество может быть изначально определено на основании предварительных исследований in vitro и/или в моделях на животных. Терапевтически эффективная доза также может быть определена на основании данных у человека. Применяемая доза может быть скорректирована на основании относительных биодоступности и эффективности вводимого соединения. Коррекция дозы для достижения максимальной эффективности на основе описанных выше способов и других хорошо известных способов находится в пределах возможностей обычного специалиста в данной области техники. Общие принципы определения терапевтической эффективности, с которыми можно ознакомиться в главе 1 руководства Goodman and Oilman, The Pharmacological Basis of Therapeutics, 10 изд., McGraw-Hill (New York) (2001), включенного в данный документ посредством ссылки, обобщены ниже.[0062] For any therapeutic agent described herein, a therapeutically effective amount may initially be determined based on preliminary in vitro studies and/or animal models. The therapeutically effective dose can also be determined based on human data. The dose used may be adjusted based on the relative bioavailability and potency of the compound administered. Dosage adjustments to achieve maximum effectiveness based on the methods described above and other well known methods are within the capabilities of one of ordinary skill in the art. The general principles for determining therapeutic efficacy, which can be found in Chapter 1 of Goodman and Oilman, The Pharmacological Basis of Therapeutics, 10th ed., McGraw-Hill (New York) (2001), incorporated herein by reference, are summarized below.

[0063] Фармакокинетические принципы обеспечивают основу для модификации схемы дозирования для получения целевой степени терапевтической эффективности с минимумом неприемлемых нежелательных явлений. Дополнительные рекомендации по модификации дозировки могут быть получены в ситуациях, когда концентрация лекарственного средства в плазме может быть измерена и соотнесена с терапевтическим окном.[0063] Pharmacokinetic principles provide a basis for modifying dosing regimens to achieve the target degree of therapeutic efficacy with a minimum of unacceptable adverse events. Additional recommendations for dosage modification may be obtained in situations where plasma drug concentrations can be measured and related to the therapeutic window.

[0064] В данном документе термины «гетерологичная нуклеотидная последовательность» и «трансген» используются взаимозаменяемо и относятся к представляющей интерес нуклеиновой кислоте (отличной от нуклеиновой кислоты, кодирующей полипептид капсида), которая встроена в зкДНК-вектор и может быть доставлена и экспрессирована зкДНК-вектором, раскрытым в данном документе.[0064] As used herein, the terms “heterologous nucleotide sequence” and “transgene” are used interchangeably and refer to a nucleic acid of interest (other than a nucleic acid encoding a capsid polypeptide) that is inserted into a cccDNA vector and can be delivered and expressed by a cccDNA vector. vector disclosed herein.

[0065] В данном документе термины «экспрессионная кассета» и «транскрипционная кассета» используются взаимозаменяемо и относятся к линейному участку нуклеиновых кислот, который включает трансген, функционально связанный с одним или более промоторами или другими регуляторными последовательностями, достаточными для направления транскрипции трансгена, но который не содержит кодирующих капсид последовательностей, других векторных последовательностей или областей инвертированных концевых повторов. Экспрессионная кассета может дополнительно содержать одну или более цис-действующих последовательностей (например, промоторов, энхансеров или репрессоров), один или более интронов и один или более посттранскрипционных регуляторных элементов.[0065] As used herein, the terms "expression cassette" and "transcription cassette" are used interchangeably and refer to a linear stretch of nucleic acids that includes a transgene operably linked to one or more promoters or other regulatory sequences sufficient to direct transcription of the transgene, but which does not contain capsid coding sequences, other vector sequences or inverted terminal repeat regions. The expression cassette may further comprise one or more cis-acting sequences (eg, promoters, enhancers, or repressors), one or more introns, and one or more post-transcriptional regulatory elements.

[0066] Термины «полинуклеотид» и «нуклеиновая кислота», используемые в данном документе взаимозаменяемо, относятся к полимерной форме нуклеотидов любой длины, будь то рибонуклеотиды или дезоксирибонуклеотиды. Таким образом, этот термин включает одно-, двух- или многоцепочечные ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, включающий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания. «Олигонуклеотид» обычно относится к полинуклеотидам, содержащим от примерно 5 до примерно 100 нуклеотидов одно- или двухцепочечной ДНК. Однако для целей настоящего раскрытия верхнего предела длины олигонуклеотида не существует. Олигонуклеотиды также известны как «олигомеры» или «олиго» (oligos) и могут быть выделены из генов или химически синтезированы с помощью способов, известных в данной области техники. Термины «полинуклеотид» и «нуклеиновая кислота» следует понимать как включающие, применительно к описываемым вариантам реализации, одноцепочечные (такие как смысловые или антисмысловые) и двухцепочечные полинуклеотиды. ДНК может быть в форме, например, антисмысловых молекул, плазмидной ДНК, дуплексов ДНК-ДНК, предварительно конденсированной ДНК, продуктов ПЦР, векторов (Р1, РАС, ВАС, ΥАС, искусственные хромосомы), экспрессионных кассет, химерных последовательностей, хромосомной ДНК или производных и комбинаций указанных групп. ДНК может быть в форме миникольца, плазмиды, бакмиды, минигена, ДНК с минимальной цепью (линейного ковалентно замкнутого ДНК-вектора), линейной дуплексной ДНК с замкнутыми концами (CELiD или зкДНК), ДНК doggybone (dbDNA™), гантелеобразной ДНК, минималистичного вектора для иммунологически определенной экспрессии гена (MIDGE), вирусного вектора или невирусных векторов. РНК может быть в форме короткой интерферирующей РНК (киРНК), дцРНК-субстрата Dicer, короткой шпилечной РНК (кшРНК), асимметричной интерферирующей РНК (аиРНК), микроРНК (миРНК), мРНК, рРНК, тРНК, вирусной РНК (вРНК) и их комбинаций. Нуклеиновые кислоты включают нуклеиновые кислоты, содержащие известные аналоги нуклеотидов или модифицированные остатки или связи остова, которые являются синтетическими, природными и неприродными, и которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Примеры таких аналогов и/или модифицированных остатков включают, без ограничения, фосфотиоаты, фосфодиамидат-морфолиновый олигомер (морфолино), фосфоамидаты, метилфосфонаты, хиральные метилфосфонаты, 2'-О-метилрибонуклеотиды, замкнутую нуклеиновую кислоту (LNA™) и пептидные нуклеиновые кислоты (ПНК). За исключением конкретно указанных ограничений термин включает нуклеиновые кислоты, содержащие известные аналоги природных нуклеотидов, которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Если не указано иное, подразумевается также, что конкретная последовательность нуклеиновой кислоты также включает ее консервативно модифицированные варианты (например, вырожденные замены кодонов), аллели, ортологи, однонуклеотидные полиморфизмы (SNP) и комплементарные последовательности, а также последовательность, указанную явным образом.[0066] The terms "polynucleotide" and "nucleic acid", used interchangeably herein, refer to the polymeric form of nucleotides of any length, whether ribonucleotides or deoxyribonucleotides. Thus, the term includes single-, double- or multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrids, or a polymer comprising purine and pyrimidine bases or other natural, chemically or biochemically modified, non-natural or derivatized nucleotide bases. "Oligonucleotide" generally refers to polynucleotides containing from about 5 to about 100 nucleotides of single- or double-stranded DNA. However, for purposes of the present disclosure, there is no upper limit on the length of the oligonucleotide. Oligonucleotides are also known as "oligomers" or "oligos" and can be isolated from genes or chemically synthesized using methods known in the art. The terms “polynucleotide” and “nucleic acid” should be understood to include, for the purposes of the described embodiments, single-stranded (such as sense or antisense) and double-stranded polynucleotides. The DNA may be in the form of, for example, antisense molecules, plasmid DNA, DNA-DNA duplexes, pre-condensed DNA, PCR products, vectors (P1, PAC, BAC, ΥAC, artificial chromosomes), expression cassettes, chimeric sequences, chromosomal DNA or derivatives and combinations of these groups. The DNA may be in the form of a minicircle, plasmid, bacmid, minigene, minimal strand DNA (linear covalently closed DNA vector), closed end linear duplex DNA (CELiD or cccDNA), doggybone DNA (dbDNA™), dumbbell DNA, minimalistic vector for immunologically defined gene expression (MIDGE), viral vector or non-viral vectors. The RNA may be in the form of short interfering RNA (siRNA), Dicer substrate dsRNA, short hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA), mRNA, rRNA, tRNA, viral RNA (vRNA), and combinations thereof . Nucleic acids include nucleic acids containing known nucleotide analogues or modified backbone residues or linkages, which are synthetic, natural or non-natural, and which have binding properties similar to those of the reference nucleic acid. Examples of such analogues and/or modified residues include, but are not limited to, phosphorothioates, phosphodiamidate-morpholine oligomer (morpholino), phosphoamidates, methylphosphonates, chiral methylphosphonates, 2'-O-methylribonucleotides, locked nucleic acid (LNA™) and peptide nucleic acids (PNAs). ). Except as specifically stated, the term includes nucleic acids containing known analogues of natural nucleotides that have binding properties similar to those of the reference nucleic acid. Unless otherwise indicated, a particular nucleic acid sequence is also intended to include conservatively modified variants thereof (eg, degenerate codon substitutions), alleles, orthologs, single nucleotide polymorphisms (SNPs), and complementary sequences, as well as explicitly stated sequence.

[0067] «Нуклеотиды» содержат сахар дезоксирибозу (ДНК) или рибозу (РНК), основание и фосфатную группу. Нуклеотиды соединены между собой посредством фосфатных групп.[0067] "Nucleotides" contain the sugar deoxyribose (DNA) or ribose (RNA), a base, and a phosphate group. Nucleotides are connected to each other through phosphate groups.

[0068] «Основания» включают пурины и пиримидины, которые, в частности, включают природные соединения аденин, тимин, гуанин, цитозин, урацил, инозин и природные аналоги, а также синтетические производные пуринов и пиримидинов, которые включают, но не ограничиваются перечисленными, модификации, которые вводят новые реакционноспособные группы, такие как, но не ограничиваясь перечисленными, амины, спирты, тиолы, карбоксилаты и алкилгалогениды.[0068] "Bases" include purines and pyrimidines, which include, but are not limited to, the natural compounds adenine, thymine, guanine, cytosine, uracil, inosine and natural analogues, as well as synthetic derivatives of purines and pyrimidines, which include, but are not limited to, modifications that introduce new reactive groups such as, but not limited to, amines, alcohols, thiols, carboxylates and alkyl halides.

[0069] В данном документе термин «интерферирующая РНК» или «РНКи», или «последовательность интерферирующей РНК» включает одноцепочечную РНК (например, зрелую миРНК, олигонуклеотиды оцРНКи, олигонуклеотиды оцДНКи), двухцепочечную РНК (т.е. дуплексную РНК, такую как киРНК, дцРНК-субстрат Dicer, кшРНК, аиРНК или пре-миРНК), гибрид ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941) или гибрид ДНК-ДНК (см., например, публикацию РСТ № WO 2004/104199), который способен уменьшать или ингибировать экспрессию целевого гена или последовательности (например, опосредуя разрушение или ингибируя трансляцию мРНК, которые комплементарны последовательности интерферирующей РНК), когда интерферирующая РНК находится в той же клетке, что и целевой ген или последовательность. Таким образом, интерферирующая РНК относится к одноцепочечной РНК, которая комплементарна последовательности мРНК-мишени, или к двухцепочечной РНК, образованной двумя комплементарными цепями или одной самокомплементарной цепью. Интерферирующая РНК может иметь существенную или полную идентичность с целевым геном или последовательностью или может содержать область несовпадения (т.е. мотив несовпадения). Последовательность интерферирующей РНК может соответствовать полноразмерному целевому гену или его подпоследовательности. Предпочтительно молекулы интерферирующих РНК синтезируют химическим путем. Раскрытия каждого из упомянутых выше патентных документов полностью включены в данный документ посредством ссылки для всех целей.[0069] As used herein, the term “interfering RNA” or “RNAi” or “interfering RNA sequence” includes single-stranded RNA (e.g., mature siRNA, ssRNAi oligonucleotides, ssDNAi oligonucleotides), double-stranded RNA (i.e., duplex RNA such as siRNA, dsRNA-Dicer substrate, shRNA, aiRNA or pre-miRNA), DNA-RNA hybrid (see, for example, PCT Publication No. WO 2004/078941) or DNA-DNA hybrid (see, for example, PCT Publication No. WO 2004 /104199) that is capable of reducing or inhibiting the expression of a target gene or sequence (for example, by mediating the destruction or inhibiting the translation of mRNAs that are complementary to an interfering RNA sequence) when the interfering RNA is in the same cell as the target gene or sequence. Thus, interfering RNA refers to single-stranded RNA that is complementary to the target mRNA sequence, or double-stranded RNA formed by two complementary strands or one self-complementary strand. The interfering RNA may have substantial or complete identity with the target gene or sequence or may contain a region of mismatch (ie, a mismatch motif). The interfering RNA sequence may correspond to the full-length target gene or a subsequence thereof. Preferably, interfering RNA molecules are synthesized chemically. The disclosures of each of the patent documents mentioned above are incorporated herein by reference in their entirety for all purposes.

[0070] Интерферирующая РНК включает «короткую интерферирующую РНК» или «киРНК», например, интерферирующую РНК из примерно 15-60, 15-50 или 15-40 (дуплекс) нуклеотидов в длину, более типично примерно 15-30, 15-25 или 19-25 (дуплекс) нуклеотидов в длину и предпочтительно составляет примерно 20-24, 21-22 или 21-23 (дуплекс) нуклеотида в длину (например, каждая комплементарная последовательность двухцепочечной киРНК составляет 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 нуклеотидов в длину, предпочтительно примерно 20-24, 21-22 или 21-23 нуклеотида в длину, и двухцепочечная киРНК составляет примерно 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 пар оснований в длину, предпочтительно примерно 18-22, 19-20 или 19-21 пару оснований в длину). Дуплексы киРНК могут содержать 3'-липкие концы, имеющие от примерно 1 до примерно 4 нуклеотидов или от примерно 2 до примерно 3 нуклеотидов, и 5-фосфатные концы. Примеры киРНК включают, без ограничения, двухцепочечную полинуклеотидную молекулу, собранную из двух одноцепочечных молекул, причем одна цепь является смысловой цепью, а другая представляет собой комплементарную антисмысловую цепь; двухцепочечную полинуклеотидную молекулу, собранную из одноцепочечной молекулы, в которой смысловая и антисмысловая области соединены линкером на основе нуклеиновой кислоты или на основе, отличной от нуклеиновой кислоты; двухцепочечную полинуклеотидную молекулу со шпилечной вторичной структурой, имеющей самокомплементарные смысловые и антисмысловые области; и кольцевую одноцепочечную полинуклеотидную молекулу с двумя или более петлевыми структурами и стеблем, имеющим самокомплементарные смысловые и антисмысловые области, причем кольцевой полинуклеотид может подвергаться процессингу in vivo или in vitro с получением активной двухцепочечной молекулы киРНК. В данном документе термин «киРНК» включает дуплексы РНК-РНК, а также гибриды ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941).[0070] Interfering RNA includes "short interfering RNA" or "siRNA", for example, interfering RNA of about 15-60, 15-50 or 15-40 (duplex) nucleotides in length, more typically about 15-30, 15-25 or 19-25 (duplex) nucleotides in length and is preferably about 20-24, 21-22 or 21-23 (duplex) nucleotides in length (e.g., each complementary sequence of a double-stranded siRNA is 15-60, 15-50, 15- 40, 15-30, 15-25 or 19-25 nucleotides in length, preferably about 20-24, 21-22 or 21-23 nucleotides in length, and double-stranded siRNA is about 15-60, 15-50, 15-40 , 15-30, 15-25 or 19-25 base pairs in length, preferably about 18-22, 19-20 or 19-21 base pairs in length). siRNA duplexes may contain 3'-overhangs having from about 1 to about 4 nucleotides or from about 2 to about 3 nucleotides, and 5-phosphate ends. Examples of siRNA include, but are not limited to, a double-stranded polynucleotide molecule assembled from two single-stranded molecules, one strand being the sense strand and the other being the complementary antisense strand; a double-stranded polynucleotide molecule assembled from a single-stranded molecule in which the sense and antisense regions are connected by a nucleic acid-based or non-nucleic acid-based linker; a double-stranded polynucleotide molecule with a hairpin secondary structure having self-complementary sense and antisense regions; and a circular single-stranded polynucleotide molecule with two or more loop structures and a stem having self-complementary sense and antisense regions, wherein the circular polynucleotide can be processed in vivo or in vitro to produce an active double-stranded siRNA molecule. As used herein, the term “siRNA” includes RNA-RNA duplexes as well as DNA-RNA hybrids (see, for example, PCT Publication No. WO 2004/078941).

[0071] В данном документе термин «конструкция нуклеиновой кислоты» относится к молекуле нуклеиновой кислоты, будь то одноцепочечная или двухцепочечная, которая выделена из природного гена или которая модифицирована так, чтобы она содержала сегменты нуклеиновых кислот, с помощью способа, который в прочих случаях не существовал бы в природе, или является синтетической. Термин «конструкция нуклеиновой кислоты» является синонимом термина «экспрессионная кассета», когда конструкция нуклеиновой кислоты содержит контрольные последовательности, необходимые для экспрессии кодирующей последовательности согласно настоящему раскрытию. «Экспрессионная кассета» включает кодирующую последовательность ДНК, функционально связанную с промотором.[0071] As used herein, the term “nucleic acid construct” refers to a nucleic acid molecule, whether single-stranded or double-stranded, that is isolated from a naturally occurring gene or that is modified to contain segments of nucleic acids in a manner that is not otherwise would exist in nature, or is synthetic. The term “nucleic acid construct” is synonymous with the term “expression cassette” when the nucleic acid construct contains control sequences necessary for the expression of a coding sequence according to the present disclosure. An "expression cassette" includes a DNA coding sequence operably linked to a promoter.

[0072] Под «гибридизуемая» или «комплементарная» или «по существу комплементарная» подразумевается, что нуклеиновая кислота (например, РНК) включает последовательность нуклеотидов, которая позволяет ей нековалентно связываться, т.е. формировать пары оснований по Уотсону-Крику и/или пары оснований G/U, «ренатурировать» или «гибридизироваться» с другой нуклеиновой кислотой специфичным для последовательности, антипараллельным образом (т.е. нуклеиновая кислота специфично связывается с комплементарной нуклеиновой кислотой) в соответствующих условиях температуры и ионной силы раствора in vitro и/или in vivo. Как известно в данной области техники, стандартное спаривание оснований по Уотсону-Крику включает: спаривание аденина (А) с тимидином (Т), спаривание аденина (А) с урацилом (U) и спаривание гуанина (G) с цитозином (С). Кроме того, в данной области техники также известно, что при гибридизации двух молекул РНК (например, дцРНК) гуаниновое (G) основание спаривается с урацилом (U). Например, спаривание оснований G/U частично отвечает за вырожденность (т.е. избыточность) генетического кода в случае спаривания оснований анти-кодонов тРНК с кодонами в мРНК. Применительно к настоящему раскрытию гуанин (G) связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению считается комплементарным урацилу (U), и наоборот. Таким образом, когда пара оснований G/U может быть получена в определенном нуклеотидном положении связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению, это положение не рассматривается как некомплементарное, а вместо этого считается комплементарным.[0072] By "hybridizable" or "complementary" or "substantially complementary" is meant that the nucleic acid (eg, RNA) includes a nucleotide sequence that allows it to bind non-covalently, i.e. form Watson-Crick base pairs and/or G/U base pairs, "renature" or "hybridize" with another nucleic acid in a sequence-specific, antiparallel manner (i.e., the nucleic acid specifically binds to a complementary nucleic acid) under appropriate conditions temperature and ionic strength of the solution in vitro and/or in vivo. As is known in the art, standard Watson-Crick base pairing includes: adenine (A) pairing with thymidine (T), adenine (A) pairing with uracil (U), and guanine (G) pairing with cytosine (C). In addition, it is also known in the art that when two RNA molecules (eg, dsRNA) are hybridized, a guanine (G) base is paired with a uracil (U). For example, G/U base pairing is partly responsible for the degeneracy (i.e., redundancy) of the genetic code in the case of base pairing of tRNA anti-codons with codons in mRNA. For purposes of the present disclosure, the guanine (G) protein-binding segment (dsRNA duplex) of the DNA-targeting RNA molecule of the present invention is considered to be complementary to uracil (U), and vice versa. Thus, when a G/U base pair can be obtained at a specific nucleotide position of the protein binding segment (dsRNA duplex) of a DNA-targeting RNA molecule according to the present invention, that position is not considered to be non-complementary, but instead is considered to be complementary.

[0073] Термины «пептид», «полипептид» и «белок» используются в данном документе взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты, и полипептиды, имеющие модифицированные пептидные остовы.[0073] The terms "peptide", "polypeptide" and "protein" are used interchangeably herein and refer to the polymeric form of amino acids of any length, which may include encoded and non-encoded amino acids, chemically or biochemically modified or derivatized amino acids, and polypeptides having modified peptide backbones.

[0074] Последовательность ДНК, которая «кодирует» конкретный белок FVIII, представляет собой последовательность нуклеиновой кислоты ДНК, которая транскрибируется в конкретную РНК и/или белок. Полинуклеотид ДНК может кодировать РНК (мРНК), которая транслируется в белок, или полинуклеотид ДНК может кодировать РНК, которая не транслируется в белок (например, тРНК, рРНК или нацеливающую на ДНК РНК; также называемые «некодирующими» РНК или «нкРНК»).[0074] A DNA sequence that “codes” for a particular FVIII protein is a DNA nucleic acid sequence that is transcribed into a particular RNA and/or protein. A DNA polynucleotide may encode RNA (mRNA) that is translated into a protein, or a DNA polynucleotide may encode RNA that is not translated into a protein (eg, tRNA, rRNA, or DNA-targeting RNA; also called “non-coding” RNA or “ncRNA”).

[0001] В данном документе термин «слитый белок», в используемом в данном документе значении, относится к полипептиду, который содержит белковые домены по меньшей мере из двух разных белков. Например, слитый белок может содержать (i) FVIII или его фрагмент и (ii) по меньшей мере один белок, не относящийся к GOI. Слитые белки, охватываемые данным документом, включают, но не ограничиваются перечисленными, антитело или Fc или антигенсвязывающий фрагмент антитела, слитый с белком FVIII, например, внеклеточным доменом рецептора, лигандом, ферментом или пептидом. Белок FVIII или его фрагмент, который является частью слитого белка, может представлять собой моноспецифичное антитело или биспецифичное или мультиспецифичное антитело.[0001] As used herein, the term “fusion protein” refers to a polypeptide that contains protein domains from at least two different proteins. For example, the fusion protein may comprise (i) FVIII or a fragment thereof and (ii) at least one non-GOI protein. Fusion proteins covered herein include, but are not limited to, an antibody or Fc or antigen binding fragment of an antibody fused to an FVIII protein, such as a receptor extracellular domain, ligand, enzyme, or peptide. The FVIII protein or fragment thereof that is part of the fusion protein may be a monospecific antibody or a bispecific or multispecific antibody.

[0075] В данном документе термин «ген безопасной гавани генома» или «ген безопасной гавани» относится к гену или локусам, в которые последовательность нуклеиновой кислоты может быть вставлена так, чтобы последовательность могла интегрироваться и функционировать предсказуемым образом (например, экспрессировать белок, представляющий интерес) без существенных отрицательных последствий для активности эндогенного гена или стимуляции рака. Согласно некоторым вариантам реализации ген безопасной гавани также представляет собой локусы или ген, в которых вставленная последовательность нуклеиновой кислоты может экспрессироваться эффективнее и на более высоких уровнях, чем в сайте, не являющемся «безопасной гаванью».[0075] As used herein, the term “genomic safe harbor gene” or “safe harbor gene” refers to a gene or loci into which a nucleic acid sequence can be inserted such that the sequence can integrate and function in a predictable manner (e.g., to express a protein representing interest) without significant negative consequences for endogenous gene activity or cancer stimulation. In some embodiments, a safe harbor gene also represents loci or a gene at which the inserted nucleic acid sequence can be expressed more efficiently and at higher levels than at a non-safe harbor site.

[0076] В данном документе термин «доставка гена» означает способ, с помощью которого чужеродную ДНК переносят в клетки-хозяева для приложений генной терапии.[0076] As used herein, the term “gene delivery” refers to the method by which foreign DNA is transferred into host cells for gene therapy applications.

[0077] В данном документе термин «концевой повтор» или «TR» включает любой вирусный концевой повтор или синтетическую последовательность, которая содержит по меньшей мере одну минимальную требуемую точку начала репликации и область, содержащую палиндромную шпилечную структуру. Связывающая Rep последовательность («RBS») (также называемая RBE (связывающий Rep элемент)) и сайт концевого разрешения («TRS») вместе составляют «минимальную требуемую точку начала репликации» и, соответственно, TR содержит по меньшей мере одну RBS и по меньшей мере один TRS. Каждый из TR, обратно комплементарных по отношению друг к другу в пределах определенного участка полинуклеотидной последовательности, как правило, называют «инвертированным концевым повтором» или «ITR». Применительно к вирусу ITR опосредуют репликацию, упаковку вируса, интеграцию и освобождение провируса. Как было неожиданно обнаружено, согласно настоящему изобретению TR, которые не являются обратно комплементарными по всей их длине, все еще могут выполнять обычные функции ITR и, таким образом, в данном документе термин ITR относится к TR в геноме зкДНК или зкДНК-векторе, который способен опосредовать репликацию зкДНК-вектора. Обычный специалист в данной области техники поймет, что в зкДНК-векторах сложной конфигурации может присутствовать более двух пар ITR или асимметричных ITR. ITR может представлять собой ITR ААВ или ITR, не принадлежащий ААВ, или может быть получен из ITR ААВ или ITR, не принадлежащего ААВ. Например, ITR может происходить из семейства Parvoviridae, которое включает парвовирусы и депендовирусы (например, собачий парвовирус, бычий парвовирус, мышиный парвовирус, свиной парвовирус, парвовирус человека В-19), или шпилька SV40, которая служит точкой начала репликации SV40, может применяться в качестве ITR, который может быть дополнительно модифицирован путем усечения, замены, делеции, вставки и/или добавления. Вирусы семейства Parvoviridae состоят из двух подсемейств: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих беспозвоночных. Депендопарвовирусы включают вирусное семейство аденоассоциированных вирусов (ААВ), которые способны к репликации у позвоночных животных-хозяев, включая, но не ограничиваясь перечисленными, человека, виды приматов, бычьих, собачьих, лошадиных и овечьих. Для удобства в данном документе ITR, расположенный в 5-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».[0077] As used herein, the term “terminal repeat” or “TR” includes any viral terminal repeat or synthetic sequence that contains at least one minimum required origin of replication and a region containing a palindromic hairpin structure. The Rep binding sequence (“RBS”) (also called the RBE (Rep binding element)) and the terminal resolution site (“TRS”) together constitute the “minimum required origin of replication” and, accordingly, the TR contains at least one RBS and at least at least one TRS. Each of the TRs that are inversely complementary to each other within a specific region of a polynucleotide sequence is generally referred to as an “inverted terminal repeat” or “ITR.” In the context of a virus, ITRs mediate viral replication, packaging, integration, and proviral release. Surprisingly, according to the present invention, TRs that are not reverse complementary along their entire length can still perform the normal functions of ITRs and thus, as used herein, the term ITR refers to a TR in a cccDNA genome or a cccDNA vector that is capable of mediate replication of the cDNA vector. One of ordinary skill in the art will appreciate that cccDNA vectors of complex configuration may contain more than two pairs of ITRs or asymmetric ITRs. The ITR may be an AAB ITR or a non-AAB ITR, or may be derived from an AAB ITR or a non-AAB ITR. For example, the ITR may be from the Parvoviridae family, which includes parvoviruses and dependoviruses (eg, canine parvovirus, bovine parvovirus, murine parvovirus, porcine parvovirus, human parvovirus B-19), or the SV40 hairpin, which serves as the SV40 origin of replication, may be used in as an ITR, which may be further modified by truncation, substitution, deletion, insertion and/or addition. Viruses of the Parvoviridae family consist of two subfamilies: Parvovirinae, which infect vertebrates, and Densovirinae, which infect invertebrates. Dependoparvoviruses comprise the adeno-associated virus (AAV) family of viruses that are capable of replication in vertebrate hosts, including, but not limited to, human, primate, bovine, canine, equine and ovine species. For convenience, herein the ITR located in the 5-direction (to the left) of the expression cassette in the cDNA vector is referred to as the “5'-ITR” or “left ITR”, and the ITR located in the 3-direction (to the right) of the expression cassette in a cccDNA vector, is called the “3'-ITR” or “right-hand ITR”.

[0078] «ITR дикого типа» или «WT-ITR» относится к последовательности природной последовательности ITR в ААВ или другом депендовирусе, которая сохраняет, например, активность связывания Rep и никирующую способность Rep. Нуклеотидная последовательность WT-ITR из любого серотипа ААВ может незначительно отличаться от канонической природной последовательности из-за вырожденности генетического кода или дрейфа, и, таким образом, последовательности WT-ITR, предусмотренные для применения в данном документе, включают последовательности WT-ITR, образующиеся в результате природных изменений, происходящих в процессе продуцирования (например, ошибки репликации).[0078] “Wild-type ITR” or “WT-ITR” refers to a naturally occurring ITR sequence in an AAV or other dependovirus that retains, for example, Rep binding activity and Rep nicking ability. The nucleotide sequence of the WT-ITR from any AAV serotype may differ slightly from the canonical natural sequence due to degeneracy of the genetic code or drift, and thus the WT-ITR sequences provided for use herein include WT-ITR sequences generated in as a result of natural changes occurring during the production process (for example, replication errors).

[0079] В данном документе термин «по существу симметричные WT-ITR» или «пара по существу симметричных WT-ITR» относится к паре WT-ITR в одном геноме зкДНК или зкДНК-векторе, которые оба представляют собой ITR дикого типа, которые имеют обратно комплементарные последовательности по всей их длине. Например, ITR может считаться последовательностью дикого типа, даже если он содержит один или более нуклеотидов, отличающихся от канонической природной последовательности, при условии, что указанные изменения не влияют на свойства и общую трехмерную структуру последовательности. Согласно некоторым аспектам отличающиеся нуклеотиды представляют собой консервативные изменения последовательности. В качестве одного неограничивающего примера, последовательность, имеющая по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной, например, с использованием BLAST при настройках по умолчанию), также имеет симметричную трехмерную пространственную организацию с другой последовательностью WT-ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. По существу симметричный WT-ITR содержит одинаковые петли А, С-С' и В-В' в трехмерном пространстве. То, что по существу симметричный WT-ITR представляет собой WT, может быть функционально подтверждено путем определения наличия в нем функционального сайта связывания Rep (RBE или RBE') и сайта концевого разрешения (TRS), который спаривается с соответствующим белком Rep. Могут быть протестированы другие функции, включая экспрессию трансгена в пермиссивных условиях, но необязательно.[0079] As used herein, the term “substantially symmetrical WT-ITRs” or “a pair of essentially symmetrical WT-ITRs” refers to a pair of WT-ITRs in a single ccDNA genome or ccDNA vector that are both wild-type ITRs that have reverse complementary sequences along their entire length. For example, an ITR may be considered a wild-type sequence even if it contains one or more nucleotides that differ from the canonical natural sequence, provided that these changes do not affect the properties and overall three-dimensional structure of the sequence. In some aspects, the differing nucleotides represent conserved sequence changes. As one non-limiting example, a sequence having at least 95%, 96%, 97%, 98%, or 99% sequence identity with a canonical sequence (measured, for example, using BLAST at default settings) also has symmetric three-dimensional spatial organization with a different WT-ITR sequence such that their three-dimensional structures have the same shape in geometric space. An essentially symmetrical WT-ITR contains identical loops A, C-C' and B-B' in three-dimensional space. That an essentially symmetrical WT-ITR is WT can be functionally confirmed by determining whether it contains a functional Rep binding site (RBE or RBE') and a terminal resolution site (TRS) that pairs with the corresponding Rep protein. Other functions may be tested, including expression of the transgene under permissive conditions, but are not required.

[0080] В данном документе выражения «модифицированный ITR» или «mod-ITR», или «мутантный ITR» используются в данном документе взаимозаменяемо и относятся к ITR, который содержит мутацию по меньшей мере в одном или более нуклеотидах по сравнению с WT-ITR из того же серотипа. Указанная мутация может приводить к изменению в одной или более из областей А, С, С', В, В' в ITR и может приводить к изменению трехмерной пространственной организации (т.е. его трехмерной структуры в геометрическом пространстве) по сравнению с трехмерной пространственной организацией WT-ITR из того же серотипа.[0080] As used herein, the expressions “modified ITR” or “mod-ITR” or “mutant ITR” are used interchangeably herein and refer to an ITR that contains a mutation in at least one or more nucleotides compared to the WT-ITR from the same serotype. The mutation may result in a change in one or more of regions A, C, C', B, B' in the ITR and may result in a change in three-dimensional spatial organization (i.e., its three-dimensional structure in geometric space) compared to three-dimensional spatial organization by the WT-ITR organization from the same serotype.

[0081] В данном документе термин «асимметричные ITR», также называемые «парами асимметричных ITR», относится к паре ITR в одном геноме зкДНК или зкДНК-векторе, которые не являются обратно комплементарными по их полной длине. В качестве одного неограничивающего примера, асимметричный ITR в паре не имеет симметричной трехмерной пространственной организации со своим когнатным ITR так, что их трехмерные структуры имеют разные формы в геометрическом пространстве. Другими словами, асимметричные ITR в паре имеют разные общие геометрические структуры, т.е. они имеют разную организацию их петель А, С-С' и В-В' в трехмерном пространстве (например, один ITR может иметь короткое плечо С-С' и/или короткое плечо В-В' по сравнению с когнатным ITR). Различие по последовательности между двумя ITR может быть обусловлено добавлением, делецией, усечением или точечной мутацией одного или более нуклеотидов. Согласно одному варианту реализации один ITR из пары асимметричных ITR может представлять собой последовательность ITR дикого типа ААВ, а другой ITR представляет собой модифицированный ITR, как определено в данном документе (например, последовательность ITR, не относящуюся к дикому типу, или синтетическую последовательность). Согласно другому варианту реализации ни один ITR из пары асимметричных ITR не является последовательностью ААВ дикого типа, и указанные два ITR представляют собой модифицированные ITR, которые имеют разные формы в геометрическом пространстве (т.е. разную общую геометрическую структуру). Согласно некоторым вариантам реализации один mod-ITR из пары асимметричных ITR может иметь короткое плечо С-С', а другой ITR может иметь другую модификацию (например, одно плечо или короткое плечо В-В' и т.д.) так, что они имеют различную трехмерную пространственную организацию по сравнению с когнатным асимметричным mod-ITR.[0081] As used herein, the term “asymmetric ITRs,” also referred to as “asymmetric ITR pairs,” refers to a pair of ITRs in the same ccDNA genome or ccDNA vector that are not inversely complementary in their full length. As one non-limiting example, an asymmetric ITR in a pair does not have a symmetrical three-dimensional spatial organization with its cognate ITR such that their three-dimensional structures have different shapes in geometric space. In other words, asymmetric ITRs in a pair have different overall geometric structures, i.e. they have different organizations of their A, C-C' and B-B' loops in three-dimensional space (e.g., a single ITR may have a short C-C' arm and/or a short B-B' arm compared to a cognate ITR). The sequence difference between two ITRs may be due to the addition, deletion, truncation, or point mutation of one or more nucleotides. In one embodiment, one ITR of a pair of asymmetric ITRs may be a wild-type AAB ITR sequence, and the other ITR is a modified ITR as defined herein (eg, a non-wild-type ITR sequence or a synthetic sequence). In another embodiment, neither ITR of a pair of asymmetric ITRs is a wild-type AAV sequence, and the two ITRs are modified ITRs that have different shapes in geometric space (ie, a different overall geometric structure). In some embodiments, one mod-ITR of a pair of asymmetric ITRs may have a short C-C' arm, and the other ITR may have a different modification (e.g., a single arm or a short B-B' arm, etc.) such that they have a different three-dimensional spatial organization compared to cognate asymmetric mod-ITR.

[0082] В данном документе термин «симметричные ITR» относится к паре ITR в одном зкДНК-геноме или зкДНК-векторе, которые представляют собой последовательности дикого типа или мутированные (например, модифицированные относительно дикого типа) депендовирусные последовательности ITR и обратно комплементарны по всей их длине. В одном неограничивающем примере оба ITR представляют собой последовательности ITR дикого типа из ААВ2. В другом примере ни один из ITR не является последовательностью ITR дикого типа ААВ2 (т.е. они представляют собой модифицированные ITR, также называемые мутантными ITR) и может отличаться по последовательности от ITR дикого типа вследствие добавления, делеции, замены, усечения или точечной мутации нуклеотида. Для удобства в данном документе ITR, расположенный в 5'-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3'-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».[0082] As used herein, the term “symmetrical ITRs” refers to a pair of ITRs in a single cccDNA genome or cccDNA vector that are wild-type or mutated (e.g., modified relative to wild-type) dependoviral ITR sequences and are reverse complementary throughout. length In one non-limiting example, both ITRs are wild-type ITR sequences from AAB2. In another example, none of the ITRs are the sequence of the wild-type AAB2 ITR (i.e., they are modified ITRs, also called mutant ITRs) and may differ in sequence from the wild-type ITR due to addition, deletion, substitution, truncation, or point mutation nucleotide. For convenience, herein the ITR located in the 5' direction (to the left) relative to the expression cassette in the cDNA vector is referred to as the "5' ITR" or "left ITR", and the ITR located in the 3' direction (to the right) relative to expression cassette in the cccDNA vector is called the “3'-ITR” or “right ITR”.

[0083] В данном документе термин «по существу симметричные модифицированные ITR» или «пара по существу симметричных mod-ITR» относится к паре модифицированных ITR в одном геноме зкДНК или зкДНК-векторе, которые оба имеют обратно комплементарные последовательности по всей их длине. Например, модифицированный ITR может считаться по существу симметричным, даже если он имеет некоторые нуклеотидные последовательности, отличающиеся от обратно комплементарной последовательности, при условии, что указанные изменения не влияют на свойства и общую форму. В качестве одного неограничивающего примера представлена последовательность, которая имеет по меньшей мере 85%, 90%, 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной с помощью BLAST при настойках по умолчанию), а также имеет симметричную трехмерную пространственную организацию в отношении ее когнатного модифицированного ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. Иными словами, пара по существу симметричных модифицированных ITR имеет одинаково организованные в трехмерном пространстве петли А, С-С' и В-В'. Согласно некоторым вариантам реализации ITR из пары mod-ITR могут иметь разные обратно комплементарные нуклеотидные последовательности, но все же иметь одинаковую симметричную трехмерную пространственную организацию, т.е. оба ITR содержат мутации, которые приводят к одинаковой общей трехмерной форме. Например, один ITR (например, 5'-ITR) в паре mod-ITR может происходить из одного серотипа, а другой ITR (например, 3'-ITR) может происходить из другого серотипа, однако оба могут иметь одинаковую соответствующую мутацию (например, если 5'-ITR имеет делецию в области С, то когнатный модифицированный 3'-ITR из другого серотипа имеет делецию в соответствующем положении в области С') так, что пара модифицированных ITR имеет одинаковую симметричную трехмерную пространственную организацию. Согласно таким вариантам реализации каждый ITR в паре модифицированных ITR может происходить из разных серотипов (например, ААВ1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12), таких как комбинация ААВ2 и ААВ6, при этом модификация в одном ITR отображается в соответствующем положении в когнатном ITR из другого серотипа. Согласно одному варианту реализации пара по существу симметричных модифицированных ITR относится к паре модифицированных ITR (mod-ITR) при условии, что различие в нуклеотидных последовательностях между указанными ITR не влияет на свойства или общую форму, и они имеют по существу одинаковую форму в трехмерном пространстве. В качестве неограничивающего примера представлен mod-ITR, который имеет по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с каноническим mod-ITR, как определено с помощью стандартных способов, хорошо известных в данной области техники, таких как BLAST (Basic Local Alignment Search Tool) или BLASTN, при настройках по умолчанию, а также имеет симметричную трехмерную пространственную организацию так, что их трехмерная структура имеет одинаковую форму в геометрическом пространстве. Пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR.[0083] As used herein, the term “substantially symmetric modified ITRs” or “substantially symmetric mod-ITR pair” refers to a pair of modified ITRs in a single ccDNA genome or ccDNA vector that both have reverse complementary sequences throughout their entire length. For example, a modified ITR may be considered substantially symmetrical even if it has some nucleotide sequences that differ from the reverse complementary sequence, provided that these changes do not affect the properties and overall shape. As one non-limiting example, a sequence is provided that has at least 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity with the canonical sequence (measured by BLAST at default settings), and also has a symmetrical three-dimensional spatial organization with respect to its cognate modified ITR such that their three-dimensional structures have the same shape in geometric space. In other words, a pair of essentially symmetrical modified ITRs have loops A, C-C' and B-B' identically organized in three-dimensional space. In some embodiments, ITRs from a mod-ITR pair may have different reverse complementary nucleotide sequences, but still have the same symmetrical three-dimensional spatial organization, i.e. both ITRs contain mutations that result in the same overall three-dimensional shape. For example, one ITR (e.g., 5'-ITR) in a mod-ITR pair may be from one serotype, and the other ITR (e.g., 3'-ITR) may be from a different serotype, but both may have the same corresponding mutation (e.g., if a 5'-ITR has a deletion in region C, then a cognate modified 3'-ITR from another serotype has a deletion at the corresponding position in region C') such that the pair of modified ITRs has the same symmetrical three-dimensional spatial organization. In such embodiments, each ITR in a modified ITR pair may be from a different serotype (e.g., AAB1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, and 12), such as a combination of AAB2 and AAB6, whereby a modification in one ITR is mapped to a corresponding position in a cognate ITR from another serotype. In one embodiment, a pair of substantially symmetrical modified ITRs is referred to as a modified ITR (mod-ITR) pair, provided that the difference in nucleotide sequences between said ITRs does not affect properties or overall shape and they have substantially the same shape in three-dimensional space. By way of non-limiting example, a mod-ITR is provided that has at least 95%, 96%, 97%, 98%, or 99% sequence identity with the canonical mod-ITR, as determined using standard methods well known in the art, such as BLAST (Basic Local Alignment Search Tool) or BLASTN, at default settings, and also have a symmetrical three-dimensional spatial organization so that their three-dimensional structure has the same shape in geometric space. A pair of essentially symmetric mod-ITRs have identical loops A, C-C' and B-B' in three-dimensional space, for example, if a modified ITR in a pair of essentially symmetric mod-ITRs has a deletion of the C-C' arm, then the cognate mod- The ITR has a corresponding deletion of the C-C' loop and also has a similar three-dimensional structure of the remaining A and B-B' loops of the same shape in geometric space with its cognate mod-ITR.

[0084] Термин «фланкирование» относится к относительному положению одной последовательности нуклеиновой кислоты по отношению к другой последовательности нуклеиновой кислоты. Обычно в последовательности ABC А и С фланкируют В. То же самое верно для расположения АхВхС. Соответственно, фланкирующая последовательность предшествует фланкируемой последовательности или следует за ней, но не обязательно должна быть смежной с фланкируемой последовательностью или непосредственно прилегать к ней. Согласно одному варианту реализации термин «фланкирование» относится к концевым повторам на каждом конце линейного дуплексного зкДНК-вектора.[0084] The term “flanking” refers to the relative position of one nucleic acid sequence with respect to another nucleic acid sequence. Typically in an ABC sequence, A and C flank B. The same is true for the arrangement of AxBxC. Accordingly, the flanking sequence precedes or follows the flanking sequence, but need not be adjacent to or immediately adjacent to the flanking sequence. In one embodiment, the term “flanking” refers to the terminal repeats at each end of a linear duplex ccDNA vector.

[0085] В данном документе термины «лечить», «осуществлять лечение» и/или «лечение» включают подавление, по существу ингибирование, замедление или обращение прогрессирования состояния, по существу облегчение клинических симптомов состояния или по существу предотвращение появления клинических симптомов состояния, получение благоприятных или целевых клинических результатов. В соответствии с некоторыми вариантами реализации состояние представляет собой гемофилию А. Лечение также относится к достижению одного или более из следующих: (а) уменьшения степени тяжести нарушения; (b) ограничения развития симптомов, характерных для нарушения (ий), которое лечат; (с) ограничения ухудшения симптомов, характерных для нарушения (ий), которое лечат; (d) ограничения рецидивирования нарушения (ий) у пациентов, ранее имевших указанное нарушение (ия); и (е) ограничения рецидивирования симптомов у пациентов, ранее не имевших симптомов указанного нарушения (ий). Благоприятные или целевые клинические результаты, такие как фармакологические и/или физиологические эффекты, включают, но не ограничиваются перечисленными, предотвращение наступления заболевания, нарушения или состояния у субъекта, который может быть предрасположен к указанному заболеванию, нарушению или состоянию, но еще не испытывает симптомов или у него еще не проявляются симптомы указанного заболевания (профилактическое лечение), облегчение симптомов указанного заболевания, нарушения или состояния, уменьшение интенсивности заболевания, нарушения или состояния, стабилизацию (т.е., отсутствие ухудшения) указанного заболевания, нарушения или состояния, предотвращение распространения указанного заболевания, нарушения или состояния, задержку или замедление прогрессирования указанного заболевания, нарушения или состояния, облегчение или временное облегчение указанного заболевания, нарушения или состояния, и комбинации перечисленных, а также увеличение продолжительности выживания по сравнению с ожидаемым выживанием без лечения.[0085] As used herein, the terms “treat,” “treat,” and/or “treatment” include suppressing, substantially inhibiting, slowing, or reversing the progression of a condition, substantially alleviating clinical symptoms of a condition, or substantially preventing the onset of clinical symptoms of a condition, obtaining favorable or targeted clinical outcomes. In accordance with some embodiments, the condition is hemophilia A. Treatment also refers to achieving one or more of the following: (a) reducing the severity of the disorder; (b) limiting the development of symptoms characteristic of the disorder(s) being treated; (c) limiting the worsening of symptoms characteristic of the disorder(s) being treated; (d) limiting the recurrence of the disorder(s) in patients who previously had the disorder(s); and (f) limiting the recurrence of symptoms in patients who have not previously had symptoms of the specified disorder(s). Beneficial or targeted clinical outcomes, such as pharmacological and/or physiological effects, include, but are not limited to, preventing the onset of a disease, disorder or condition in a subject who may be predisposed to the disease, disorder or condition but is not yet experiencing symptoms or does not yet exhibit symptoms of the specified disease (preventative treatment), relief of symptoms of the specified disease, disorder or condition, reduction in the intensity of the disease, disorder or condition, stabilization (i.e., no worsening) of the specified disease, disorder or condition, prevention of the spread of the specified diseases, disorders or conditions, delaying or slowing the progression of said diseases, disorders or conditions, alleviating or temporarily alleviating said diseases, disorders or conditions, and combinations thereof, and increasing the duration of survival compared to expected survival without treatment.

[0086] В данном документе термин «увеличение», «усиление», «повышение» (и подобные термины) обычно относится к акту увеличения, прямо или опосредовано, концентрации, уровня, функции, активности или поведения относительно природного, ожидаемого или среднего, или относительно контрольного состояния.[0086] As used herein, the term “increase,” “enhancement,” “enhancement” (and similar terms) generally refers to the act of increasing, directly or indirectly, a concentration, level, function, activity, or behavior relative to the natural, expected, or average, or relative to the control condition.

[0087] В данном документе термин «минимизировать», «уменьшать», «снижать» и/или «ингибировать» (и подобные термины) обычно относится к акту уменьшения, прямо или опосредовано, концентрации, уровня, функции, активности, поведения относительно природного, ожидаемого, среднего, или относительно контрольного состояния.[0087] As used herein, the term “minimize,” “reduce,” “reduce,” and/or “inhibit” (and similar terms) generally refers to the act of reducing, directly or indirectly, the concentration, level, function, activity, behavior relative to natural , expected, average, or relative to the control condition.

[0088] В данном документе термин «зкДНК-геном» относится к экспрессионной кассете, которая дополнительно включает по меньшей мере одну область инвертированного концевого повтора. ЗкДНК-геном может дополнительно содержать одну или более спейсерных областей. Согласно некоторым вариантам реализации зкДНК-геном включен в виде межмолекулярного дуплексного полинуклеотида ДНК в плазмиду или вирусный геном.[0088] As used herein, the term “ccDNA genome” refers to an expression cassette that further includes at least one inverted terminal repeat region. The cDNA genome may further comprise one or more spacer regions. In some embodiments, the cccDNA genome is included as an intermolecular duplex DNA polynucleotide in a plasmid or viral genome.

[0089] В данном документе термин «спейсерная область зкДНК» относится к промежуточной последовательности, которая разделяет функциональные элементы в зкДНК-векторе или геноме зкДНК. Согласно некоторым вариантам реализации спейсерные области зкДНК удерживают два функциональных элемента на целевом расстоянии для оптимальной функциональности. Согласно некоторым вариантам реализации спейсерные области зкДНК обеспечивают или увеличивают генетическую стабильность зкДНК-генома, например, в плазмиде или бакуловирусе. Согласно некоторым вариантам реализации спейсерные области зкДНК облегчают подготовленные генетические манипуляции с зкДНК-геномом, обеспечивая удобное расположение для сайтов клонирования и т.п. Например, согласно определенным аспектам олигонуклеотидный «полилинкер», содержащий несколько сайтов рестрикционных эндонуклеаз, или последовательность не из открытой рамки считывания, сконструированная так, чтобы в ней отсутствовали известные сайты связывания белка (например, транскрипционного фактора), могут быть размещены в зкДНК-геноме для разделения цис-действующих факторов, например, с помощью 6-членной, 12-членной, 18-членной, 24-членной, 48-членной, 86-членной, 176-членной вставки и т.д. между сайтом концевого разрешения и расположенным в 5-направлении транскрипционным регуляторным элементом. Аналогичным образом, спейсер может быть встроен между последовательностью сигнала полиаденилирования и 3'-сайтом концевого разрешения.[0089] As used herein, the term “cccDNA spacer region” refers to an intervening sequence that separates functional elements in a cccDNA vector or ccDNA genome. In some embodiments, cccDNA spacer regions hold two functional elements at a target distance for optimal functionality. In some embodiments, the cDNA spacer regions provide or increase the genetic stability of the cDNA genome, for example, in a plasmid or baculovirus. In some embodiments, cccDNA spacer regions facilitate prepared genetic manipulation of the cccDNA genome by providing convenient locations for cloning sites and the like. For example, in certain aspects, an oligonucleotide "polylinker" containing multiple restriction endonuclease sites, or a non-open reading frame sequence designed to lack known protein (e.g., transcription factor) binding sites, can be placed in the cccDNA genome to separating cis-acting factors, for example, using a 6-member, 12-member, 18-member, 24-member, 48-member, 86-member, 176-member insertion, etc. between the end resolution site and the 5-direction transcriptional regulatory element. Likewise, a spacer can be inserted between the polyadenylation signal sequence and the 3' end resolution site.

[0090] В данном документе термины «сайт связывания Rep», «элемент связывания Rep», «RBE» и «RBS» используются взаимозаменяемо и относятся к сайту связывания белка Rep (например, Rep 78 ААВ или Rep 68 ААВ), который после связывания белком Rep позволяет белку Rep выполнять его сайт-специфичную эндонуклеазную активность в отношении последовательности, включающей RBS. Последовательность RBS и ее обратно комплементарная последовательность вместе образуют один RBS. Последовательности RBS известны в данной области техники и включают, например, 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), представляющую собой последовательность RBS, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность RBS, включая другие известные последовательности RBS ААВ и другие известные природные или синтетические последовательности RBS. Не ограничиваясь какой-либо теорией, считается, что нуклеазный домен белка Rep связывается с дуплексной нуклеотидной последовательностью GCTC и, соответственно, происходит прямое связывание и стабильная сборка двух известных белков Rep ААВ на дуплексном олигонуклеотиде 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3' (SEQ ID NO: 60). Кроме того, растворимые агрегированные конформеры (т.е. неопределенное число взаимосвязанных белков Rep) диссоциируют и связываются с олигонуклеотидами, которые содержат сайты связывания Rep. Каждый белок Rep взаимодействует как с азотистыми основаниями, так и с фосфодиэфирным остовом на каждой цепи. Взаимодействия с азотистыми основаниями обеспечивают специфичность в отношении последовательности, в то время как взаимодействия с фосфодиэфирным остовом неспецифичны или менее специфичны в отношении последовательности и стабилизируют комплекс белка с ДНК.[0090] As used herein, the terms “Rep binding site,” “Rep binding element,” “RBE,” and “RBS” are used interchangeably and refer to the binding site of a Rep protein (e.g., Rep 78 AAB or Rep 68 AAB) that, upon binding by the Rep protein allows the Rep protein to perform its site-specific endonuclease activity on a sequence including the RBS. The RBS sequence and its reverse complementary sequence together form one RBS. RBS sequences are known in the art and include, for example, 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), which is the RBS sequence identified in AAB2. In embodiments of the present invention, any known RBS sequence can be used, including other known AAB RBS sequences and other known natural or synthetic RBS sequences. Without being limited to any theory, it is believed that the nuclease domain of the Rep protein binds to the duplex nucleotide sequence GCTC and, accordingly, direct binding and stable assembly of two known Rep proteins of AAB on the duplex oligonucleotide 5'-(GCGC)(GCTC)(GCTC) occurs. (GCTC)-3' (SEQ ID NO: 60). In addition, soluble aggregated conformers (i.e., an indefinite number of interconnected Rep proteins) dissociate and bind to oligonucleotides that contain Rep binding sites. Each Rep protein interacts with both nitrogenous bases and the phosphodiester backbone on each chain. Interactions with nitrogenous bases provide sequence specificity, while interactions with the phosphodiester backbone are nonspecific or less sequence specific and stabilize the protein-DNA complex.

[0091] В данном документе термины «сайт концевого разрешения» и «TRS» используются в данном документе взаимозаменяемо и относятся к области, в которой Rep образует тирозин-фосфодиэфирную связь с 5'-тимидином с образованием 3'-ОН, который служит субстратом для удлинения ДНК с помощью клеточной ДНК-полимеразы, например, ДНК-полимеразы дельта или ДНК-полимеразы эпсилон. В качестве альтернативы, комплекс Rep-тимидин может принимать участие в скоординированной реакции лигирования. Согласно некоторым вариантам реализации TRS включает, как минимум, неспаренный тимидин. Согласно некоторым вариантам реализации никирующую эффективность TRS по меньшей мере отчасти можно контролировать за счет расстояния между ним и RBS в пределах одной молекулы. Если акцепторный субстрат представляет собой комплементарный ITR, тогда полученный продукт представляет собой внутримолекулярный дуплекс. Последовательности TRS известны в данной области техники и включают, например, 5'-GGTTGA-3' (SEQ ID NO: 61), представляющую собой гексануклеотидную последовательность, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность TRS, включая другие известные последовательности TRS ААВ и другие известные природные или синтетические последовательности TRS, такие как AGTT (SEQ ID NO: 62), GGTTGG (SEQ ID NO: 63), AGTTGG (SEQ ID NO: 64), AGTTGA (SEQ ID NO: 65), и другие мотивы, такие как RRTTRR (SEQ ID NO: 66).[0091] As used herein, the terms "terminal resolution site" and "TRS" are used interchangeably herein and refer to the region in which Rep forms a tyrosine phosphodiester bond with a 5'-thymidine to form a 3'-OH, which serves as a substrate for DNA elongation using a cellular DNA polymerase, for example DNA polymerase delta or DNA polymerase epsilon. Alternatively, the Rep-thymidine complex may participate in a coordinated ligation reaction. In some embodiments, the TRS includes at least an unpaired thymidine. In some embodiments, the nicking efficiency of the TRS can be controlled at least in part by the distance between it and the RBS within a single molecule. If the acceptor substrate is a complementary ITR, then the resulting product is an intramolecular duplex. TRS sequences are known in the art and include, for example, 5'-GGTTGA-3' (SEQ ID NO: 61), which is a hexanucleotide sequence identified in AAB2. In embodiments of the present invention, any known TRS sequence can be used, including other known AAB TRS sequences and other known natural or synthetic TRS sequences, such as AGTT (SEQ ID NO: 62), GGTTGG (SEQ ID NO: 63), AGTTGG (SEQ ID NO: 64), AGTTGA (SEQ ID NO: 65), and other motifs such as RRTTRR (SEQ ID NO: 66).

[0092] В данном документе термин «зкДНК-плазмида» относится к плазмиде, которая содержит зкДНК-геном в виде межмолекулярного дуплекса.[0092] As used herein, the term “ccDNA plasmid” refers to a plasmid that contains the cccDNA genome as an intermolecular duplex.

[0093] В данном документе термин «зкДНК-бакмида» относится к геному инфекционного бакуловируса, содержащему зкДНК-геном в виде межмолекулярного дуплекса, который способен размножаться в Е. coli в виде плазмиды и, соответственно, может выполнять роль челночного вектора для бакуловируса.[0093] As used herein, the term “ccDNA bacmid” refers to an infectious baculovirus genome containing the cccDNA genome as an intermolecular duplex that is capable of propagation in E. coli as a plasmid and, accordingly, can serve as a shuttle vector for the baculovirus.

[0094] В данном документе термин «зкДНК-бакуловирус» относится к бакуловирусу, который содержит зкДНК-геном в виде межмолекулярного дуплекса в геноме бакуловируса.[0094] As used herein, the term “ccDNA baculovirus” refers to a baculovirus that contains the cccDNA genome as an intermolecular duplex within the baculovirus genome.

[0095] В данном документе термины «инфицированная зкДНК-бакуловирусом клетка насекомого» и «зкДНК-ВПС» используются взаимозаменяемо и относятся к клетке беспозвоночного животного-хозяина (включая, но не ограничиваясь этим, клетку насекомого (например, клетку Sf9)), инфицированной зкДНК-бакуловирусом.[0095] As used herein, the terms “ccDNA-baculovirus-infected insect cell” and “ccDNA-IPV” are used interchangeably and refer to an invertebrate host cell (including, but not limited to, an insect cell (e.g., an Sf9 cell)) infected cDNA baculovirus.

[0096] В данном документе термин «зкДНК» относится к бескапсидной линейной двухцепочечной (дц) дуплексной ДНК с замкнутыми концами для невирусного переноса генов, синтетической или другой. Подробное описание зкДНК приведено в международной заявке PCT/US 2017/020828, поданной 3 марта 2017 г., содержание которой полностью явным образом включено в данный документ посредством ссылки. Некоторые способы получения зкДНК, содержащей различные последовательности и конфигурации инвертированных концевых повторов (ITR), с использованием клеточных методов описаны в Примере 1 международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., каждая из которых полностью включена в данный документ посредством ссылки. Некоторые способы получения синтетических зкДНК-векторов, содержащих различные последовательности и конфигурации ITR, описаны, например, в международной заявке PCT/US 2019/14122, поданной 18 января 2019 г., содержание которой полностью включено в данный документ посредством ссылки.[0096] As used herein, the term “ccDNA” refers to capsid-free linear double-stranded (ds) duplex DNA with closed ends for non-viral gene transfer, synthetic or otherwise. A detailed description of cccDNA is provided in International Application PCT/US 2017/020828, filed March 3, 2017, the contents of which are expressly incorporated herein by reference in their entirety. Some methods for producing cccDNA containing various sequences and inverted terminal repeat (ITR) configurations using cellular methods are described in Example 1 of international application PCT/US 18/49996, filed September 7, 2018, and PCT/US 2018/064242, filed December 6, 2018, each of which is incorporated herein by reference in its entirety. Some methods for producing synthetic cccDNA vectors containing various ITR sequences and configurations are described, for example, in international application PCT/US 2019/14122, filed January 18, 2019, the contents of which are incorporated herein by reference in their entirety.

[0097] В данном документе термин «ДНК-вектор с замкнутыми концами» относится к бескапсидному ДНК-вектору по меньшей мере с одним ковалентно замкнутым концом, причем по меньшей мере часть вектора имеет структуру внутримолекулярного дуплекса.[0097] As used herein, the term “closed-end DNA vector” refers to a capsid-free DNA vector with at least one covalently closed end, wherein at least a portion of the vector has an intramolecular duplex structure.

[0098] В данном документе термины «зкДНК-вектор» и «зкДНК» используются взаимозаменяемо и относятся к ДНК-вектору с замкнутыми концами, содержащему по меньшей мере один концевой палиндром. Согласно некоторым вариантам реализации зкДНК содержит два ковалентно замкнутых конца.[0098] As used herein, the terms “ccDNA vector” and “ccDNA” are used interchangeably and refer to a closed-ended DNA vector containing at least one terminal palindrome. In some embodiments, the cccDNA contains two covalently closed ends.

[0099] В данном документе термин «нзДНК» или «никированная зкДНК» относится к ДНК с замкнутыми концами, содержащей одноцепочечный разрыв или пропуск размером 1-100 пар оснований в области «стебля» или спейсерной области, расположенной в 5'-направлении относительно открытой рамки считывания (например, промотора и трансгена, подлежащего экспрессии).[0099] As used herein, the term "nzDNA" or "nicked cccDNA" refers to DNA with closed ends containing a single-strand break or gap of 1-100 base pairs in the "stem" or spacer region located in the 5' direction relative to the open reading frame (eg, promoter and transgene to be expressed).

[00100] В данном документе термины «пропуск» и «одноцепочечный разрыв» используются взаимозаменяемо и относятся к прерванной части синтетического ДНК-вектора согласно настоящему изобретению, создавая участок части одноцепочечной ДНК в двухцепочечной в других местах зкДНК. Пропуск может иметь от 1 пары оснований до 100 пар оснований в длину в одной цепи дуплексной ДНК. Типичные пропуски, разработанные и созданные с применением способов, описанных в данном документе, и синтетические векторы, полученные с применением указанных способов, могут иметь, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 или 60 пар оснований в длину. Примерные пропуски в настоящем раскрытии могут иметь от 1 пары оснований до 10 пар оснований в длину, от 1 до 20 пар оснований в длину, от 1 до 30 пар оснований в длину.[00100] As used herein, the terms “gap” and “single-strand break” are used interchangeably and refer to the interrupted portion of the synthetic DNA vector of the present invention, creating a portion of a single-stranded DNA portion of an otherwise double-stranded ccDNA. The gap can range from 1 base pair to 100 base pairs in length on a single strand of duplex DNA. Typical gaps designed and created using the methods described herein, and synthetic vectors obtained using these methods, may have, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 or 60 pairs bases in length. Exemplary gaps in the present disclosure may be from 1 base pair to 10 base pairs in length, from 1 to 20 base pairs in length, from 1 to 30 base pairs in length.

[00101] Как определено в данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.[00101] As defined herein, “reporters” refer to proteins that can be used to provide detectable indicators. Reporters typically generate a measurable signal such as fluorescence, color, or luminescence. Sequences encoding reporter proteins encode proteins whose presence in a cell or organism can be easily observed. For example, fluorescent proteins cause a cell to fluoresce when excited by light of a specific wavelength, luciferases cause a cell to catalyze a reaction that generates light, and enzymes such as β-galactosidase convert a substrate into a colored product. Exemplary reporter polypeptides that may be used for experimental or diagnostic purposes include, but are not limited to, β-lactamase, β-galactosidase (LacZ), alkaline phosphatase (AP), thymidine kinase (TK), green fluorescent protein (GFP), and others fluorescent proteins, chloramphenicol acetyltransferase (CAT), luciferase and others well known in the art.

[00102] В данном документе термины «смысловой» и «антисмысловой» относятся к ориентации структурного элемента на полинуклеотиде. Смысловой и антисмысловой варианты элемента обратно комплементарны друг другу.[00102] As used herein, the terms “sense” and “antisense” refer to the orientation of a structural element on a polynucleotide. The sense and antisense variants of the element are inversely complementary to each other.

[00103] В данном документе термин «синтетический ААВ-вектор» и «получение ААВ-вектора синтетическим путем» относится к ААВ-вектору и синтетическим способам его получения в полностью бесклеточной среде.[00103] As used herein, the term “synthetic AAV vector” and “synthetic production of AAV vector” refers to the AAV vector and synthetic methods for its production in a completely cell-free environment.

[00104] В данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.[00104] As used herein, “reporters” refer to proteins that can be used to provide detectable performance. Reporters typically generate a measurable signal such as fluorescence, color, or luminescence. Sequences encoding reporter proteins encode proteins whose presence in a cell or organism can be easily observed. For example, fluorescent proteins cause a cell to fluoresce when excited by light of a specific wavelength, luciferases cause a cell to catalyze a reaction that generates light, and enzymes such as β-galactosidase convert a substrate into a colored product. Exemplary reporter polypeptides that may be used for experimental or diagnostic purposes include, but are not limited to, β-lactamase, β-galactosidase (LacZ), alkaline phosphatase (AP), thymidine kinase (TK), green fluorescent protein (GFP), and others fluorescent proteins, chloramphenicol acetyltransferase (CAT), luciferase and others well known in the art.

[00105] В данном документе термин «эффекторный белок» относится к полипептиду, который обеспечивает детектируемый показатель, либо, например, как репортерный полипептид, либо, более предпочтительно, как полипептид, уничтожающий клетку, например, токсин, или агент, придающий клетке чувствительность к уничтожению выбранным агентом или при его отсутствии. Эффекторные белки включают любой белок или пептид, который непосредственно нацелен на ДНК и/или РНК клетки-хозяина или повреждает их. Например, эффекторные белки могут включать, но не ограничиваются перечисленными, рестрикционную эндонуклеазу, которая нацелена на последовательность ДНК клетки-хозяина (будь то геномный или внехромосомный элемент), протеазу, которая расщепляет полипептид-мишень, необходимый для выживания клетки, ингибитор ДНК-гиразы и токсин рибонуклеазного типа. Согласно некоторым вариантам реализации экспрессия эффекторного белка, контролируемая синтетическим биологическим контуром, описанным в данном документе, может принимать участие в качестве фактора в другом синтетическом биологическом контуре, что расширяет диапазон и сложность восприимчивости системы биологического контура.[00105] As used herein, the term "effector protein" refers to a polypeptide that provides a detectable indicator, either, for example, as a reporter polypeptide, or, more preferably, as a cell killing polypeptide, such as a toxin, or an agent that sensitizes the cell to destruction by the selected agent or in its absence. Effector proteins include any protein or peptide that directly targets or damages the DNA and/or RNA of a host cell. For example, effector proteins may include, but are not limited to, a restriction endonuclease that targets a host cell DNA sequence (whether genomic or extrachromosomal element), a protease that cleaves a target polypeptide essential for cell survival, a DNA gyrase inhibitor, and ribonuclease type toxin. In some embodiments, effector protein expression controlled by a synthetic biological circuit described herein can participate as a factor in another synthetic biological circuit, thereby expanding the range and complexity of the responsiveness of the biological circuit system.

[00106] Транскрипционные регуляторы относятся к транскрипционным активаторам и репрессорам, которые либо активируют, либо репрессируют транскрипцию представляющего интерес гена, такого как FVIII. Промоторы представляют собой области нуклеиновой кислоты, которые инициируют транскрипцию конкретного гена. Транскрипционные активаторы, как правило, связываются поблизости от транскрипционных промоторов и привлекают РНК-полимеразу для непосредственной инициации транскрипции. Репрессоры связываются с транскрипционными промоторами и стерически затрудняют инициацию транскрипции РНК-полимеразой. Другие транскрипционные регуляторы могут служить либо активаторами, либо репрессорами в зависимости от места их связывания и условий в клетке и в окружающей среде. Неограничивающие примеры классов транскрипционных регуляторов включают, но не ограничиваются перечисленными, белки гомеодомена, белки с цинковыми пальцами, белки с мотивом «крылатая спираль» (белки Forkhead) и белки с лейциновой молнией.[00106] Transcriptional regulators refer to transcriptional activators and repressors that either activate or repress the transcription of a gene of interest, such as FVIII. Promoters are regions of nucleic acid that initiate transcription of a particular gene. Transcription activators typically bind in the vicinity of transcriptional promoters and recruit RNA polymerase to directly initiate transcription. Repressors bind to transcriptional promoters and sterically hinder the initiation of transcription by RNA polymerase. Other transcriptional regulators can serve as either activators or repressors depending on their site of binding and cellular and environmental conditions. Non-limiting examples of classes of transcriptional regulators include, but are not limited to, homeodomain proteins, zinc finger proteins, Forkhead proteins, and leucine zipper proteins.

[00107] В данном документе «репрессорный белок» или «индукторный белок» представляет собой белок, который связывается с элементом регуляторной последовательности и репрессирует или активирует, соответственно, транскрипцию последовательностей, функционально связанных с указанным элементом регуляторной последовательности. Предпочтительные репрессорные и индукторные белки, описанные в данном документе, чувствительны к присутствию или отсутствию по меньшей мере одного вносимого агента или фактора внешней среды. Предпочтительные белки, описанные в данном документе, являются модульными по форме и содержат, например, отделяемые ДНК-связывающие и связывающие вводимые агенты, или реагирующие на них, элементы или домены.[00107] As used herein, a “repressor protein” or “inducer protein” is a protein that binds to a regulatory sequence element and represses or activates, respectively, the transcription of sequences operably associated with said regulatory sequence element. Preferred repressor and inducer proteins described herein are sensitive to the presence or absence of at least one introduced agent or environmental factor. Preferred proteins described herein are modular in form and contain, for example, separable DNA binding and input binding agents or responsive elements or domains.

[00108] В данном документе термин «носитель» включает любые и все возможные растворители, дисперсионные среды, основы, покрытия, разбавители, антибактериальные и противогрибковые агенты, изотонические и замедляющие абсорбцию агенты, буферы, растворы-носители, суспензии, коллоиды и т.п. Применение таких сред и агентов для фармацевтически активных веществ хорошо известно в данной области техники. В композиции также могут быть включены вспомогательные активные ингредиенты. Выражение «фармацевтически приемлемый» относится к молекулярным частицам и композициям, которые не приводят к токсической, аллергической или схожей нежелательной реакции при введении хозяину.[00108] As used herein, the term “carrier” includes any and all possible solvents, dispersion media, bases, coatings, diluents, antibacterial and antifungal agents, isotonic and absorption retarding agents, buffers, carrier solutions, suspensions, colloids, and the like . The use of such media and agents for pharmaceutically active substances is well known in the art. Additional active ingredients may also be included in the compositions. The expression "pharmaceutically acceptable" refers to molecular particles and compositions that do not cause a toxic, allergic or similar adverse reaction when administered to a host.

[00109] В данном документе термин «домен, реагирующий на вводимый агент» представляет собой домен транскрипционного фактора, который связывает или иначе отвечает на условие или вводимый агент таким способом, который придает восприимчивость присоединенного к нему ДНК-связывающего слитого домена к наличию указанного условия или вводимого агента. Согласно одному варианту реализации наличие указанного условия или вводимого агента приводит к конформационному изменению в отвечающем на вводимый агент домене, или в белке, с которым он слит, которое модифицирует модулирующую транскрипцию активность транскрипционного фактора.[00109] As used herein, the term “administrative agent-responsive domain” is a transcription factor domain that binds or otherwise responds to a condition or administered agent in a manner that renders the DNA-binding fusion domain attached thereto responsive to the presence of the condition or administered agent. In one embodiment, the presence of the condition or administration agent results in a conformational change in the input response domain, or in the protein to which it is fused, that modifies the transcription modulating activity of the transcription factor.

[00110] Термин «in vivo» относится к анализам или способам, которые реализуют на организме или в организме, таком как многоклеточное животное. Согласно некоторым аспектам, описанным в данном документе, считается, что способ или применение реализуют «in vivo», если используется одноклеточный организм, такой как бактерия. Термин «ех vivo» относится к способам и вариантам применения, которые выполняют с использованием живой клетки с интактной мембраной, находящейся вне организма многоклеточного животного или растения, например, эксплантатов, культивируемых клеток, включая первичные клетки и линии клеток, трансформированных линий клеток, а также экстрагированных тканей или клеток, включая клетки крови, помимо прочего. Термин «in vitro» относится к анализам и способам, которые не требуют присутствия клетки с интактной мембраной, например, клеточных экстрактов, и могут относиться к введению программируемого синтетического биологического контура в бесклеточной системе, такой как среда, не содержащая клеток или клеточных систем, таких как клеточные экстракты.[00110] The term "in vivo" refers to assays or methods that are performed on or in an organism, such as a multicellular animal. In some aspects described herein, the method or use is considered to be performed "in vivo" if a single cell organism, such as a bacterium, is used. The term "ex vivo" refers to methods and applications that are performed using a living cell with an intact membrane located outside the body of a multicellular animal or plant, for example, explants, cultured cells, including primary cells and cell lines, transformed cell lines, and extracted tissues or cells, including but not limited to blood cells. The term "in vitro" refers to assays and methods that do not require the presence of a cell with an intact membrane, such as cell extracts, and may refer to the introduction of a programmable synthetic biological circuit in a cell-free system, such as an environment containing no cells or cellular systems such as cell extracts.

[00111] В данном документе термин «промотор» относится к любой последовательности нуклеиновой кислоты, которая регулирует экспрессию другой последовательности нуклеиновой кислоты за счет управления транскрипцией указанной последовательности нуклеиновой кислоты, которая может представлять собой гетерологичный целевой ген, кодирующий белок или РНК. Промоторы могут быть конститутивными, индуцируемыми, репрессируемыми, тканеспецифическими или могут представлять собой любую комбинацию перечисленных. Промотор представляет собой контрольную область последовательности нуклеиновой кислоты, в которой осуществляется контроль инициации и скорости транскрипции остальной части последовательности нуклеиновой кислоты. Промотор также может содержать генетические элементы, с которыми могут связываться регуляторные белки и молекулы, такие как РНК-полимераза и другие транскрипционные факторы. Согласно некоторым вариантам реализации аспектов, описанных в данном документе, промотор может управлять экспрессией транскрипционного фактора, который регулирует экспрессию самого промотора. В последовательности промотора может быть расположен сайт инициации транскрипции, а также связывающие белки домены, отвечающие за связывание РНК-полимеразы. Эукариотические промоторы часто, однако не всегда, будут содержать «ТАТА»-боксы и «САТ»-боксы. Различные промоторы, включая индуцируемые промоторы, могут применяться для управления экспрессией трансгенов в зкДНК-векторах, раскрытых в данном документе. Последовательность промотора может быть ограничена на ее 3'-конце сайтом инициации транскрипции и простирается в восходящем направлении (в 5'-направлении), включая минимальное количество оснований или элементов, необходимых для инициации транскрипции на уровнях, детектируемых выше фона.[00111] As used herein, the term “promoter” refers to any nucleic acid sequence that regulates the expression of another nucleic acid sequence by driving the transcription of said nucleic acid sequence, which may be a heterologous target gene encoding a protein or RNA. Promoters may be constitutive, inducible, repressible, tissue specific, or any combination of these. A promoter is a control region of a nucleic acid sequence that controls the initiation and rate of transcription of the rest of the nucleic acid sequence. A promoter may also contain genetic elements to which regulatory proteins and molecules, such as RNA polymerase and other transcription factors, can bind. In some embodiments of the aspects described herein, a promoter may drive the expression of a transcription factor that regulates the expression of the promoter itself. The promoter sequence may contain a transcription initiation site, as well as protein-binding domains responsible for binding RNA polymerase. Eukaryotic promoters will often, but not always, contain "TATA" boxes and "CAT" boxes. Various promoters, including inducible promoters, can be used to drive the expression of transgenes in the cDNA vectors disclosed herein. The promoter sequence may be limited at its 3' end by the transcription initiation site and extends upstream (in the 5' direction), including the minimum number of bases or elements necessary to initiate transcription at levels detected above background.

[00112] В данном документе термин «энхансер» относится к цис-действующей регуляторной последовательности (например, 50-1500 пар оснований), которая связывает один или более белков (например, белки-активаторы или транскрипционный фактор) для повышения транскрипционной активации последовательности нуклеиновой кислоты. Энхансеры могут быть расположены на расстоянии до 1000000 пар оснований выше сайта начала гена или ниже сайта начала гена, который они регулируют. Энхансер может быть расположен в пределах интронной области или в экзонной области неродственного гена.[00112] As used herein, the term “enhancer” refers to a cis-acting regulatory sequence (e.g., 50-1500 base pairs) that binds one or more proteins (e.g., activator proteins or transcription factor) to enhance transcriptional activation of a nucleic acid sequence . Enhancers can be located up to 1,000,000 base pairs upstream of the start site of the gene or downstream of the start site of the gene they regulate. The enhancer may be located within an intronic region or within an exonic region of an unrelated gene.

[00113] Можно сказать, что промотор управляет экспрессией или управляет транскрипцией последовательности нуклеиновой кислоты, которую он регулирует.Выражения «функционально связанный», «функционально расположенный», «с функциональной связью», «под контролем» и «под транскрипционным контролем» указывают, что промотор находится в корректном функциональном положении и/или ориентации относительно последовательности нуклеиновой кислоты, которую он регулирует, для контроля инициации транскрипции и/или экспрессии указанной последовательности. В данном документе «инвертированный промотор» относится к промотору, в котором последовательность нуклеиновой кислоты располагается в обратной ориентации так, что цепь, которая была смысловой, становится некодирующей цепью, и наоборот. Последовательности инвертированных промоторов могут применяться в различных вариантах реализации для регуляции состояния переключателя. Кроме того, согласно различным вариантам реализации промотор может применяться в сочетании с энхансером.[00113] A promoter can be said to drive the expression or direct transcription of the nucleic acid sequence that it regulates. The expressions "operably linked", "operably located", "operably linked", "under control" and "under transcriptional control" indicate that the promoter is in the correct functional position and/or orientation relative to the nucleic acid sequence it regulates to control the initiation of transcription and/or expression of said sequence. As used herein, “inverted promoter” refers to a promoter in which the nucleic acid sequence is arranged in reverse orientation such that a strand that was a sense strand becomes a non-coding strand and vice versa. Inverted promoter sequences can be used in various embodiments to regulate the state of the switch. Additionally, in various embodiments, a promoter may be used in combination with an enhancer.

[00114] Промотор может представлять собой промотор, который в естественных условиях ассоциирован с геном или последовательностью, а также может быть получен путем выделения некодирующих 5'-последовательностей, расположенных в 5'-направлении относительно кодирующего сегмента и/или экзона определенного гена или последовательности. Такой промотор может быть назван «эндогенным». Аналогичным образом, согласно некоторым вариантам реализации, энхансер может быть представлен энхансером, который в естественных условиях ассоциирован с последовательностью нуклеиновой кислоты и расположен либо в 3', либо в 5'-направлении от указанной последовательности.[00114] A promoter can be a promoter that is naturally associated with a gene or sequence, and can also be obtained by isolating 5' non-coding sequences located in the 5' direction relative to the coding segment and/or exon of a particular gene or sequence. Such a promoter may be called "endogenous". Likewise, in some embodiments, the enhancer may be an enhancer that is naturally associated with a nucleic acid sequence and is located either 3' or 5' of the sequence.

[00115] Согласно некоторым вариантам реализации кодирующий сегмент нуклеиновой кислоты расположен под контролем «рекомбинантного промотора» или «гетерологичного промотора», оба указанных термина относятся к промотору, который обычно не ассоциирован с кодируемой последовательностью нуклеиновой кислоты, с которой промотор функционально связан, в ее естественной среде. Рекомбинантный или гетерологичный энхансер относится к энхансеру, обычно не ассоциированному с конкретной последовательностью нуклеиновой кислоты в ее естественной среде. Такие промоторы или энхансеры могут включать промоторы или энхансеры других генов; промоторы или энхансеры, выделенные из любой другой прокариотической, вирусной или эукариотической клетки; и синтетические промоторы или энхансеры, которые не являются «природными», т.е. содержат различные элементы разных транскрипционных регуляторных областей и/или изменяющие экспрессию мутации, введенные с применением способов генетического конструирования, известных в данной области техники. Наряду с получением последовательностей нуклеиновых кислот промоторов и энхансеров синтетическим путем, последовательности промоторов могут быть получены с использованием рекомбинантного клонирования и/или технологии амплификации нуклеиновых кислот, включая ПЦР, применительно к синтетическим биологическим контурам и модулям, раскрытым в данном документе (см., например, патент США №4683202, патент США №5928906, каждый из которых включен в данный документ посредством ссылки). Кроме того, также предусмотрена возможность применения контрольных последовательностей, которые управляют транскрипцией и/или экспрессией последовательностей в неядерных органеллах, таких как митохондрии, хлоропласты и т.п.[00115] In some embodiments, the encoding nucleic acid segment is located under the control of a “recombinant promoter” or a “heterologous promoter,” both of which terms refer to a promoter that is not typically associated with the encoded nucleic acid sequence to which the promoter is operably linked in its natural environment. A recombinant or heterologous enhancer refers to an enhancer not normally associated with a particular nucleic acid sequence in its natural environment. Such promoters or enhancers may include promoters or enhancers of other genes; promoters or enhancers isolated from any other prokaryotic, viral or eukaryotic cell; and synthetic promoters or enhancers that are not “natural”, e.g. contain various elements of different transcriptional regulatory regions and/or expression-altering mutations introduced using genetic engineering methods known in the art. In addition to obtaining promoter and enhancer nucleic acid sequences synthetically, promoter sequences can be obtained using recombinant cloning and/or nucleic acid amplification technology, including PCR, in relation to the synthetic biological circuits and modules disclosed herein (see, for example, US Patent No. 4,683,202, US Pat. No. 5,928,906, each of which is incorporated herein by reference). In addition, it is also possible to use control sequences that direct transcription and/or expression of sequences in non-nuclear organelles such as mitochondria, chloroplasts, and the like.

[00116] Как описано в данном документе, «индуцируемый промотор» представляет собой промотор, который характеризуется инициацией или усилением транскрипционной активности в присутствии, под влиянием или при контакте с индуктором или индуцирующим агентом. «Индуктор» или «индуцирующий агент», как определено в данном документе, может быть эндогенным или обычно является экзогенным соединением или белком, которые вводят таким образом, чтобы обеспечить их активность по индукции транскрипционной активности индуцируемого промотора. Согласно некоторым вариантам реализации индуктор или индуцирующий агент, т.е. химическое вещество, соединение или белок, сам может быть получен в результате транскрипции или экспрессии последовательности нуклеиновой кислоты (т.е. индуктор может представлять собой индукторный белок, экспрессируемый другим компонентом или модулем), который сам может находиться под контролем индуцируемого промотора. Согласно некоторым вариантам реализации индуцируемый промотор индуцируется в отсутствие определенных агентов, таких как репрессор. Примеры индуцируемых промоторов включают, но не ограничиваются перечисленными, чувствительные к тетрациклину, металлотионину, экдизону промоторы, промоторы вирусов млекопитающих (например, поздний промотор аденовируса; и промотор длинного концевого повтора вируса опухоли молочной железы мышей (MMTV-LTR)) и другие чувствительные к стероидам промоторы, чувствительные к рапамицину промоторы и т.п.[00116] As described herein, an “inducible promoter” is a promoter that is characterized by initiation or enhancement of transcriptional activity in the presence of, under the influence of, or upon contact with an inducer or inducing agent. An "inducer" or "inducing agent" as defined herein can be endogenous or typically is an exogenous compound or protein that is administered so as to have the activity of inducing the transcriptional activity of an inducible promoter. In some embodiments, the inducer or inducing agent, i.e. chemical, compound or protein may itself be produced by transcription or expression of a nucleic acid sequence (ie, the inducer may be an inducer protein expressed by another component or module), which may itself be under the control of an inducible promoter. In some embodiments, the inducible promoter is induced in the absence of certain agents, such as a repressor. Examples of inducible promoters include, but are not limited to, tetracycline-sensitive, metallothioneine, ecdysone-sensitive promoters, mammalian viral promoters (eg, adenovirus late promoter; and murine mammary tumor virus long terminal repeat (MMTV-LTR) promoter), and other steroid-responsive promoters. promoters, rapamycin-sensitive promoters, etc.

[00117] Термины «регуляторные последовательности ДНК», «контрольные элементы» и «регуляторные элементы», используемые в данном документе взаимозаменяемо, относятся к транскрипционным и трансляционным контрольным последовательностям, таким как промоторы, энхансеры, сигналы полиаденилирования, терминаторы, сигналы разрушения белка и т.п., которые обеспечивают и/или регулируют транскрипцию некодирующей последовательности (например, нацеливающей на ДНК РНК) или кодирующей последовательности (например, сайт-направленного модифицирующего полипептида или полипептида Cas9/Csn1) и/или регулируют трансляцию кодируемого полипептида.[00117] The terms "DNA regulatory sequences", "control elements" and "regulatory elements", used interchangeably herein, refer to transcriptional and translational control sequences such as promoters, enhancers, polyadenylation signals, terminators, protein degradation signals, etc. .p. that mediate and/or regulate transcription of a non-coding sequence (eg, DNA-targeting RNA) or coding sequence (eg, site-directed modifying polypeptide or Cas9/Csn1 polypeptide) and/or regulate translation of the encoded polypeptide.

[00118] «Функционально связанный» относится к размещению в непосредственной близости, при котором описываемые так компоненты находятся во взаимосвязи, позволяющей им функционировать предусмотренным для них образом. Например, промотор функционально связан с кодирующей последовательностью, если указанный промотор влияет на ее транскрипцию или экспрессию. «Экспрессионная кассета» включает гетер о логичную последовательность ДНК, которая функционально связана с промотором или другой регуляторной последовательностью, достаточными для управления транскрипцией трансгена в зкДНК-векторе. Подходящие промоторы включают, например, тканеспецифические промоторы. Промоторы также могут происходить из ААВ.[00118] "Operably coupled" refers to placement in close proximity such that the components so described are in a relationship that allows them to function in the manner intended for them. For example, a promoter is operably linked to a coding sequence if said promoter affects its transcription or expression. An "expression cassette" includes a heterogeneous DNA sequence that is operably linked to a promoter or other regulatory sequence sufficient to control transcription of the transgene in the cDNA vector. Suitable promoters include, for example, tissue-specific promoters. Promoters can also be derived from AAV.

[00119] В данном документе термин «субъект» относится к человеку или животному, которому предоставляют лечение, включая профилактическое лечение, с применением зкДНК-вектора в соответствии с настоящим изобретением. Обычно животное представляет собой позвоночное животное, такое как, но не ограничиваясь перечисленными, примат, грызун, домашнее животное или промысловое животное. Приматы включают, но не ограничиваются перечисленными, шимпанзе, яванских макак, коат и макак, например, макак-резусов. Грызуны включают мышей, крыс, сурков, хорьков, кроликов и хомяков. Домашние и промысловые животные включают, но не ограничиваются перечисленными, коров, лошадей, свиней, оленей, бизона, буйвола, виды кошачьих, например, домашнюю кошку, виды собачьих, например, собаку, лису, волка, виды птиц, например, курицу, эму, страуса, и рыб, например, форель, сома и лосося. В определенных вариантах реализации аспектов, описанных в данном документе, субъект представляет собой млекопитающее, например, примата или человека. Субъект может быть мужского или женского пола. Кроме того, субъект может быть младенцем или ребенком. Согласно некоторым вариантам реализации субъект может представлять собой новорожденного или нерожденного субъекта, например, субъекта in utero. Предпочтительно субъект представляет собой млекопитающее. Млекопитающее может представлять собой человека, не являющегося человеком примата, мышь, крысу, собаку, кошку, лошадь или корову, однако указанные примеры не являются ограничивающими. Млекопитающие, отличные от человека, могут быть предпочтительно использованы в качестве субъектов в моделях заболеваний и нарушений на животных. Кроме того, способы и композиции, описанные в данном документе, могут быть использованы для одомашненных животных и/или домашних животных. Человек-субъект может быть любого возраста, пола, расы или этнической группы, например, может быть европеоидом (белым), азиатом, африканцем, черным, афроамериканцем, афроевропейцем, испаноамериканцем, представителем ближневосточного этноса и т.д. Согласно некоторым вариантам реализации субъект может представлять собой пациента или другого субъекта в клинических условиях. Согласно некоторым вариантам реализации субъект уже проходит курс лечения. Согласно некоторым вариантам реализации субъект представляет собой эмбрион, плод, новорожденного, младенца, ребенка, подростка или взрослую особь. Согласно некоторым вариантам реализации субъект представляет собой плод человека, новорожденного человека, младенца-человека, ребенка-человека, подростка-человека или взрослого человека. Согласно некоторым вариантам реализации субъект представляет собой эмбрион животного или эмбрион, не принадлежащий человеку, или эмбрион примата, не являющегося человеком. Согласно некоторым вариантам реализации субъект представляет собой эмбрион человека.[00119] As used herein, the term “subject” refers to a human or animal receiving treatment, including prophylactic treatment, using a cccDNA vector in accordance with the present invention. Typically the animal is a vertebrate such as, but not limited to, a primate, rodent, pet or game animal. Primates include, but are not limited to, chimpanzees, cynomolgus macaques, coatats, and macaques such as rhesus monkeys. Rodents include mice, rats, marmots, ferrets, rabbits and hamsters. Domestic and game animals include, but are not limited to, cows, horses, pigs, deer, bison, buffalo, felid species such as the domestic cat, canid species such as the dog, fox, wolf, bird species such as chicken, emu , ostrich, and fish such as trout, catfish and salmon. In certain embodiments of the aspects described herein, the subject is a mammal, such as a primate or a human. The subject may be male or female. Additionally, the subject may be an infant or child. In some embodiments, the subject may be a newborn or unborn subject, such as an in utero subject. Preferably the subject is a mammal. The mammal may be a human, non-human primate, mouse, rat, dog, cat, horse or cow, but these examples are not limiting. Non-human mammals may be advantageously used as subjects in animal models of diseases and disorders. In addition, the methods and compositions described herein can be used for domesticated animals and/or pets. The human subject may be of any age, gender, race or ethnicity, such as Caucasian (White), Asian, African, Black, African American, Afro-European, Hispanic, Middle Eastern, etc. In some embodiments, the subject may be a patient or other subject in a clinical setting. In some embodiments, the subject is already undergoing treatment. In some embodiments, the subject is an embryo, fetus, newborn, infant, child, adolescent, or adult. In some embodiments, the subject is a human fetus, a newborn human, a human infant, a human child, a human adolescent, or an adult. In some embodiments, the subject is an animal embryo or a non-human embryo or a non-human primate embryo. In some embodiments, the subject is a human embryo.

[00120] В данном документе термин «клетка-хозяин» включает любой тип клеток, которые являются восприимчивыми к трансформации, трансфекции, трансдукции и т.п. с использованием конструкции нуклеиновой кислоты или зкДНК-вектора для экспрессии согласно настоящему изобретению. В качестве неограничивающих примеров, клетка-хозяин может представлять собой выделенную первичную клетку, плюрипотентные стволовые клетки, CD34+ клетки, индуцированные плюрипотентные стволовые клетки или любую из ряда иммортализованных клеточных линий (например, клетки HepG2). В качестве альтернативы, клетка-хозяин может представлять собой клетку in situ или in vivo в ткани, органе или организме.[00120] As used herein, the term “host cell” includes any type of cell that is susceptible to transformation, transfection, transduction, or the like. using a nucleic acid construct or cDNA expression vector according to the present invention. By way of non-limiting examples, the host cell may be an isolated primary cell, pluripotent stem cells, CD34 + cells, induced pluripotent stem cells, or any of a number of immortalized cell lines (eg, HepG2 cells). Alternatively, the host cell may be an in situ or in vivo cell in a tissue, organ or organism.

[00121] Термин «экзогенный» относится к веществу, присутствующему в клетке, отличной от его природного источника. В данном документе термин «экзогенный» может относиться к нуклеиновой кислоте (например, нуклеиновой кислоте, кодирующей полипептид) или к полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обычно не обнаруживаются, и введение нуклеиновой кислоты или полипептида в такую клетку или организм является желательным. В качестве альтернативы, «экзогенный» может относиться к нуклеиновой кислоте или полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обнаруживаются в относительно низких количествах, и увеличение количества нуклеиновой кислоты или полипептида в клетке или организме является желательным, например, для получения эктопической экспрессии или уровней. В отличие от этого термин «эндогенный» относится к веществу, которое является нативным для биологической системы или клетки.[00121] The term "exogenous" refers to a substance present in a cell other than its natural source. As used herein, the term “exogenous” may refer to a nucleic acid (e.g., a nucleic acid encoding a polypeptide) or polypeptide that has been introduced through a process involving human activity into a biological system, such as a cell or organism, in which it is not normally present. are detected and introduction of the nucleic acid or polypeptide into such a cell or organism is desired. Alternatively, "exogenous" may refer to a nucleic acid or polypeptide that has been introduced through a process involving human activity into a biological system, such as a cell or organism, in which it is found in relatively low quantities, and an increase in the amount of the nucleic acid or polypeptide in a cell or organism is desired, for example, to obtain ectopic expression or levels. In contrast, the term "endogenous" refers to a substance that is native to a biological system or cell.

[00122] Термин «идентичность последовательности» относится к сродству между двумя нуклеотидными последовательностями. Для целей настоящего раскрытия степень идентичности последовательностей между двумя дезоксирибонуклеотидными последовательностями определяется с использованием алгоритма Нидлмана-Вунша (Needleman and Wunsch, 1970, выше), реализованного в программе Needle пакета EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et at, 2000, выше), предпочтительно, версии 3.0.0 или более поздней. Используемые необязательные параметры представляют собой штраф за открытие пропуска 10, штраф за продление пропуска 0,5 и матрицу замены EDNAFULL (версия EMBOSS NCBI NUC4.4). Выходной показатель Needle, называемый «наибольшей длиной идентичного фрагмента» (полученный с применением опции «-nobrief») используют в качестве процента идентичности и вычисляют следующим образом: (Идентичные дезоксирибонуклеотиды×100)/(Длина выравнивания - Общее число пропусков в выравнивании). Длина выравнивания составляет предпочтительно по меньшей мере 10 нуклеотидов, предпочтительно по меньшей мере 25 нуклеотидов, более предпочтительно по меньшей мере 50 нуклеотидов и наиболее предпочтительно по меньшей мере 100 нуклеотидов.[00122] The term "sequence identity" refers to the affinity between two nucleotide sequences. For the purposes of this disclosure, the degree of sequence identity between two deoxyribonucleotide sequences is determined using the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, supra), implemented in the Needle program of the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et at, 2000 , above), preferably version 3.0.0 or later. The optional parameters used are a pass opening penalty of 10, a pass extension penalty of 0.5, and a substitution matrix of EDNAFULL (EMBOSS NCBI version NUC4.4). The Needle output called "longest identical fragment length" (obtained using the -nobrief option) is used as the percent identity and is calculated as follows: (Identical deoxyribonucleotides x 100)/(Alignment length - Total number of gaps in alignment). The length of the alignment is preferably at least 10 nucleotides, preferably at least 25 nucleotides, more preferably at least 50 nucleotides, and most preferably at least 100 nucleotides.

[00123] В данном документе термин «гомология» или «гомологичный» определяется как процент нуклеотидных остатков, которые идентичны нуклеотидным остаткам в соответствующей последовательности на хромосоме-мишени после выравнивания последовательностей и введения пробелов, при необходимости, для достижения максимального процента идентичности последовательностей. Выравнивание с целью определения процента гомологии нуклеотидной последовательности может быть достигнуто различными путями, известными в данной области техники, например, с применением общедоступного компьютерного программного обеспечения, такого как программное обеспечение BLAST, BLAST-2, ALIGN, ClustalW2 или Megalign (DNASTAR). Специалисты в данной области техники могут определить соответствующие параметры для выравнивания последовательностей, включая любые алгоритмы, необходимые для достижения максимального выравнивания по всей длине сравниваемых последовательностей. Согласно некоторым вариантам реализации последовательность нуклеиновой кислоты (например, последовательность ДНК), например, гомологичное плечо, считается «гомологичной», когда последовательность по меньшей мере на 70%, по меньшей мере на 75%, по меньшей мере на 80%, по меньшей мере на 85%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98%, по меньшей мере на 99% или более идентична соответствующей нативной или неотредактированной последовательности нуклеиновой кислоты (например, геномной последовательности) клетки-хозяина.[00123] As used herein, the term “homology” or “homologous” is defined as the percentage of nucleotide residues that are identical to nucleotide residues in the corresponding sequence on the target chromosome after sequence alignment and the introduction of gaps, if necessary, to achieve the maximum percentage of sequence identity. Alignment to determine percent homology of a nucleotide sequence can be achieved in various ways known in the art, for example, using publicly available computer software such as BLAST, BLAST-2, ALIGN, ClustalW2 or Megalign (DNASTAR) software. Those skilled in the art can determine appropriate parameters for sequence alignment, including any algorithms necessary to achieve maximum alignment over the entire length of the sequences being compared. In some embodiments, a nucleic acid sequence (e.g., a DNA sequence), such as a homologous arm, is considered “homologous” when the sequence is at least 70%, at least 75%, at least 80%, at least by 85%, by at least 90%, by at least 91%, by at least 92%, by at least 93%, by at least 94%, by at least 95%, by at least 96%, at least 97%, at least 98%, at least 99% or more identical to the corresponding native or unedited nucleic acid sequence (eg, genomic sequence) of the host cell.

[00124] В данном документе термин «гетерологичный» означает нуклеотидную или полипептидную последовательность, которая не обнаружена в нативной нуклеиновой кислоте или белке, соответственно. Гетерологичная последовательность нуклеиновой кислоты может быть связана с природной последовательностью нуклеиновой кислоты (или ее вариантом) (например, путем генетического конструирования) с получением химерной нуклеотидной последовательности, кодирующей химерный полипептид. Гетерологичная последовательность нуклеиновой кислоты может быть соединена с вариантом полипептида (например, путем генетического конструирования) с получением нуклеотидной последовательности, кодирующей слитый вариант полипептида.[00124] As used herein, the term “heterologous” means a nucleotide or polypeptide sequence that is not found in the native nucleic acid or protein, respectively. A heterologous nucleic acid sequence can be linked to a naturally occurring nucleic acid sequence (or variant thereof) (eg, by genetic engineering) to produce a chimeric nucleotide sequence encoding a chimeric polypeptide. A heterologous nucleic acid sequence can be joined to a polypeptide variant (eg, by genetic engineering) to produce a nucleotide sequence encoding a polypeptide fusion variant.

[00125] «Вектор» или «экспрессионный вектор» представляет собой репликон, такой как плазмида, бакмида, фаг, вирус, вирион или космида, к которому может быть присоединен другой сегмент ДНК, т.е. «вставка», чтобы вызвать репликацию присоединенного сегмента в клетке. Вектор может представлять собой конструкцию нуклеиновой кислоты, разработанную для доставки в клетку-хозяина или для переноса между разными клетками-хозяевами. В данном документе вектор может быть вирусным или невирусным по происхождению и/или в конечной форме, однако для цели настоящего раскрытия «вектор» обычно относится к зкДНК-вектору в соответствии с использованием этого термина в данном документе. Термин «вектор» включает любой генетический элемент, который способен к репликации, когда он ассоциирован с надлежащими контрольными элементами, и который может переносить генные последовательности в клетки. Согласно некоторым вариантам реализации вектор может представлять собой экспрессионный вектор или рекомбинантный вектор.[00125] A "vector" or "expression vector" is a replicon, such as a plasmid, bacmid, phage, virus, virion or cosmid, to which another DNA segment can be attached, i.e. "insertion" to cause the attached segment to replicate in the cell. A vector may be a nucleic acid construct designed for delivery into a host cell or for transfer between different host cells. As used herein, a vector may be viral or non-viral in origin and/or final form, however, for the purpose of this disclosure, “vector” generally refers to a cccDNA vector as that term is used herein. The term "vector" includes any genetic element that is capable of replication when associated with appropriate control elements and that can transfer gene sequences into cells. In some embodiments, the vector may be an expression vector or a recombinant vector.

[00126] В данном документе термин «экспрессионный вектор» относится к вектору, который управляет экспрессией РНК или полипептида с последовательностей, связанных с транскрипционными регуляторными последовательностями на векторе. Экспрессируемые последовательности часто, но не обязательно, будут гетер о логичными по отношению к клетке. Экспрессионный вектор может содержать дополнительные элементы, например, экспрессионный вектор может иметь две системы репликации, что позволяет поддерживать его в двух организмах, например, в клетках человека для экспрессии и в прокариотическом хозяине для клонирования и амплификации. Термин «экспрессия» относится к клеточным процессам, участвующим в продуцировании РНК и белков и, в соответствующих случаях, в секретировании белков, включая, где это применимо, но не ограничиваясь перечисленными, например, транскрипцию, процессинг транскрипта, трансляцию и укладку, модификацию и процессинг белка. «Продукты экспрессии» включают РНК, транскрибированную с гена, и полипептиды, полученные путем трансляции мРНК, транскрибированной с гена. Термин «ген» означает последовательность нуклеиновой кислоты, которая транскрибируется (ДНК) в РНК in vitro или in vivo, когда она функционально связана с соответствующими регуляторными последовательностями. Ген может включать, но не обязательно, области, предшествующие кодирующей области и следующие за ней, например, 5'-нетранслируемые (5'-UTR) или «лидерные» последовательности и 3'-UTR или «трейлерные» последовательности, а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами).[00126] As used herein, the term “expression vector” refers to a vector that directs the expression of RNA or polypeptide from sequences linked to transcriptional control sequences on the vector. The sequences expressed will often, but not necessarily, be heterogeneous with respect to the cell. The expression vector may contain additional elements, for example, the expression vector may have two replication systems, allowing it to be maintained in two organisms, for example, human cells for expression and a prokaryotic host for cloning and amplification. The term "expression" refers to cellular processes involved in the production of RNA and proteins and, where appropriate, the secretion of proteins, including, where applicable, but not limited to, for example, transcription, transcript processing, translation and folding, modification and processing squirrel. "Expression products" include RNA transcribed from a gene and polypeptides produced by translation of mRNA transcribed from the gene. The term "gene" means a nucleic acid sequence that is transcribed (DNA) into RNA in vitro or in vivo when operably linked to appropriate regulatory sequences. The gene may optionally include regions preceding and following the coding region, for example, 5'-untranslated (5'-UTR) or "leader" sequences and 3'-UTR or "trailer" sequences, as well as intermediate sequences (introns) between individual coding segments (exons).

[00127] Под «рекомбинантным вектором» подразумевается вектор, который включает гетерологичную последовательность нуклеиновой кислоты или «трансген», который способен к экспрессии in vivo. Следует понимать, что векторы, описанные в данном документе, в некоторых вариантах реализации, можно комбинировать с другими подходящими композициями и видами терапии. Согласно некоторым вариантам реализации вектор является эписомальным. Применение подходящего эписомального вектора обеспечивает средство поддержания представляющего интерес нуклеотида у субъекта в многокопийной внехромосомной ДНК, что устраняет потенциальные эффекты интеграции в хромосому.[00127] By “recombinant vector” is meant a vector that includes a heterologous nucleic acid sequence or “transgene” that is capable of expression in vivo. It should be understood that the vectors described herein, in some embodiments, can be combined with other suitable compositions and therapies. In some embodiments, the vector is episomal. The use of a suitable episomal vector provides a means of maintaining the nucleotide of interest in a subject in multicopy extrachromosomal DNA, thereby eliminating the potential effects of chromosomal integration.

[00128] В данном документе выражение «генетическое заболевание» относится к заболеванию, частично или полностью, прямо или опосредованно, вызванному одной или более аномалиями в геноме, в частности, к состоянию, присутствующему с момента рождения. Аномалия может представлять собой мутацию, вставку или делецию. Аномалия может влиять на кодирующую последовательность гена или его регуляторную последовательность. Генетическое заболевание может представлять собой, но не ограничивается перечисленными, мышечную дистрофию Дюшенна (МДД), гемофилию, муковисцидоз, хорею Хантингтона, семейную гиперхолестеринемию (дефект рецептора ЛПНП), гепатобластому, болезнь Вильсона, врожденную печеночную порфирию, наследственные нарушения метаболизма печени, синдром Леша-Нихана, серповидноклеточную анемию, талассемию, пигментную ксеродерму, анемию Фанкони, пигментный ретинит, атаксию-телеангиэктазию, синдром Блума, ретинобластому и болезнь Тея-Сакса.[00128] As used herein, the expression “genetic disease” refers to a disease, in part or in whole, directly or indirectly, caused by one or more abnormalities in the genome, in particular, a condition present from birth. The abnormality may be a mutation, insertion, or deletion. The abnormality may affect the coding sequence of a gene or its regulatory sequence. The genetic disorder may include, but is not limited to, Duchenne muscular dystrophy (DMD), hemophilia, cystic fibrosis, Huntington's chorea, familial hypercholesterolemia (LDL receptor defect), hepatoblastoma, Wilson's disease, congenital hepatic porphyria, inherited liver metabolic disorders, Lesch syndrome. Nihana, sickle cell anemia, thalassemia, xeroderma pigmentosum, Fanconi anemia, retinitis pigmentosa, ataxia telangiectasia, Bloom's syndrome, retinoblastoma and Tay-Sachs disease.

[00129] В данном документе термин «ингибирующий полинуклеотид» относится к молекуле ДНК или РНК, которая уменьшает или предотвращает экспрессию (транскрипцию или трансляцию) второго (целевого) полинуклеотида. Ингибирующие полинуклеотиды включают антисмысловые полинуклеотиды, рибозимы и внешние направляющие последовательности. Термин «ингибирующий полинуклеотид» дополнительно включает молекулы ДНК и РНК, например, РНКи, которые кодируют существующие ингибирующие молекулы, такие как молекулы ДНК, которые кодируют рибозимы.[00129] As used herein, the term “inhibitory polynucleotide” refers to a DNA or RNA molecule that reduces or prevents the expression (transcription or translation) of a second (target) polynucleotide. Inhibitory polynucleotides include antisense polynucleotides, ribozymes and external guide sequences. The term "inhibitory polynucleotide" further includes DNA and RNA molecules, such as RNAi, that encode existing inhibitory molecules, such as DNA molecules that encode ribozymes.

[00130] В данном документе «подавление гена» или «подавленный ген» в отношении активности молекулы РНКи, например, киРНК или миРНК, относится к снижению в клетке уровня мРНК гена-мишени.[00130] As used herein, “gene silencing” or “silenced gene”, with respect to the activity of an RNAi molecule, such as siRNA or siRNA, refers to a decrease in the level of mRNA of a target gene in a cell.

[00131] В данном документе термин «РНКи» относится к любому типу интерферирующей РНК, включая, но не ограничиваясь перечисленными, киРНК, кшРНКи, эндогенную микроРНК и искусственную микроРНК. Например, он включает последовательности, ранее идентифицированные как киРНК, независимо от механизма последующего процессинга РНК (т.е., несмотря на то, что киРНК, как полагают, имеют специфичный способ процессинга in vivo, приводящий к расщеплению мРНК, такие последовательности могут быть включены в векторы между фланкирующими последовательностями, описанными в данном документе). Термин «РНКи» может включать как молекулы РНКи, подавляющие ген, так и эффекторные молекулы РНКи, которые активируют экспрессию гена.[00131] As used herein, the term “RNAi” refers to any type of interfering RNA, including, but not limited to, siRNA, shRNAi, endogenous miRNA, and artificial miRNA. For example, it includes sequences previously identified as siRNAs, regardless of the mechanism of subsequent RNA processing (i.e., although siRNAs are believed to have a specific mode of processing in vivo resulting in mRNA cleavage, such sequences may be included into vectors between the flanking sequences described herein). The term "RNAi" can include both RNAi molecules that silence a gene and effector RNAi molecules that activate gene expression.

[00132] В данном документе термин «содержащий» или «содержит» используется в отношении композиций, способов и их соответствующего компонента (компонентов), существенных для указанного способа или композиции, но допускающих включение не указанных элементов, будь то существенных или нет.[00132] As used herein, the term “comprising” or “comprises” is used to refer to compositions, methods and their respective component(s) that are essential to the specified method or composition, but allow the inclusion of unspecified elements, whether essential or not.

[00133] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие элементов, которые не влияют существенным образом на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации. Использование термина «содержащий» указывает на включение, а не на ограничение.[00133] As used herein, the term “consisting essentially of” refers to elements required for a particular implementation. The term allows for elements that do not materially affect the core and novel or functional characteristic(s) of the specified embodiment. The use of the term “comprising” indicates inclusion rather than limitation.

[00134] Термин «состоящий из» относится к композициям, способам и их соответствующим компонентам, описанным в данном документе, которые не включают никаких элементов, не перечисленных в указанном описании варианта реализации.[00134] The term “consisting of” refers to the compositions, methods and their respective components described herein, which do not include any elements not listed in the specified embodiment description.

[00135] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие дополнительных элементов, которые не оказывают существенного влияния на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации настоящего изобретения.[00135] As used herein, the term “consisting essentially of” refers to elements required for a particular implementation. The term allows for the presence of additional elements that do not significantly affect the basic and novel or functional characteristic(s) of the specified embodiment of the present invention.

[00136] В настоящем описании и прилагаемой формуле изобретения термины в единственном числе (соотв. «а», «an» и «the» в исходном тексте на английском языке) включают их эквиваленты во множественном числе, если иное явным образом не следует из контекста. Соответственно, например, ссылка на «способ» включает один или более способов и/или этапов типа, описанного в данном документе, и/или таких, которые будут понятны специалистам в данной области техники после прочтения настоящего раскрытия, и т.п. Аналогичным образом, предусмотрено, что термин «или» включает «и», если из контекста явным образом не следует иное. Несмотря на то, что при практической реализации или тестировании настоящего раскрытия могут применяться способы и материалы, сходные или эквивалентные тем, которые описаны в данном документе, ниже описаны подходящие способы и материалы. В данном документе «например» (сокращение «e.g.» в исходном тексте на английском языке, произошедшее от латинского выражения «exempli gratia») указывает на неограничивающий пример. Соответственно, «например» синонимично термину «к примеру».[00136] In the present specification and the accompanying claims, the singular terms (respectively "a", "an" and "the" in the original English text) include their plural equivalents unless the context clearly indicates otherwise . Accordingly, for example, reference to “method” includes one or more methods and/or steps of the type described herein and/or those that will be apparent to those skilled in the art upon reading the present disclosure, and the like. Likewise, the term “or” is provided to include “and” unless the context clearly indicates otherwise. Although methods and materials similar or equivalent to those described herein may be used in the practice or testing of the present disclosure, suitable methods and materials are described below. As used herein, “for example” (the abbreviation “e.g.” in the English source text, derived from the Latin expression “exempli gratia”) indicates a non-limiting example. Accordingly, “for example” is synonymous with the term “for example”.

[00137] Группы альтернативных элементов или вариантов реализации настоящего изобретения, раскрытых в данном документе, не должны рассматриваться как ограничения. На каждый член группы можно ссылаться и заявлять его индивидуально или в любой комбинации с другими членами группы или другими элементами, представленными в данном документе. Один или более членов группы могут быть включены или исключены из группы по соображениям удобства и/или патентоспособности. При любом таком включении или исключении в данном документе считается, что описание изобретения содержит группу, измененную таким образом, чтобы она удовлетворяла условию письменного описания всех групп Маркуша, используемых в прилагаемой формуле изобретения.[00137] The groups of alternative elements or embodiments of the present invention disclosed herein are not to be construed as limitations. Each group member may be referred to and stated individually or in any combination with other group members or other elements presented herein. One or more members of the group may be included or excluded from the group for reasons of convenience and/or patentability. Upon any such inclusion or deletion herein, the specification is deemed to contain the group modified so as to satisfy the condition of a written description of all Markush groups used in the appended claims.

[00138] Согласно некоторым вариантам реализации любого из аспектов раскрытие, описанное в данном документе, не касается способа клонирования людей, способов модификации генетической идентичности зародышевой линии человека, вариантов применения эмбрионов человека в промышленных или коммерческих целях, или способов модификации генетической идентичности животных, которые могут причинить им страдания без какой-либо существенной медицинской пользы для человека или животного, а также животных, полученных с помощью таких способов.[00138] In some embodiments of any aspect, the disclosure described herein does not address a method for cloning humans, methods for modifying the genetic identity of a human germline, applications for industrial or commercial uses of human embryos, or methods for modifying the genetic identity of animals that may cause them suffering without any significant medical benefit to the person or animal, as well as animals obtained through such methods.

[00139] Определения других терминов приведены в данном документе в описании различных аспектов настоящего изобретения.[00139] Definitions of other terms are provided herein in the description of various aspects of the present invention.

[00140] Все патенты и другие публикации; включая литературные ссылки, выданные патенты, опубликованные заявки на патент и заявки на патент, находящиеся на рассмотрении одновременно с настоящей заявкой; упомянутые в настоящем описании, явным образом включены в данный документ посредством ссылки с целью описания и раскрытия, например, методологий, описанных в таких публикациях, которые могут быть использованы в связи с технологией, описанной в данном документе. Эти публикации представлены исключительно по причине их раскрытия до даты подачи настоящей заявки. Ничто в этом отношении не должно истолковываться как признание того, что авторы изобретения не обладают правами на более раннее изобретение по отношению к такому раскрытию в силу предшествующего изобретения или по любой другой причине. Все утверждения, касающиеся дат, или представления относительно содержания этих документов основаны на информации, доступной заявителям, и не являются допущением каким-либо образом признания правильности дат или содержания этих документов.[00140] All patents and other publications; including literary references, issued patents, published patent applications, and patent applications pending contemporaneously with this application; mentioned herein are expressly incorporated herein by reference for the purpose of describing and disclosing, for example, methodologies described in such publications that may be used in connection with the technology described herein. These publications are presented solely by reason of their disclosure prior to the filing date of this application. Nothing in this regard should be construed as an admission that the inventors have no rights in an earlier invention with respect to such disclosure by reason of prior invention or for any other reason. All statements regarding dates or representations regarding the contents of these documents are based on information available to the applicants and do not constitute an admission in any way as to the correctness of the dates or contents of these documents.

[00141] Описание вариантов реализации настоящего раскрытия не должно рассматриваться как исчерпывающее или ограничивающее настоящее изобретение точной раскрытой формой. Несмотря на то, что в данном документе в иллюстративных целях описаны конкретные варианты реализации и примеры раскрытия, возможны различные эквивалентные модификации в пределах объема раскрытия, как будет понятно специалистам в соответствующей области техники. Например, хотя этапы или функции способа представлены в указанном порядке, согласно альтернативным вариантам реализации функции могут выполняться в другом порядке, или функции могут выполняться по существу одновременно. Принципиальные положения настоящего раскрытия, предоставленные в данном документе, могут быть применены к другим процедурам или способам в зависимости от ситуации. Различные варианты реализации, описанные в данном документе, могут быть объединены для обеспечения дополнительных вариантов реализации. Аспекты настоящего раскрытия могут быть модифицированы, при необходимости, для применения композиций, функций и концепций вышеупомянутых ссылок и приложения для обеспечения дополнительных вариантов реализации настоящего раскрытия. Кроме того, из соображений биологической функциональной эквивалентности могут быть сделаны некоторые изменения в структуре белка, не влияющие на биологическое или химическое действие в качественном или количественном отношении. Эти и другие изменения могут быть выполнены в раскрытии в свете подробного описания. Все такие модификации предусмотрены, как включенные в объем прилагаемой формулы изобретения.[00141] The description of embodiments of the present disclosure is not to be construed as exhaustive or limiting of the present invention to the precise form disclosed. Although specific embodiments and examples of the disclosure have been described herein for illustrative purposes, various equivalent modifications are possible within the scope of the disclosure, as will be appreciated by those skilled in the relevant art. For example, although the steps or functions of a method are presented in the specified order, in alternative embodiments the functions may be performed in a different order, or the functions may be performed substantially simultaneously. The principles of this disclosure provided herein may be applied to other procedures or methods as appropriate. Various implementations described herein may be combined to provide additional implementations. Aspects of the present disclosure may be modified, as necessary, to apply the compositions, functions and concepts of the above references and applications to provide additional embodiments of the present disclosure. In addition, for reasons of biological functional equivalence, some changes in protein structure may be made without affecting the biological or chemical action in a qualitative or quantitative sense. These and other changes may be made to the disclosure in light of the detailed description. All such modifications are intended to be included within the scope of the appended claims.

[00142] Конкретные элементы любого из вышеприведенных вариантов реализации могут быть объединены или заменены элементами других вариантов реализации. Кроме того, хотя преимущества, ассоциированные с некоторыми вариантами реализации настоящего раскрытия, были описаны в контексте этих вариантов реализации, другие варианты реализации также могут демонстрировать такие преимущества, и не все варианты реализации должны обязательно демонстрировать такие преимущества, чтобы попадать в объем раскрытия.[00142] Specific elements of any of the above embodiments may be combined or replaced with elements of other embodiments. In addition, although the benefits associated with some embodiments of the present disclosure have been described in the context of those embodiments, other embodiments may also exhibit such benefits, and not all embodiments must necessarily demonstrate such benefits to fall within the scope of the disclosure.

[00143] Описанная в данном документе технология дополнительно иллюстрируется следующими примерами, которые никоим образом не следует истолковывать как дополнительные ограничения. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения.[00143] The technology described herein is further illustrated by the following examples, which should in no way be construed as further limitations. It should be understood that the present invention is not limited to the specific methodology, protocols and reagents, etc. described herein and is therefore subject to variations. The terminology used herein is intended solely to describe specific embodiments and is not intended to limit the scope of the present invention, which is defined solely by the claims.

II. Экспрессия белка FVIII с зкДНК-вектораII. Expression of FVIII protein from cccDNA vector

[00144] Технология, описанная в данном документе, в целом направлена на экспрессию и/или продукцию белка FVIII в клетке с невирусного ДНК-вектора, например, зкДНК-вектора, описанного в данном документе. ЗкДНК-векторы для экспрессии белка FVIII описаны в данном документе в разделе, озаглавленном «зкДНК-векторы в целом». В частности, зкДНК-векторы для экспрессии белка FVIII содержат пару ITR (например, симметричных или асимметричных, как описано в данном документе), а между парой ITR нуклеиновую кислоту, кодирующую белок FVIII, как описано в данном документе, функционально связанную с промотором или регуляторной последовательностью. Отличительным преимуществом зкДНК-векторов для экспрессии белка FVIII по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже полноразмерный белок FVIII размером 6,8 тыс. п.о. может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы, описанные в данном документе, можно применять для экспрессии терапевтического белка FVIII у субъекта, нуждающегося в этом, например, субъекта, страдающего гемофилией А.[00144] The technology described herein is generally directed to the expression and/or production of FVIII protein in a cell from a non-viral DNA vector, such as the ccDNA vector described herein. CccDNA vectors for expression of the FVIII protein are described herein in the section entitled “ccDNA vectors in general.” In particular, cccDNA vectors for FVIII protein expression contain a pair of ITRs (e.g., symmetric or asymmetric, as described herein), and between the pair of ITRs, a nucleic acid encoding the FVIII protein, as described herein, operably linked to a promoter or regulatory sequence. A distinctive advantage of cccDNA vectors for FVIII protein expression compared to conventional AAV vectors and even lentiviral vectors is the absence of size restrictions for heterologous nucleic acid sequences encoding the target protein. Thus, even the full-length FVIII protein of 6.8 kb. can be expressed from a single cDNA vector. Thus, the cccDNA vectors described herein can be used to express a therapeutic FVIII protein in a subject in need thereof, for example, a subject suffering from hemophilia A.

[00145] Как будет понятно, технологии зкДНК-векторов, описанные в данном документе, могут быть адаптированы к любому уровню сложности или могут применяться модульно, причем экспрессия различных компонентов белка FVIII может контролироваться независимо. Например, конкретно предусмотрено, что технологии зкДНК-векторов, разработанные в данном документе, могут быть простыми, как применение одного зкДНК-вектора для экспрессии одной гетерологичной генной последовательности (например, белка FVIII), или могут быть сложными, как применение нескольких зкДНК-векторов, когда каждый вектор экспрессирует несколько белков FVIII или ассоциированных кофакторов, или вспомогательных белков, каждый из которых независимо контролируется разными промоторами. Варианты реализации ниже конкретно предусмотрены в данном документе и могут быть адаптированы специалистом в данной области техники при необходимости.[00145] As will be appreciated, the cccDNA vector technologies described herein can be adapted to any level of complexity or can be applied in a modular manner where the expression of different FVIII protein components can be controlled independently. For example, it is specifically contemplated that the cccDNA vector technologies developed herein may be as simple as using a single cccDNA vector to express a single heterologous gene sequence (e.g., FVIII protein), or may be as complex as using multiple cccDNA vectors , where each vector expresses multiple FVIII proteins or associated cofactors or accessory proteins, each independently controlled by different promoters. The embodiments below are specifically provided for herein and may be adapted by one skilled in the art as necessary.

[00146] Согласно одному варианту реализации один зкДНК-вектор можно применять для экспрессии одного компонента белка FVIII. В качестве альтернативы, один зкДНК-вектор можно применять для экспрессии нескольких компонентов (например, по меньшей мере 2) белка FVIII под контролем одного промотора (например, сильного промотора), необязательно с использованием последовательности (ей) IRES, чтобы обеспечить надлежащую экспрессию каждого из компонентов, например, кофакторов или вспомогательных белков.[00146] In one embodiment, a single cDNA vector can be used to express one FVIII protein component. Alternatively, a single cccDNA vector can be used to express multiple components (e.g., at least 2) of the FVIII protein under the control of a single promoter (e.g., a strong promoter), optionally using IRES sequence(s) to ensure proper expression of each components, such as cofactors or accessory proteins.

[00147] В данном документе также предусмотрен, в другом варианте реализации, один зкДНК-вектор, содержащий по меньшей мере две вставки (например, экспрессирующие тяжелую цепь или легкую цепь), причем экспрессия каждой вставки находится под контролем ее собственного промотора. Промоторы могут включать несколько копий одного и того же промотора, несколько разных промоторов или любую их комбинацию. Специалист в данной области техники поймет, что желательной часто является экспрессия компонентов белка FVIII на разных уровнях экспрессии, что позволяет контролировать стехиометрию отдельных экспрессируемых компонентов для обеспечения эффективного укладывания и комбинирования белка FVIII в клетке.[00147] Also provided herein, in another embodiment, is a single cDNA vector containing at least two inserts (eg, expressing a heavy chain or a light chain), the expression of each insert being under the control of its own promoter. Promoters may include multiple copies of the same promoter, multiple different promoters, or any combination thereof. One skilled in the art will appreciate that it is often desirable to express FVIII protein components at different expression levels, allowing the stoichiometry of the individual expressed components to be controlled to ensure efficient folding and combination of the FVIII protein in the cell.

[00148] Специалист в данной области техники может предусмотреть дополнительные варианты технологий зкДНК-векторов или адаптировать их из методов получения белка с использованием стандартных векторов.[00148] Additional variations of cDNA vector technologies may be contemplated by one skilled in the art or adapted from protein production methods using standard vectors.

А. Нуклеиновые кислотыA. Nucleic acids

[00149] В данном документе предложена характеристика и разработка молекул нуклеиновых кислот для потенциального терапевтического применения. В соответствии с некоторыми вариантами реализации нуклеиновые кислоты для терапевтического применения кодируют белок FVIII. Согласно некоторым вариантам реализации в соответствующих случаях описана химическая модификация олигонуклеотидов с целью изменения и улучшения свойств in vivo (доставки, стабильности, времени жизни, укладки, специфичности в отношении мишени), а также их биологической функции и механизма, которые напрямую коррелируют с терапевтическим приложением.[00149] This document proposes the characterization and development of nucleic acid molecules for potential therapeutic applications. In some embodiments, the nucleic acids for therapeutic use encode the FVIII protein. In some embodiments, where appropriate, chemical modification of oligonucleotides is described to alter and improve in vivo properties (delivery, stability, lifetime, folding, target specificity) as well as their biological function and mechanism that directly correlate with therapeutic application.

[00150] Иллюстративные терапевтические нуклеиновые кислоты согласно настоящему раскрытию, которые могут быть иммуностимулирующими и требуют применения иммуносупрессоров, раскрытых в данном документе, могут включать, но не ограничиваются перечисленными, минигены, плазмиды, миникольца, короткую интерферирующую РНК (киРНК), микроРНК (миРНК), антисмысловые олигонуклеотиды (ASO), рибозимы, двухцепочечную ДНК с замкнутыми концами (например, зкДНК, CELiD, линейную ковалентно замкнутую ДНК («с минимальной цепью»), doggybone (dbDNA™), протеломерную ДНК с замкнутыми концами или гантелеобразную линейную ДНК), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК), мРНК, тРНК, рРНК и вирусные ДНК-векторы, вирусный РНК-вектор; и любую их комбинацию.[00150] Exemplary therapeutic nucleic acids according to the present disclosure that may be immunostimulatory and require the use of immunosuppressive agents disclosed herein may include, but are not limited to, minigenes, plasmids, minicircles, short interfering RNA (siRNA), microRNA (miRNA) , antisense oligonucleotides (ASO), ribozymes, closed-end double-stranded DNA (e.g., cccDNA, CELiD, linear covalently closed DNA (“minimal strand”), doggybone (dbDNA™), closed-end protelomeric DNA, or dumbbell-shaped linear DNA), Dicer dsRNA substrate, short hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA), mRNA, tRNA, rRNA and viral DNA vectors, viral RNA vector; and any combination thereof.

[00151] киРНК или миРНК, которые могут отрицательно регулировать внутриклеточные уровни конкретных белков посредством процесса, называемого РНК-интерференцией (РНКи), также предусмотрены настоящим изобретением в качестве терапевтических средств на основе нуклеиновых кислот. После введения киРНК или миРНК в цитоплазму клетки-хозяина указанные конструкции двухцепочечной РНК связываются с белком, называемым RISC. Комплекс RISC удаляет смысловую цепь киРНК или миРНК. Комплекс RISC в комбинации с комплементарной мРНК расщепляет мРНК и высвобождает разрезанные цепи. РНКи осуществляется путем индукции специфичного разрушения мРНК, что приводит к отрицательной регуляции соответствующего белка.[00151] siRNAs or miRNAs that can negatively regulate intracellular levels of specific proteins through a process called RNA interference (RNAi) are also contemplated by the present invention as nucleic acid therapeutics. Once the siRNA or miRNA is introduced into the cytoplasm of the host cell, these double-stranded RNA constructs bind to a protein called RISC. The RISC complex removes the sense strand of siRNA or siRNA. The RISC complex, in combination with complementary mRNA, cleaves the mRNA and releases the cut strands. RNAi is carried out by inducing specific destruction of mRNA, which leads to negative regulation of the corresponding protein.

[00152] Антисмысловые олигонуклеотиды (ASO) и рибозимы, которые ингибируют трансляцию мРНК в белок, могут представлять собой терапевтические средства на основе нуклеиновых кислот. В случае антисмысловых конструкций указанные одноцепочечные дезоксинуклеиновые кислоты имеют последовательность, комплементарную последовательности мРНК целевого белка, и способны связываться с мРНК посредством спаривания оснований по Уотсону-Крику. Такое связывание предотвращает трансляцию целевой мРНК и/или запускает разрушение транскрипта мРНК РНКазой Н. В результате антисмысловой олигонуклеотид имеет повышенную специфичность действия (т.е. отрицательную регуляцию специфического белка, связанного с заболеванием).[00152] Antisense oligonucleotides (ASOs) and ribozymes that inhibit translation of mRNA into protein may be nucleic acid-based therapeutics. In the case of antisense constructs, these single-stranded deoxynucleic acids have a sequence complementary to the mRNA sequence of the target protein and are capable of binding to the mRNA through Watson-Crick base pairing. This binding prevents translation of the target mRNA and/or triggers the destruction of the mRNA transcript by RNase H. As a result, the antisense oligonucleotide has increased specificity of action (ie, negative regulation of a specific protein associated with the disease).

[00153] Согласно любому из способов, предложенных в данном документе, терапевтическая нуклеиновая кислота может представлять собой терапевтическую РНК. Терапевтическая РНК может представлять собой ингибитор трансляции мРНК, агент РНК-интерференции (РНКи), каталитически активную молекулу РНК (рибозим), транспортную РНК (тРНК) или РНК, которая связывает транскрипт мРНК (ASO), белок или другой молекулярный лиганд (аптамер). Согласно любому из способов, предложенных в данном документе, агент РНКи может представлять собой двухцепочечную РНК, одноцепочечную РНК, микроРНК, короткую интерферирующую РНК, короткую шпилечную РНК или образующий триплекс олигонуклеотид.[00153] In any of the methods provided herein, the therapeutic nucleic acid may be therapeutic RNA. The therapeutic RNA may be an mRNA translation inhibitor, an RNA interference (RNAi) agent, a catalytically active RNA molecule (ribozyme), transfer RNA (tRNA), or RNA that binds an mRNA transcript (ASO), protein, or other molecular ligand (aptamer). In any of the methods provided herein, the RNAi agent may be double-stranded RNA, single-stranded RNA, microRNA, short interfering RNA, short hairpin RNA, or triplex oligonucleotide.

[00154] В соответствии с некоторыми вариантами реализации терапевтическая нуклеиновая кислота представляет собой двухцепочечную ДНК с замкнутыми концами, например, зкДНК. В соответствии с некоторыми вариантами реализации экспрессия и/или продукция терапевтического белка в клетке происходит с невирусного ДНК-вектора, например, зкДНК-вектора. Отличительным преимуществом зкДНК-векторов для экспрессии терапевтического белка по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже большой терапевтический белок может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы можно применять для экспрессии терапевтического белка у субъекта, нуждающегося в этом.[00154] In some embodiments, the therapeutic nucleic acid is double-stranded DNA with closed ends, such as cccDNA. In some embodiments, expression and/or production of the therapeutic protein in the cell occurs from a non-viral DNA vector, such as a cccDNA vector. A distinctive advantage of cccDNA vectors for therapeutic protein expression compared to conventional AAV vectors and even lentiviral vectors is the absence of size restrictions for heterologous nucleic acid sequences encoding the target protein. Thus, even a large therapeutic protein can be expressed from a single cccDNA vector. Thus, cccDNA vectors can be used to express a therapeutic protein in a subject in need thereof.

[00155] В общем случае зкДНК-вектор для экспрессии терапевтического белка, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.[00155] In general, the cccDNA vector for expression of a therapeutic protein disclosed herein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (e.g. , an expression cassette described herein), and a second AAV ITR. The ITR sequences are selected from any of: (i) at least one WT-ITR and at least one modified AAB inverted terminal repeat (mod-ITR) (eg, asymmetric modified ITRs); (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization in relation to each other (e.g., asymmetric modified ITRs), or (iii) a pair of symmetric or substantially symmetric WT-WT-ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetric or substantially symmetric modified ITRs, each mod-ITR having the same three-dimensional spatial organization.

[00156] Согласно некоторым вариантам реализации трансген, кодирующий белок FVIII, также может кодировать секреторную последовательность так, что белок FVIII направляется в аппарат Гольджи и эндоплазматический ретикулум (ЭР), где будет происходить укладка белка FVIII в правильную конформацию молекулами-шаперонами при его прохождении через ЭР и высвобождении из клетки. Примерные секреторные последовательности включают, но не ограничиваются перечисленными, VH-02 (SEQ ID NO: 88) и VK-A26 (SEQ ID NO: 89) и сигнальную последовательность IgK (SEQ ID NO: 126), а также секреторный сигнал Glue, обеспечивающий секрецию меченого белка из цитозоля (SEQ ID NO: 188), секреторную последовательность TMD-ST, которая направляет меченый белок в аппарат Гольджи (SEQ ID NO: 189).[00156] In some embodiments, the transgene encoding the FVIII protein may also encode a secretory sequence such that the FVIII protein is targeted to the Golgi apparatus and endoplasmic reticulum (ER), where the FVIII protein will be folded into the correct conformation by chaperone molecules as it passes through ER and release from the cell. Exemplary secretory sequences include, but are not limited to, VH-02 (SEQ ID NO: 88) and VK-A26 (SEQ ID NO: 89) and the IgK signal sequence (SEQ ID NO: 126), as well as the Glue secretory signal providing secretion of the tagged protein from the cytosol (SEQ ID NO: 188), the secretory sequence TMD-ST, which directs the tagged protein to the Golgi apparatus (SEQ ID NO: 189).

[00157] Регуляторные переключатели также можно использовать для точной настройки экспрессии белка FVIII так, что белок FVIII экспрессируется предусмотренным образом, включая, но не ограничиваясь этим, экспрессию белка FVIII на целевом уровне экспрессии или в целевом количестве, или, в качестве альтернативы, в присутствии или в отсутствие конкретного сигнала, включая событие клеточной передачи сигнала. Например, как описано в данном документе, экспрессия белка FVIII с зкДНК-вектора может быть включена или выключена при возникновении конкретного состояния, как описано в разделе данного документа, озаглавленном «Регуляторные переключатели».[00157] Regulatory switches can also be used to fine-tune the expression of the FVIII protein so that the FVIII protein is expressed in the intended manner, including, but not limited to, expressing the FVIII protein at a target expression level or amount, or, alternatively, in the presence of or in the absence of a specific signal, including a cellular signaling event. For example, as described herein, expression of the FVIII protein from a cccDNA vector can be turned on or off when a particular condition occurs, as described in the section herein entitled “Regulatory Switches.”

[00158] Например, и только в целях иллюстрации, белки FVIII можно применять для выключения нежелательной реакции, такой как слишком высокий уровень продукции белка FVIII. Ген FVIII может содержать сигнальный пептидный маркер для доставки белка FVIII в целевую клетку. Однако в любой ситуации может быть желательно регулировать экспрессию белка FVIII. ЗкДНК-векторы легко приспосабливаются к использованию регуляторных переключателей.[00158] For example, and for purposes of illustration only, FVIII proteins can be used to turn off an undesirable response, such as too high a level of FVIII protein production. The FVIII gene may contain a signal peptide marker for delivery of the FVIII protein to the target cell. However, in any situation it may be desirable to regulate FVIII protein expression. CccDNA vectors are easily adaptable to the use of regulatory switches.

[00159] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих белок FVIII. Таким образом, даже полноразмерный FVIII, а также необязательно любые кофакторы или вспомогательные белки могут быть экспрессированы с одного зкДНК-вектора. Кроме того, в зависимости от необходимой стехиометрии можно экспрессировать несколько сегментов одного и того же белка FVIII и можно использовать один и тот же или разные промоторы, а также можно использовать регуляторные переключатели для точной настройки экспрессии каждой области. Например, как показано в Примерах, можно применять зкДНК-вектор, который содержит двойную промоторную систему, так, что для каждого домена белка FVIII используется разный промотор. Применение зкДНК-плазмиды для получения белка FVIII может включать уникальную комбинацию промоторов для экспрессии доменов белка FVIII, что приводит к правильным соотношениям каждого домена для образования функционального белка FVIII. Соответственно, в некоторых вариантах реализации, зкДНК-вектор можно применять для экспрессии различных областей белка FVIII по отдельности (например, под контролем другого промотора).[00159] A distinctive advantage of cccDNA vectors compared to conventional AAV vectors and even lentiviral vectors is that there is no size limitation for heterologous nucleic acid sequences encoding the FVIII protein. Thus, even full-length FVIII, and optionally any cofactors or accessory proteins, can be expressed from a single cccDNA vector. In addition, depending on the desired stoichiometry, multiple segments of the same FVIII protein can be expressed and the same or different promoters can be used, and regulatory switches can be used to fine-tune the expression of each region. For example, as shown in the Examples, a cccDNA vector can be used that contains a dual promoter system such that a different promoter is used for each domain of the FVIII protein. The use of a cccDNA plasmid to produce FVIII protein can include a unique combination of promoters for the expression of FVIII protein domains, resulting in the correct ratios of each domain to produce a functional FVIII protein. Accordingly, in some embodiments, the cDNA vector can be used to express different regions of the FVIII protein separately (eg, under the control of a different promoter).

[00160] Согласно другому варианту реализации белок FVIII, экспрессируемый с зкДНК-векторов, дополнительно содержит дополнительную функциональную возможность, такую как флуоресценция, ферментативная активность, сигнал секреции или активатор иммунных клеток.[00160] In another embodiment, the FVIII protein expressed from the cccDNA vectors further comprises additional functionality, such as fluorescence, enzymatic activity, a secretion signal, or an immune cell activator.

[00161] Согласно некоторым вариантам реализации зкДНК, кодирующая белок FVIII, может дополнительно содержать линкерный домен, например. В данном документе «линкерный домен» относится к олиго- или полипептидной области от примерно 2 до 100 аминокислот в длину, которая связывает любые домены/области белка FVIII, описанного в данном документе. Согласно некоторым вариантам реализации линкеры могут включать или могут состоять из гибких остатков, таких как глицин и серии, так, что смежные белковые домены могут свободно перемещаться относительно друг друга. Более длинные линкеры могут использоваться, когда желательно гарантировать, что два смежных домена не будут стерически мешать друг другу. Линкеры могут быть расщепляемыми или нерасщепляемыми. Примеры расщепляемых линкеров включают линкеры 2А (например, Т2А), 2А-подобные линкеры или их функциональные эквиваленты и их комбинации. Линкер может представлять собой линкерную область Т2А, происходящую из вируса Thosea asigna.[00161] In some embodiments, the cccDNA encoding the FVIII protein may further comprise a linker domain, for example. As used herein, “linker domain” refers to an oligo- or polypeptide region from about 2 to 100 amino acids in length that links any domains/regions of the FVIII protein described herein. In some embodiments, linkers may include or be composed of flexible residues, such as glycine and serine, such that adjacent protein domains can move freely relative to each other. Longer linkers can be used when it is desirable to ensure that two adjacent domains do not sterically interfere with each other. Linkers can be cleavable or non-cleavable. Examples of cleavable linkers include 2A linkers (eg, T2A), 2A-like linkers or functional equivalents thereof, and combinations thereof. The linker may be a T2A linker region derived from Thosea asigna virus.

[00162] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, FVIII и т.д., и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.[00162] One skilled in the art can take a known and/or publicly available protein sequence, such as FVIII, etc., and reverse engineer a cDNA sequence to encode such a protein. The cDNA can then be codon optimized to match the intended host cell and inserted into a cDNA vector as described herein.

В. зкДНК-векторы, экспрессирующие белок FVIIIB. cccDNA vectors expressing FVIII protein

[00163] ЗкДНК-вектор для экспрессии белка FVIII, имеющий одну или более последовательностей, кодирующих целевой FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих белок FVIII.[00163] A cDNA FVIII protein expression vector having one or more sequences encoding a target FVIII may contain regulatory sequences such as promoters, secretion signals, poly(A) regions, and enhancers. At least the cDNA vector contains one or more heterologous sequences encoding the FVIII protein.

[00164] Для достижения высокоэффективной и точной сборки белка FVIII в некоторых вариантах реализации конкретно предусмотрено, что белок FVIII содержит лидерную последовательность для эндоплазматического ретикулума (ЭР) для направления его в ЭР, где происходит укладка белка. Например, последовательность, которая направляет экспрессированный белок (белки) в ЭР для укладки.[00164] To achieve highly efficient and accurate assembly of the FVIII protein, some embodiments specifically provide that the FVIII protein contains an endoplasmic reticulum (ER) leader sequence to direct it to the ER where protein folding occurs. For example, a sequence that directs the expressed protein(s) to the ER for folding.

[00165] Согласно некоторым вариантам реализации сигнал клеточной или внеклеточной локализации (например, секреторный сигнал, сигнал ядерной локализации, сигнал митохондриальной локализации и т.д.) содержится в зкДНК-векторе, чтобы направлять секрецию или целевую субклеточную локализацию FVIII так, что белок FVIII может связываться с внутриклеточной мишенью (мишенями) (например, внутри тела) или внеклеточной мишенью (мишенями).[00165] In some embodiments, a cellular or extracellular localization signal (e.g., a secretory signal, a nuclear localization signal, a mitochondrial localization signal, etc.) is contained in a cccDNA vector to direct secretion or targeted subcellular localization of FVIII such that the FVIII protein may bind to intracellular target(s) (eg, within the body) or extracellular target(s).

[00166] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, обеспечивает сборку и экспрессию любого целевого белка FVIII модульным способом. В данном документе термин «модульный» относится к элементам в зкДНК-экспрессирующей плазмиде, которые можно легко удалить из конструкции. Например, модульные элементы в зкДНК-генерирующей плазмиде, содержат уникальные пары сайтов рестрикции, фланкирующие каждый элемент в конструкции, что обеспечивает исключительное манипулирование отдельными элементами (см., например, ФИГ. 1A-1G). Таким образом, платформа зкДНК-вектора может обеспечивать экспрессию и сборку любой целевой конфигурации белка FVIII. В данном документе в различных вариантах реализации предложены плазмидные зкДНК-векторы, которые могут уменьшить и/или минимизировать количество манипуляций, необходимых для сборки целевого зкДНК-вектора, кодирующего белок FVIII.[00166] In some embodiments, the cDNA FVIII protein expression vector described herein allows for the assembly and expression of any target FVIII protein in a modular manner. As used herein, the term “modular” refers to elements in the cDNA expression plasmid that can be easily removed from the construct. For example, modular elements in a cDNA-generating plasmid contain unique pairs of restriction sites flanking each element in the construct, allowing for exclusive manipulation of individual elements (see, for example, FIGS. 1A-1G). Thus, the cccDNA vector platform can support the expression and assembly of any desired FVIII protein configuration. Provided herein in various embodiments are plasmid cccDNA vectors that can reduce and/or minimize the number of manipulations required to assemble a target ccDNA vector encoding an FVIII protein.

С. Примерные белки FVIII, экспрессируемые зкДНК-векторамиC. Exemplary FVIII proteins expressed by cccDNA vectors

[00167] В частности, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать, например, но не ограничиваясь перечисленными, белки FVIII, а также их варианты и/или активные фрагменты для применения в лечении, профилактике и/или облегчении одного или более симптомов гемофилии А. В одном аспекте гемофилия А представляет собой гемофилию А человека.[00167] In particular, the cDNA FVIII protein expression vector disclosed herein may encode, for example, but not limited to, FVIII proteins, as well as variants and/or active fragments thereof, for use in treatment, prevention and/or alleviating one or more symptoms of hemophilia A. In one aspect, hemophilia A is human hemophilia A.

(i) Терапевтические белки FVIII и их фрагменты(i) Therapeutic FVIII proteins and fragments thereof

[00168] По существу любой вариант терапевтического белка FVIII или его фрагмента (например, функциональный фрагмент) может кодироваться и экспрессироваться с зкДНК-вектора, как описано в данном документе. Специалист в данной области техники поймет, что терапевтический белок FVIII включает все варианты сплайсинга и ортологи белка FVIII. Терапевтический белок FVIII включает интактные молекулы, а также их фрагменты (например, функциональные).[00168] Essentially any variant of a therapeutic FVIII protein or fragment thereof (eg, a functional fragment) can be encoded and expressed from a cccDNA vector as described herein. One skilled in the art will understand that a therapeutic FVIII protein includes all splice variants and orthologs of the FVIII protein. The therapeutic FVIII protein includes intact molecules as well as fragments (eg, functional ones).

[00169] Фактор VIII[00169] Factor VIII

[00170] Фактор VIII представляет собой неферментный кофактор активированного фактора свертывания крови IX (FIXa), который при протеолитической активации взаимодействует с FLXa с образованием прочного нековалентного комплекса, который связывается с фактором X (FX) и активирует его.[00170] Factor VIII is a nonenzymatic cofactor of activated coagulation factor IX (FIXa) that, upon proteolytic activation, interacts with FLXa to form a strong, noncovalent complex that binds to and activates factor X (FX).

[00171] Ген или белок фактора VIII также может называться F8, фактор коагуляции VIII, прокоагулянтный компонент, антигемофильный фактор, F8C, AHF, DXS1253E, FVIII, НЕМА или F8B. Экспрессия гена фактора VIII тканеспецифична и в основном наблюдается в клетках печени. Самый высокий уровень мРНК и белков фактора VIII детектировался в синусоидных клетках печени; значительные количества фактора VIII также присутствуют в гепатоцитах и клетках Купфера (резидентные макрофаги синусоидов печени). Умеренные уровни белка фактора VIII детектируются в сыворотке и плазме. Белок фактора VIII экспрессируется на низких и умеренных уровнях в фетальном головном мозге, сетчатке, почке и семеннике.[00171] The factor VIII gene or protein may also be referred to as F8, coagulation factor VIII, procoagulant component, antihemophilic factor, F8C, AHF, DXS1253E, FVIII, HEMA, or F8B. Expression of the factor VIII gene is tissue specific and is mainly observed in liver cells. The highest levels of factor VIII mRNA and protein were detected in liver sinusoidal cells; significant amounts of factor VIII are also present in hepatocytes and Kupffer cells (resident macrophages of the liver sinusoids). Moderate levels of factor VIII protein are detected in serum and plasma. Factor VIII protein is expressed at low to moderate levels in the fetal brain, retina, kidney, and testis.

[00172] мРНК фактора VIII экспрессируется во многих тканях организма, включая костный мозг, цельную кровь, лейкоциты, лимфатические узлы, тимус, головной мозг, кору головного мозга, мозжечок, сетчатку, спинной мозг, большеберцовый нерв, сердце, артерию, гладкую мышцу, скелетную мышцу, тонкий кишечник, толстую кишку, адипоциты, почку, печень, легкое, селезенку, желудок, пищевод, мочевой пузырь, поджелудочную железу, щитовидную железу, слюнную железу, надпочечник, гипофиз, молочную железу, кожу, яичник, матку, плаценту, простату и семенник. Ген FVIII, локализованный на длинном плече Х-хромосомы, занимает область длиной приблизительно 186 тыс. п.о. и состоит из 26 экзонов (69-3106 п.о.) и интронов (от 207 п.о. до 32,4 тыс. п.о.). Общая длина кодирующей последовательности этого гена составляет 9 тыс. п.о.[00172] Factor VIII mRNA is expressed in many tissues of the body, including bone marrow, whole blood, white blood cells, lymph nodes, thymus, brain, cerebral cortex, cerebellum, retina, spinal cord, tibial nerve, heart, artery, smooth muscle, skeletal muscle, small intestine, colon, adipocytes, kidney, liver, lung, spleen, stomach, esophagus, bladder, pancreas, thyroid gland, salivary gland, adrenal gland, pituitary gland, mammary gland, skin, ovary, uterus, placenta, prostate and testis. The FVIII gene, located on the long arm of the X chromosome, occupies a region approximately 186 thousand bp long. and consists of 26 exons (69-3106 bp) and introns (from 207 bp to 32.4 thousand bp). The total length of the coding sequence of this gene is 9 thousand bp.

[00173] Зрелый полипептид фактора VIII содержит структурные домены А1-А2-В-А3-С1-С2. Три кислых субдомена, которые обозначаются a1-a3-A1(a1)-A2(a2)-B-(a3)A3-C1-C2, локализуются на границах доменов А и играют важную роль во взаимодействии между FVIII и другими белками (в частности, с тромбином). Мутации в этих субдоменах снижают уровень активации фактора VIII тромбином.[00173] The mature factor VIII polypeptide contains the structural domains A1-A2-B-A3-C1-C2. Three acidic subdomains, designated a1-a3-A1(a1)-A2(a2)-B-(a3)A3-C1-C2, are localized at the boundaries of the A domains and play an important role in the interaction between FVIII and other proteins (in particular , with thrombin). Mutations in these subdomains reduce the level of factor VIII activation by thrombin.

[00174] Белок фактора VIII (изоформа фактора коагуляции VIII) представляет собой препробелок [Homo sapiens]; номер доступа: NP_000123.1 (2351 амк.) и имеет следующую последовательность:[00174] Factor VIII protein (an isoform of coagulation factor VIII) is a [Homo sapiens] pre-protein; accession number: NP_000123.1 (2351 amk.) and has the following sequence:

[00176] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, несколько полноразмерных терапевтических белков FVIII могут быть экспрессированы с одного зкДНК-вектора.[00176] A distinctive advantage of cccDNA vectors compared to conventional AAV vectors and even lentiviral vectors is that there is no size limitation for heterologous nucleic acid sequences encoding the target protein. Thus, multiple full-length therapeutic FVIII proteins can be expressed from a single cccDNA vector.

[00177] Экспрессия терапевтического белка FVIII или его фрагмента с зкДНК-вектора может быть достигнута как в пространстве, так и во времени с использованием одного или более индуцируемых или репрессируемых промоторов, известных в данной области техники или описанных в данном документе, включая регуляторные переключатели, описанные в данном документе.[00177] Expression of a therapeutic FVIII protein or fragment thereof from a cccDNA vector can be achieved both spatially and temporally using one or more inducible or repressible promoters known in the art or described herein, including regulatory switches, described in this document.

[00178] Согласно одному варианту реализации терапевтический белок FVIII представляет собой «вариант терапевтического белка», который относится к терапевтическому белку FVIII, имеющему измененную аминокислотную последовательность, композицию или структуру по сравнению с соответствующим нативным терапевтическим белком FVIII. Согласно одному варианту реализации FVIII представляет собой функциональный вариант (например, дикий тип). Подходящей также может быть экспрессия мутантного варианта белка FVIII, такого как точечная мутация или делеционная мутация, которая приводит к гемофилии А, например, для создания модели заболевания на животных и/или для оценки лекарственных средств для лечения гемофилии А. Доставка мутантных или модифицированных белков FVIII в модельную систему на основе клеток или на животных может быть выполнена для создания модели заболевания. Такую модель на основе клеток или на животных можно использовать для исследований и/или скрининга лекарственных средств. Терапевтический белок FVIII, экспрессируемый с зкДНК-векторов, может дополнительно содержать последовательность/фрагмент, который придает дополнительную функциональность, такую как флуоресценция, ферментативная активность или сигнал секреции. Согласно одному варианту реализации вариант терапевтического белка FVIII содержит ненативную последовательность метки для идентификации (например, иммунную метку), которая позволяет отличить его от эндогенного терапевтического белка FVIII в реципиентной клетке-хозяине.[00178] In one embodiment, a therapeutic FVIII protein is a “therapeutic protein variant,” which refers to a therapeutic FVIII protein having an altered amino acid sequence, composition, or structure compared to the corresponding native therapeutic FVIII protein. In one embodiment, FVIII is a functional variant (eg, wild type). Expression of a mutant variant of the FVIII protein, such as a point mutation or deletion mutation that results in hemophilia A, may also be suitable, for example, to establish an animal model of the disease and/or to evaluate drugs for the treatment of hemophilia A. Delivery of mutant or modified FVIII proteins into a cell-based or animal model system can be performed to create a disease model. Such a cell-based or animal model can be used for research and/or drug screening. The therapeutic FVIII protein expressed from cccDNA vectors may further contain a sequence/fragment that imparts additional functionality, such as fluorescence, enzymatic activity, or a secretion signal. In one embodiment, the FVIII therapeutic protein variant comprises a non-native identification tag sequence (eg, an immune tag) that allows it to be distinguished from the endogenous FVIII therapeutic protein in the recipient host cell.

[00179] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, терапевтического белка FVIII, и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.[00179] One skilled in the art can take a known and/or publicly available protein sequence, such as a therapeutic FVIII protein, and reverse engineer a cDNA sequence to encode such a protein. The cDNA can then be codon optimized to match the intended host cell and inserted into a cDNA vector as described herein.

[00180] Согласно одному варианту реализации последовательность, кодирующая терапевтический белок FVIII, может быть получена из существующей клетки-хозяина или линии клеток, например, путем обратной транскрипции мРНК, полученной от хозяина, и амплификации последовательности с использованием ПЦР.[00180] In one embodiment, the coding sequence for a therapeutic FVIII protein can be obtained from an existing host cell or cell line, for example, by reverse transcribing mRNA obtained from the host and amplifying the sequence using PCR.

(ii) ЗкДНК-векторы, экспрессирующие терапевтический белок FVIII(ii) cccDNA vectors expressing therapeutic FVIII protein

[00181] ЗкДНК-вектор, имеющий одну или более последовательностей, кодирующих целевой терапевтический белок FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих терапевтический белок FVIII или его функциональный фрагмент.Примерные кассетные вставки для получения зкДНК-векторов, кодирующих терапевтические белки FVIII, отображены на Фигурах 1A-1G. Согласно одному варианту реализации зкДНК-вектор содержит последовательность FVIII, перечисленную в Таблице 1 в данном документе.[00181] A cccDNA vector having one or more sequences encoding a target therapeutic FVIII protein may contain regulatory sequences such as promoters, secretion signals, poly(A) regions, and enhancers. At least the cccDNA vector contains one or more heterologous sequences encoding a therapeutic FVIII protein or a functional fragment thereof. Exemplary cassette inserts for producing cccDNA vectors encoding therapeutic FVIII proteins are shown in Figures 1A-1G. In one embodiment, the cccDNA vector contains the FVIII sequence listed in Table 1 herein.

(iii) Терапевтические белки FVIII и варианты их применения для лечения гемофилии А(iii) Therapeutic FVIII proteins and their applications for the treatment of hemophilia A

[00182] ЗкДНК-векторы, описанные в данном документе, можно применять для доставки терапевтических белков FVIII для лечения гемофилии А, ассоциированной с нефизиологической экспрессией белка FVIII и/или мутациями в белках FVIII.[00182] The cccDNA vectors described herein can be used to deliver therapeutic FVIII proteins for the treatment of hemophilia A associated with nonphysiological FVIII protein expression and/or mutations in FVIII proteins.

[00183] ЗкДНК-векторы, описанные в данном документе, можно применять для экспрессии любого целевого терапевтического белка FVIII. Примерные терапевтические белки FVIII включают, но не ограничиваются им, любой белок FVIII, экспрессируемый последовательностями, педставленными в Таблице 1 в данном документе.[00183] The cDNA vectors described herein can be used to express any target therapeutic FVIII protein. Exemplary therapeutic FVIII proteins include, but are not limited to, any FVIII protein expressed by the sequences set forth in Table 1 herein.

[00184] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII является функциональным для лечения гемофилии А. Согласно некоторым вариантам реализации терапевтический белок FVIII не вызывает реакции иммунной системы.[00184] In one embodiment, the expressed therapeutic FVIII protein is functional for treating hemophilia A. In some embodiments, the therapeutic FVIII protein does not elicit an immune system response.

[00185] Согласно другому варианту реализации зкДНК-векторы, кодирующие терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), можно применять для получения химерного белка. Таким образом, в данном документе конкретно предусмотрено, что зкДНК-вектор, экспрессирующий химерный белок, можно вводить, например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников. Согласно некоторым вариантам реализации, когда зкДНК-вектор, экспрессирующий FVIII, вводят младенцу или вводят субъекту in utero, зкДНК-вектор, экспрессирующий FVIII, можно вводить в любую одну или более тканей, выбранных из: печени, надпочечников, сердца, кишечника, легкого и желудка, или в стволовую клетку-предшественника клеток печени для лечения гемофилии A in vivo или ex vivo.[00185] In another embodiment, cccDNA vectors encoding a therapeutic FVIII protein or a fragment thereof (eg, a functional fragment) can be used to produce a chimeric protein. Thus, it is specifically provided herein that a cccDNA vector expressing the chimeric protein can be introduced, for example, into any one or more tissues selected from: liver, kidney, gallbladder, prostate, adrenal gland. In some embodiments, when a cccDNA vector expressing FVIII is administered to an infant or administered to a subject in utero, the cccDNA vector expressing FVIII can be administered to any one or more tissues selected from: liver, adrenal gland, heart, intestine, lung, and stomach, or into liver progenitor stem cells for the treatment of hemophilia A in vivo or ex vivo.

[00186] Гемофилия:[00186] Hemophilia:

[00187] Гемофилия А представляет собой генетический дефицит фактора свертывания крови VIII, который вызывает повышенное кровотечение и обычно поражает мужчин. В большинстве случаев он наследуется как Х-сцепленный рецессивный признак, хотя имеются случаи, которые возникают в результате спонтанных мутаций. В отношении симптомов гемофилии А различают эпизоды внутреннего или внешнего кровотечения. Индивидуумы с более тяжелой формой гемофилии страдают более тяжелыми и более частыми кровотечениями, в то время как другие с легкой формой гемофилии, как правило, имеют более незначительные симптомы, за исключением случаев хирургического вмешательства или серьезной травмы. Больные с гемофилией умеренной степени тяжести имеют различные симптомы, которые проявляются в диапазоне от тяжелой до легкой форм.[00187] Hemophilia A is a genetic deficiency of clotting factor VIII that causes increased bleeding and usually affects males. In most cases, it is inherited as an X-linked recessive trait, although there are cases that arise as a result of spontaneous mutations. Symptoms of hemophilia A include episodes of internal or external bleeding. Individuals with more severe hemophilia experience heavier and more frequent bleeding, while others with mild hemophilia tend to have more minor symptoms except in cases of surgery or serious injury. Patients with moderate hemophilia have a variety of symptoms that range from severe to mild.

[00188] Современные способы лечения для предотвращения кровотечений у людей, страдающих гемофилией А, включают лекарственный препарат фактора VIII. Большинство индивидуумов с тяжелой формой гемофилии нуждаются в регулярном введении внутривенного рекомбинантного фактора VIII или его плазматического концентрата. Рекомбинантный фактор свертывания крови VIII является одним из наиболее сложных белков для промышленного изготовления из-за низкой эффективности транскрипции его гена, значительной внутриклеточной потери его пробелка во время посттрансляционного процессинга и нестабильности секретируемого белка. Больные с легкой формой гемофилии могут контролировать свое состояние с помощью десмопрессина, лекарственного средства, которое высвобождает из стенок кровеносных сосудов фактор VIII, хранящийся в них.[00188] Current treatments for preventing bleeding in people with hemophilia A include a factor VIII drug. Most individuals with severe hemophilia require regular intravenous administration of recombinant factor VIII or its plasma concentrate. Recombinant coagulation factor VIII is one of the most difficult proteins to manufacture industrially due to the low efficiency of its gene transcription, significant intracellular loss of its proprotein during post-translational processing, and instability of the secreted protein. Patients with mild hemophilia can control their condition with desmopressin, a drug that releases factor VIII stored in blood vessel walls.

[00189] Существует много осложнений, связанных с лечением гемофилии А. У детей можно ввести легкодоступный внутривенный порт, чтобы свести к минимуму частую травматическую внутривенную канюляцию. Однако эти порты ассоциированы с высокой частотой инфицирования и риском образования сгустков на кончике катетера, что делает его бесполезным. Вирусные инфекции могут быть распространены у больных гемофилией из-за частых переливаний крови, которые подвергают пациентов риску заражения инфекциями, передаваемыми через кровь, такими как ВИЧ, гепатит В и гепатит С.Прионные инфекции также могут передаваться при переливаниях крови. Еще одно терапевтическое осложнение гемофилии А представляет собой выработку ингибирующих антител к фактору VIII из-за частых инфузий. Они вырабатываются, когда организм распознает введенный путем инфузий фактор VIII как чужеродный, поскольку организм не продуцирует свою собственную копию. У таких индивидуумов активированный фактор VII, предшественник фактора VIII в коагуляционном каскаде, может быть введен путем инфузий для лечения кровоизлияния у индивидуумов с гемофилией и антителами к замещающему фактору VIII.[00189] There are many complications associated with the treatment of hemophilia A. In children, an easily accessible intravenous port can be inserted to minimize frequent traumatic intravenous cannulation. However, these ports are associated with a high rate of infection and the risk of clots forming at the tip of the catheter, rendering it useless. Viral infections may be common in hemophilia patients due to frequent blood transfusions, which expose patients to blood-borne infections such as HIV, hepatitis B, and hepatitis C. Prion infections can also be transmitted through blood transfusions. Another therapeutic complication of hemophilia A is the development of inhibitory antibodies to factor VIII due to frequent infusions. They are produced when the body recognizes infused factor VIII as foreign because the body does not produce its own copy. In such individuals, activated factor VII, a precursor to factor VIII in the coagulation cascade, can be administered by infusion to treat hemorrhage in individuals with hemophilia and antibodies to replacement factor VIII.

[00190] Коагуляционный каскад[00190] Coagulation cascade

[00191] Коагуляция, также известная как свертывание, представляет собой процесс, при котором кровь превращается из жидкости в гель, образуя сгусток крови. Это потенциально приводит к гемостазу, прекращению кровопотери из поврежденного сосуда с последующим восстановлением. Механизм коагуляции включает активацию, адгезию и агрегацию тромбоцитов наряду с отложением и созреванием фибрина. Нарушения коагуляции представляют собой патологические состояния, которые могут привести к кровотечению (кровоизлиянию или синяку) или обструктивному свертыванию (тромбозу).[00191] Coagulation, also known as coagulation, is the process by which blood changes from a liquid to a gel, forming a blood clot. This potentially leads to hemostasis, the cessation of blood loss from the damaged vessel, followed by recovery. The mechanism of coagulation involves platelet activation, adhesion and aggregation along with fibrin deposition and maturation. Coagulation disorders are pathological conditions that can lead to bleeding (hemorrhage or bruising) or obstructive clotting (thrombosis).

[00192] Коагуляция начинается почти мгновенно после того, как повреждение кровеносного сосуда повредило эндотелий, выстилающий кровеносный сосуд. Воздействие крови на субэндотелиальное пространство инициирует два процесса: изменения в тромбоцитах и воздействие субэндотелиального тканевого фактора на плазматический фактор VII, что в конечном итоге приводит к образованию фибрина. Тромбоциты немедленно образуют пробку в месте повреждения; это называется первичным гемостазом. Одновременно происходит вторичный гемостаз: дополнительные факторы коагуляции или факторы свертывания, помимо фактора VII (включая фактор VIII), отвечают сложным каскадом с образованием нитей фибрина, которые укрепляют тромбоцитарную пробку.[00192] Coagulation begins almost immediately after injury to a blood vessel has damaged the endothelium lining the blood vessel. The effect of blood on the subendothelial space initiates two processes: changes in platelets and the effect of subendothelial tissue factor on plasma factor VII, which ultimately leads to the formation of fibrin. Platelets immediately form a plug at the site of injury; this is called primary hemostasis. At the same time, secondary hemostasis occurs: additional coagulation factors or clotting factors beyond factor VII (including factor VIII) respond in a complex cascade to form fibrin strands that strengthen the platelet plug.

[00193] Коагуляционный каскад вторичного гемостаза имеет два исходных пути, которые приводят к образованию фибрина. Они включают путь контактной активации (также известный как внутренний путь) и путь тканевого фактора (также известный как внешний путь), которые оба приводят к одним и тем же фундаментальным реакциям, которые продуцируют фибрин. Первичный путь инициации коагуляции крови представляет собой путь тканевого фактора (внешний). Пути представляют собой ряд реакций, в которых зимоген (неактивный предшественник фермента) сериновой протеазы и ее гликопротеиновый кофактор активируются, чтобы стать активными компонентами, которые затем катализируют следующую реакцию в каскаде, что в конечном итоге приводит к образованию перекрестно-сшитого фибрина. Факторы коагуляции обычно обозначаются римскими цифрами с добавленной строчной буквой «а», указывающей на активную форму.[00193] The coagulation cascade of secondary hemostasis has two initial pathways that lead to the formation of fibrin. These include the contact activation pathway (also known as the intrinsic pathway) and the tissue factor pathway (also known as the extrinsic pathway), which both lead to the same fundamental reactions that produce fibrin. The primary pathway for initiating blood coagulation is the tissue factor (extrinsic) pathway. The pathways are a series of reactions in which the zymogen (inactive enzyme precursor) of the serine protease and its glycoprotein cofactor are activated to become the active components, which then catalyze the next reaction in the cascade, ultimately leading to the formation of cross-linked fibrin. Coagulation factors are usually designated by Roman numerals with an added lowercase "a" to indicate the active form.

[00194] Факторы коагуляции обычно представляют собой сериновые протеазы (ферменты), которые действуют путем расщепления нисходящих белков. Исключение составляют тканевой фактор, FV, FVIII, FXIII. Тканевый фактор, FV и FVIII представляют собой гликопротеины, а фактор XIII представляет собой трансглутаминазу. Факторы коагуляции циркулируют в виде неактивных зимогенов. Таким образом, коагуляционный каскад классически делится на три пути. Путь тканевого фактора и путь контактной активации оба активируют «конечный общий путь» фактора X, тромбина и фибрина.[00194] Coagulation factors are typically serine proteases (enzymes) that act by breaking down downstream proteins. The exceptions are tissue factor, FV, FVIII, FXIII. Tissue factor, FV and FVIII are glycoproteins, and factor XIII is a transglutaminase. Coagulation factors circulate as inactive zymogens. Thus, the coagulation cascade is classically divided into three pathways. The tissue factor pathway and the contact activation pathway both activate the “final common pathway” of factor X, thrombin, and fibrin.

[00195] Основная роль пути тканевого фактора (внешнего) заключается в создании «тромбинового взрыва», процесса, с помощью которого происходит быстрое высвобождение тромбина, наиболее важного компонента коагуляционного каскада с точки зрения его функций активации обратной связи. FVIIa циркулирует в большем количестве, чем любой другой активированный фактор коагуляции. Процесс включает следующие этапы:[00195] The primary role of the tissue factor (extrinsic) pathway is to create the "thrombin burst", a process by which the rapid release of thrombin, the most important component of the coagulation cascade in terms of its feedback activation functions, occurs. FVIIa circulates in greater quantities than any other activated coagulation factor. The process includes the following steps:

[00196] Этап 1: После повреждения кровеносного сосуда FVII покидает кровоток и вступает в контакт с тканевым фактором (TF), экспрессируемым на клетках, несущих тканевой фактор (стромальные фибробласты и лейкоциты), с образованием активированного комплекса (TF-FVIIa).[00196] Step 1: Following blood vessel injury, FVII leaves the bloodstream and comes into contact with tissue factor (TF) expressed on tissue factor-bearing cells (stromal fibroblasts and leukocytes) to form an activated complex (TF-FVIIa).

[00197] Этап 2: TF-FVIIa активирует FIX и FX.[00197] Step 2: TF-FVIIa activates FIX and FX.

[00198] Этап 3: Сам FVII активируется тромбином, FXIa, FXII и FXa.[00198] Step 3: FVII itself is activated by thrombin, FXIa, FXII and FXa.

[00199] Этап 4: Активация FX (с образованием FXa) TF-FVIIa почти сразу ингибируется ингибитором пути тканевого фактора (TFPI).[00199] Step 4: FX activation (to form FXa) of TF-FVIIa is almost immediately inhibited by tissue factor pathway inhibitor (TFPI).

[00200] Этап 5: FXa и его кофактор FVa образуют протромбиназный комплекс, который активирует протромбин в тромбин.[00200] Step 5: FXa and its cofactor FVa form a prothrombinase complex that activates prothrombin to thrombin.

[00201] Этап 6: Затем тромбин активирует другие компоненты коагуляционного каскада, включая FV и FVIII (который образует комплекс с FIX), а также активирует и высвобождает FVIII из комплекса с фактором фон Виллебранда (vWF).[00201] Step 6: Thrombin then activates other components of the coagulation cascade, including FV and FVIII (which forms a complex with FIX), and activates and releases FVIII from its complex with von Willebrand factor (vWF).

[00202] Этап 7: FVIIIa представляет собой кофактор FIXa, и вместе они образуют «теназный» комплекс, который активирует FX; и таким образом цикл продолжается.[00202] Step 7: FVIIIa is a cofactor of FIXa, and together they form a “tenase” complex that activates FX; and thus the cycle continues.

[00203] Путь контактной активации (внутренний) начинается с образования первичного комплекса высокомолекулярного кининогена (HMWK), прекалликреина и FXII (фактора Хагемана) на коллагене. Прекалликреин превращается в калликреин, a FXII становится FXIIa. FXIIa превращает FXI в FXIa. Фактор Х1а активирует FIX, который со своим кофактором FVIIIa образует теназный комплекс, который активирует FX в FXa. Незначительную роль, которую играет путь контактной активации в инициировании образования сгустка, можно проиллюстрировать тем фактом, что пациенты с тяжелым дефицитом FXII, HMWK и прекалликреина не имеют нарушения гемостаза. Вместо этого система контактной активации в большей степени вовлечена в воспаление и врожденный иммунитет.[00203] The contact activation pathway (intrinsic) begins with the formation of a primary complex of high molecular weight kininogen (HMWK), prekallikrein and FXII (Hageman factor) on collagen. Prekallikrein becomes kallikrein, and FXII becomes FXIIa. FXIIa turns FXI into FXIa. Factor X1a activates FIX, which with its cofactor FVIIIa forms a tenase complex that activates FX to FXa. The minor role played by the contact activation pathway in initiating clot formation can be illustrated by the fact that patients with severe deficiencies of FXII, HMWK and prekallikrein do not have impaired hemostasis. Instead, the contact activation system is more involved in inflammation and innate immunity.

[00204] Конечный общий путь, который является общим для внутреннего и внешнего путей коагуляции, включает превращение протромбина в тромбин и фибриногена в фибрин. Тромбин выполняет множество функций, помимо превращения фибриногена в фибрин, строительный блок гемостатической пробки. Кроме того, он является наиболее важным активатором тромбоцитов, и помимо этого он активирует факторы VIII и V и их ингибитор, белок С (в присутствии тромбомодулина), а также активирует фактор XIII, который образует ковалентные связи, которые перекрестно сшивают полимеры фибрина, которые образуются из активированных мономеров.[00204] The final common pathway, which is common to the intrinsic and extrinsic coagulation pathways, involves the conversion of prothrombin to thrombin and fibrinogen to fibrin. Thrombin has many functions besides converting fibrinogen to fibrin, the building block of the hemostatic plug. In addition, it is the most important platelet activator, and in addition to this it activates factors VIII and V and their inhibitor, protein C (in the presence of thrombomodulin), and also activates factor XIII, which forms covalent bonds that cross-link the fibrin polymers that are formed from activated monomers.

[00205] После активации посредством путей контактного фактора или тканевого фактора коагуляционный каскад поддерживается в протромботическом состоянии за счет продолжающейся активации FVIII и FIX с образованием теназного комплекса, пока он не будет подавлен антикоагулянтными путями. Способы включают введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к количеству введенной композиции зкДНК, которое приводит к экспрессии белка в «терапевтически эффективном количестве» для лечения заболевания или нарушения.[00205] Once activated through the contact factor or tissue factor pathways, the coagulation cascade is maintained in a prothrombotic state by continued activation of FVIII and FIX to form the tenase complex until it is suppressed by the anticoagulant pathways. The methods involve administering to a subject an effective amount of a composition comprising a cccDNA vector encoding a therapeutic FVIII protein or a fragment thereof (eg, a functional fragment) as described herein. As will be understood by a skilled practitioner, the term "effective amount" refers to the amount of the administered cccDNA composition that results in expression of the protein in a "therapeutically effective amount" for treating a disease or disorder.

[00206] Диапазоны дозировок для композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), зависят от эффективности (например, эффективности промотора) и включают количества, достаточно большие для получения целевого эффекта, например, экспрессии целевого терапевтического белка FVIII для лечения фенилкетонурии (гемофилии А). Дозировка не должна быть настолько большой, чтобы вызывать неприемлемые нежелательные побочные эффекты. Обычно дозировка будет варьироваться в зависимости от конкретных характеристик зкДНК-вектора, эффективности экспрессии, а также в зависимости от возраста, состояния и пола пациента. Дозировка может быть определена специалистом в данной области техники и, в отличие от обычных ААВ-векторов, также может быть скорректирована индивидуальным врачом в случае любого осложнения, поскольку зкДНК-векторы не содержат активирующие иммунную систему капсидные белки, которые препятствуют повторному дозированию.[00206] Dosage ranges for a composition containing a cccDNA vector encoding a therapeutic FVIII protein or a fragment (e.g., a functional fragment) thereof depend on effectiveness (e.g., promoter effectiveness) and include amounts large enough to produce the desired effect, e.g., expression target therapeutic protein FVIII for the treatment of phenylketonuria (hemophilia A). The dosage should not be so high as to cause unacceptable unwanted side effects. Typically, dosage will vary depending on the specific characteristics of the cccDNA vector, expression efficiency, and the age, condition, and gender of the patient. The dosage can be determined by one skilled in the art and, unlike conventional AAV vectors, can also be adjusted by the individual physician in case of any complication, since cccDNA vectors do not contain immune system-activating capsid proteins that prevent repeated dosing.

[00207] Введение композиций зкДНК, описанных в данном документе, можно повторять в течение ограниченного периода времени. Согласно некоторым вариантам реализации дозы вводят периодически или с помощью импульсного введения. Согласно предпочтительному варианту реализации указанные выше дозы вводят в течение нескольких месяцев. Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Также предусмотрены «бустерные» обработки с течением времени. Кроме того, уровень экспрессии можно титровать по мере роста субъекта.[00207] Administration of the cccDNA compositions described herein can be repeated over a limited period of time. In some embodiments, doses are administered intermittently or by pulsing. In a preferred embodiment, the above doses are administered over several months. The duration of treatment depends on clinical progress and the patient's response to therapy. “Booster” treatments over time are also provided. In addition, the level of expression can be titrated as the subject grows.

[00208] Терапевтический белок FVIII может быть экспрессирован у субъекта в течение по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Долговременная экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы.[00208] The therapeutic FVIII protein may be expressed in the subject for at least 1 week, at least 2 weeks, at least 1 month, at least 2 months, at least 6 months, at least 12 months/one years, at least 2 years, at least 5 years, at least 10 years, at least 15 years, at least 20 years, at least 30 years, at least 40 years, at least 50 years or more. Long-term expression can be achieved by reintroducing the cccDNA vectors described herein at predetermined or desired intervals.

[00209] В данном документе термин «терапевтически эффективное количество» представляет собой количество экспрессированного терапевтического белка FVIII или его функционального фрагмента, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера заболевания или уменьшения конкретного симптома заболевания (см. «Измерение эффективности» ниже). Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК.[00209] As used herein, the term “therapeutically effective amount” is an amount of expressed therapeutic FVIII protein or functional fragment thereof that is sufficient to produce a statistically significant, measurable change in the expression of a disease biomarker or a reduction in a specific disease symptom (see “Measurement of Effectiveness” below) . Such effective amounts can be calibrated in clinical studies as well as in animal studies for a particular cDNA composition.

[00210] Точные количества зкДНК-вектора, необходимые для введения, зависят от суждения практикующего врача и являются индивидуальными для каждого индивидуума. Подходящие схемы введения также являются вариабельными, но типичным является начальное введение с последующими повторными дозами с одним или более интервалами с последующей инъекцией или другим введением. В качестве альтернативы, предусмотрена непрерывная внутривенная инфузия, достаточная для поддержания концентраций в крови в диапазонах, указанных для видов терапии in vivo, в частности, для лечения острых заболеваний/нарушений.[00210] The exact amounts of cccDNA vector required for administration depend on the judgment of the practitioner and are individual to each individual. Suitable dosing regimens are also variable, but typical is an initial administration followed by repeat doses at one or more intervals followed by an injection or other administration. Alternatively, a continuous intravenous infusion sufficient to maintain blood concentrations within the ranges indicated for in vivo therapies, particularly for the treatment of acute diseases/disorders, is provided.

[00211] Агенты, которые можно применять в способах и композициях, описанных в данном документе, можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, внутримышечно, подкожно, внутрь полости, а также они могут быть доставлены с помощью перистальтических средств, при необходимости, или других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно. Он также может быть введен in utero.[00211] Agents that can be used in the methods and compositions described herein can be administered topically, intravenously (by bolus or continuous infusion), by intracellular injection, interstitial injection, orally, by inhalation, intraperitoneally, intramuscularly, subcutaneously , into the cavity, and they can also be delivered by peristaltic means, if necessary, or other means known to those skilled in the art. If necessary, the agent can be administered systemically. It can also be administered in utero.

[00212] Эффективность данного лечения гемофилии А может быть определена квалифицированным врачом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы заболевания или нарушения изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим FVIII или его функциональный фрагмент. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации заболевания или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование заболевания, например, прекращение или замедление прогрессирования заболевания или нарушения; или (2) облегчение заболевания, например, вызывающее регресс симптомов; и (3) предотвращение или снижение вероятности развития заболевания, или предотвращение вторичных заболеваний/нарушений, ассоциированных с указанным заболеванием, таких как печеночная или почечная недостаточность. Эффективное количество для лечения заболевания означает такое количество, которое, при введении нуждающемуся в этом млекопитающему, является достаточным для обеспечения эффективного лечения, в соответствии с определением этого термина в данном документе, этого заболевания.[00212] The effectiveness of a given treatment for hemophilia A can be determined by a qualified physician. However, treatment is considered "effective treatment", as that term is used herein, if any or all of the signs or symptoms of the disease or disorder are modified in a favorable manner, or if other clinically accepted symptoms or markers of the disease are improved or alleviated, e.g. by 10% after treatment with a cccDNA vector encoding FVIII or a functional fragment thereof. Effectiveness can also be measured by the individual's lack of deterioration, which is assessed by stabilization of the disease or need for medical intervention (ie, progression of the disease stops or at least slows down). Methods for measuring these indicators are known to those skilled in the art and/or are described herein. Treatment includes any treatment of a disease in an individual or animal (some non-limiting examples include a human or mammal) and includes: (1) inhibiting the disease, such as stopping or slowing the progression of the disease or disorder; or (2) alleviation of the disease, such as causing regression of symptoms; and (3) preventing or reducing the likelihood of developing a disease, or preventing secondary diseases/disorders associated with the disease, such as liver or kidney failure. An effective amount for treating a disease means an amount that, when administered to a mammal in need thereof, is sufficient to provide effective treatment, as that term is defined herein, of that disease.

[00213] Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для гемофилии А. Стандартные методы анализа показателей гемофилии А известны в данной области техники.[00213] The effectiveness of an agent can be determined by assessing physical indicators that are specific to hemophilia A. Standard methods for analyzing hemophilia A indicators are known in the art.

[00214] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также может кодировать кофакторы или другие полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, киРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)), которые можно применять в сочетании с белком FVIII, экспрессируемым с зкДНК. Кроме того, экспрессионные кассеты, содержащие последовательность, кодирующую белок FVIII, также могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как р-лактамаза, р-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.[00214] In some embodiments, the cDNA FVIII protein expression vector disclosed herein may also encode cofactors or other polypeptides, sense or antisense oligonucleotides, or RNA (coding or noncoding; e.g., siRNA, shRNA, micro-RNA, and the like antisense analogues (eg, antagoMiR)), which can be used in combination with the FVIII protein expressed from cccDNA. In addition, expression cassettes containing a sequence encoding the FVIII protein may also include an exogenous sequence that encodes a reporter protein to be used for experimental or diagnostic purposes, such as β-lactamase, β-galactosidase (LacZ), alkaline phosphatase, thymidine kinase , green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT), luciferase and others well known in the art.

[00215] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты для экспрессии белка FVIII, который является функциональным для лечения гемофилии А. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.[00215] In one embodiment, the cccDNA vector contains a nucleic acid sequence for expression of an FVIII protein that is functional for treating hemophilia A. In a preferred embodiment, the therapeutic FVIII protein does not cause an immune system response unless required.

III. ЗкДНК-вектор в целом для применения в получении терапевтических белков FVIIIIII. General cccDNA vector for use in the production of therapeutic FVIII proteins

[00216] Варианты реализации настоящего изобретения основаны на способах и композициях, содержащих линейные дуплексные векторы с замкнутыми концами (зкДНК), которые могут экспрессировать трансген FVIII. Согласно некоторым вариантам реализации трансген представляет собой последовательность, кодирующую белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, не ограничены размером, что обеспечивает, например, экспрессию всех компонентов, необходимых для экспрессии трансгена, с одного вектора. ЗкДНК-вектор для экспрессии белка FVIII предпочтительно является дуплексным, например, самокомплементарным, по меньшей мере в части молекулы, такой как экспрессионная кассета (например, зкДНК не является двухцепочечной кольцевой молекулой). ЗкДНК-вектор имеет ковалентно замкнутые концы и, таким образом, устойчив к расщеплению экзонуклеазой (например, экзонуклеазой I или экзонуклеазой III), например, более часа при 37°С.[00216] Embodiments of the present invention are based on methods and compositions containing linear closed-end duplex (ccDNA) vectors that can express an FVIII transgene. In some embodiments, the transgene is a sequence encoding an FVIII protein. The cDNA FVIII protein expression vectors described herein are not limited in size, allowing, for example, the expression of all components required for transgene expression from a single vector. The cccDNA vector for expression of the FVIII protein is preferably duplex, eg, self-complementary, in at least part of the molecule, such as an expression cassette (eg, the ccDNA is not a double-stranded circular molecule). The cDNA vector has covalently closed ends and is thus resistant to digestion by an exonuclease (eg, exonuclease I or exonuclease III), for example, for more than an hour at 37°C.

[00217] В общем случае зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.[00217] In general, the cDNA vector for expression of the FVIII protein disclosed herein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (e.g. , an expression cassette described herein), and a second AAV ITR. The ITR sequences are selected from any of: (i) at least one WT-ITR and at least one modified AAB inverted terminal repeat (mod-ITR) (eg, asymmetric modified ITRs); (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization in relation to each other (e.g., asymmetric modified ITRs), or (iii) a pair of symmetric or substantially symmetric WT-WT-ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetric or substantially symmetric modified ITRs, each mod-ITR having the same three-dimensional spatial organization.

[00218] В данный документ включены способы и композиции, содержащие зкДНК-вектор для продукции белка FVIII, которые могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц. В данном документе раскрыты неограничивающие примерные системы на основе липосомных наночастиц, предусмотренные для применения. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК-вектором, полученным указанным способом, раскрыт в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая полностью включена в данный документ.[00218] Included herein are methods and compositions containing a cccDNA vector for production of FVIII protein, which may further include a delivery system, such as, but not limited to, a liposomal nanoparticle delivery system. Disclosed herein are non-limiting exemplary liposome nanoparticle systems contemplated for use. In accordance with some aspects of the present disclosure, a lipid nanoparticle is provided comprising cccDNA and an ionizable lipid. For example, the composition of lipid nanoparticles that are prepared and loaded with a cccDNA vector obtained by this method is disclosed in international application PCT/US2018/050042, filed September 7, 2018, which is incorporated herein in its entirety.

[00219] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, не имеют ограничений по упаковке, налагаемых ограниченным пространством внутри вирусного капсида. ЗкДНК-векторы представляют собой жизнеспособную продуцируемую эукариотами альтернативу плазмидным ДНК-векторам, продуцируемым прокариотами, в отличие от инкапсулированных геномов ААВ. Это позволяет вставлять контрольные элементы, например, регуляторные переключатели, раскрытые в данном документе, большие трансгены, множественные трансгены и т.д.[00219] The cDNA FVIII protein expression vectors disclosed herein do not have packaging restrictions imposed by limited space within the viral capsid. CccDNA vectors provide a viable eukaryotic-produced alternative to plasmid DNA vectors produced by prokaryotes, as opposed to encapsulated AAV genomes. This allows the insertion of control elements, such as regulatory switches disclosed herein, large transgenes, multiple transgenes, etc.

[00220] ФИГ. 1А-1Е схематически показывают неограничивающие примерные зкДНК-векторы для экспрессии белка FVIII или соответствующую последовательность зкДНК-плазмид. ЗкДНК-векторы для экспрессии белка FVIII являются бескапсидными и могут быть получены из плазмиды, кодирующей в указанном порядке: первый ITR, экспрессионную кассету, содержащую трансген, и второй ITR. Экспрессионная кассета может включать одну или более регуляторных последовательностей, которые обеспечивают и/или контролируют экспрессию трансгена, например, экспрессионная кассета может содержать один или более из следующих элементов в указанном порядке: энхансер/промотор, ORF репортера (трансгена), посттранскрипционный регуляторный элемент (например, WPRE) и сигнал полиаденилирования и терминации (например, BGH поли(А)).[00220] FIG. 1A-1E schematically show non-limiting exemplary ccDNA vectors for FVIII protein expression or corresponding ccDNA plasmid sequence. CCDNA vectors for expression of the FVIII protein are capsidless and can be obtained from a plasmid encoding, in this order: a first ITR, an expression cassette containing the transgene, and a second ITR. An expression cassette may include one or more regulatory sequences that mediate and/or control expression of a transgene, for example, an expression cassette may contain one or more of the following elements in this order: enhancer/promoter, reporter (transgene) ORF, post-transcriptional regulatory element (e.g. , WPRE) and a polyadenylation and termination signal (eg, BGH poly(A)).

[00221] Экспрессионная кассета также может содержать участок внутренней посадки рибосомы (IRES) и/или элемент 2А. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторный переключатель, которые описаны в данном документе в разделе, озаглавленном «Регуляторные переключатели», для контроля и регуляции экспрессии белка FVIII, и могут включать, при необходимости, регуляторный переключатель, который представляет собой «аварийный выключатель» (kill switch) для обеспечения контролируемой гибели клетки, содержащей зкДНК-вектор.[00221] The expression cassette may also contain an internal ribosome entry site (IRES) and/or a 2A element. Cis-regulatory elements include, but are not limited to, a promoter, a riboswitch, an insulator, a mir-regulated element, a post-transcriptional regulatory element, a tissue- and cell type-specific promoter, and an enhancer. In some embodiments, the ITR may act as a promoter of a transgene, such as the FVIII protein. In some embodiments, the cccDNA vector contains additional components for regulating transgene expression, such as a regulatory switch, which are described herein in the section entitled "Regulatory Switches" for controlling and regulating FVIII protein expression, and may include, if necessary, a regulatory switch. switch, which is a “kill switch” to ensure controlled death of the cell containing the cccDNA vector.

[00222] Экспрессионная кассета может содержать более 4000 нуклеотидов, 5000 нуклеотидов, 10000 нуклеотидов или 20000 нуклеотидов, или 30000 нуклеотидов, или 40000 нуклеотидов, или 50000 нуклеотидов, или любой диапазон примерно от 4000 до 10000 нуклеотидов, или 10000-50000 нуклеотидов, или более 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 75000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 1000 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 5000 нуклеотидов. Векторы зкДНК не имеют ограничений по размеру ААВ-векторов, заключенных в капсид, что позволяет доставлять экспрессионную кассету большого размера для обеспечения эффективной экспрессии трансгена. Согласно некоторым вариантам реализации зкДНК-вектор лишен специфического для прокариот метилирования.[00222] The expression cassette may contain more than 4000 nucleotides, 5000 nucleotides, 10000 nucleotides or 20000 nucleotides, or 30000 nucleotides, or 40000 nucleotides, or 50000 nucleotides, or any range from about 4000 to 10000 nucleotides, or 10000-50000 nucleotides ov, or more 50,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 50,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 75,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 10,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 1,000 to 10,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 5000 nucleotides. There are no restrictions on the size of cccDNA vectors enclosed in a capsid, allowing delivery of a large expression cassette to ensure efficient transgene expression. In some embodiments, the cccDNA vector lacks prokaryote-specific methylation.

[00223] ЗкДНК-экспрессионная кассета может включать, например, экспрессируемую экзогенную последовательность (например, открытую рамку считывания) или трансген, который кодирует белок, который либо отсутствует, либо не активен, либо обладает недостаточной активностью у субъекта-реципиента, или ген, который кодирует белок, имеющий целевой биологический или терапевтический эффект. Трансген может кодировать продукт гена, функция которого может заключаться в корректировке экспрессии дефектного гена или транскрипта. В принципе, экспрессионная кассета может включать любой ген, который кодирует белок, полипептид или РНК, который либо снижен, либо отсутствует из-за мутации, или который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего раскрытия.[00223] The cDNA expression cassette may include, for example, an exogenous expressed sequence (e.g., an open reading frame) or a transgene that encodes a protein that is either absent, inactive, or deficient in activity in the recipient subject, or a gene that encodes a protein that has a target biological or therapeutic effect. The transgene may encode a gene product, the function of which may be to correct the expression of a defective gene or transcript. In principle, an expression cassette can include any gene that encodes a protein, polypeptide or RNA that is either reduced or absent due to mutation, or that provides a therapeutic benefit when overexpressed, and is considered to be included within the scope of the present disclosure.

[00224] Экспрессионная кассета может содержать любой трансген (например, кодирующий белок FVIII), например, белок FVIII, который можно применять для лечения гемофилии А у субъекта, то есть терапевтический белок FVIII. ЗкДНК-вектор можно применять для доставки и экспрессии любого белка FVIII, представляющего интерес, у субъекта, по отдельности или в комбинации с нуклеиновыми кислотами, кодирующими полипептиды, или некодирующими нуклеиновыми кислотами (например, РНКи, miR и т.д.), а также экзогенных генов и нуклеотидных последовательностей, включая вирусные последовательности, в геноме субъектов, например, последовательности вируса ВИЧ и тому подобное. Предпочтительно зкДНК-вектор, раскрытый в данном документе, применяют для терапевтических целей (например, для медицинских, диагностических или ветеринарных целей) или для иммуногенных полипептидов. Согласно определенным вариантам реализации зкДНК-вектор можно применять для экспрессии любого гена, представляющего интерес, у субъекта, который включает один или более полипептидов, пептидов, рибозимов, пептидных нуклеиновых кислот, миРНК, РНКи, антисмысловых олигонуклеотидов, антисмысловых полинуклеотидов или РНК (кодирующих или некодирующих; например, киРНК, кшРНК, микро-РНК и их антисмысловых аналогов (например, antagoMiR)), антител, слитых белков или любую их комбинацию.[00224] The expression cassette may contain any transgene (eg, encoding an FVIII protein), for example, an FVIII protein that can be used to treat hemophilia A in a subject, that is, a therapeutic FVIII protein. The cccDNA vector can be used to deliver and express any FVIII protein of interest in a subject, alone or in combination with polypeptide-encoding nucleic acids or non-coding nucleic acids (eg, RNAi, miR, etc.), as well as exogenous genes and nucleotide sequences, including viral sequences, in the genome of subjects, for example, HIV virus sequences and the like. Preferably, the cDNA vector disclosed herein is used for therapeutic purposes (eg, medical, diagnostic or veterinary purposes) or immunogenic polypeptides. In certain embodiments, the cccDNA vector can be used to express any gene of interest in a subject, which includes one or more polypeptides, peptides, ribozymes, peptide nucleic acids, siRNA, RNAi, antisense oligonucleotides, antisense polynucleotides, or RNAs (encoding or non-coding ; e.g., siRNA, shRNA, micro-RNA and their antisense analogues (e.g., antagoMiR)), antibodies, fusion proteins, or any combination thereof.

[00225] Экспрессионная кассета также может кодировать полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, миРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)). Экспрессионные кассеты могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как β-лактамаза, β-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.[00225] An expression cassette may also encode polypeptides, sense or antisense oligonucleotides, or RNA (coding or non-coding; e.g., miRNA, shRNA, micro-RNA, and antisense analogs thereof (e.g., antagoMiR)). Expression cassettes may include an exogenous sequence that encodes a reporter protein to be used for experimental or diagnostic purposes, such as β-lactamase, β-galactosidase (LacZ), alkaline phosphatase, thymidine kinase, green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT) , luciferase and others well known in the art.

[00226] Последовательности, обеспеченные в экспрессионной кассете, экспрессионная конструкция зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут быть оптимизированы по кодонам для целевой клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека, путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Херндон, Виржиния, 20171) или другой общедоступной базы данных. Согласно некоторым вариантам реализации нуклеиновая кислота, кодирующая белок FVIII, оптимизирована для экспрессии у человека и/или представляет собой FVIII человека или его функциональный фрагмент, как известно в данной области техники.[00226] The sequences provided in the expression cassette expression construct of the cDNA vector for expression of the FVIII protein described herein can be codon optimized for the target host cell. As used herein, the term “codon optimized” or “codon optimization” refers to the process of modifying a nucleic acid sequence to enhance expression in vertebrate cells of interest, such as a mouse or human, by replacing at least one or more than one or a significant number codons of a native sequence (e.g., a prokaryotic sequence) by the codons that are most or most frequently used in the genes of that vertebrate. Different species exhibit specific preferences for certain codons of a particular amino acid. Typically, codon optimization does not change the amino acid sequence of the original translated protein. Optimized codons can be determined using, for example, the Gene Forge ® platform for codon optimization and custom gene synthesis from Aptagen (Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Herndon, VA, 20171) or other publicly available database. In some embodiments, the nucleic acid encoding the FVIII protein is optimized for expression in humans and/or is human FVIII or a functional fragment thereof, as known in the art.

[00227] Трансген, экспрессируемый зкДНК-вектором для экспрессии белка FVIII, как описано в данном документе, кодирует белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII отличаются от экспрессионных векторов на основе плазмид по многим структурным признакам. ЗкДНК-векторы могут обладать одним или более из следующих признаков: отсутствие исходной (т.е. не вставленной) бактериальной ДНК, отсутствие прокариотической точки начала репликации, самодостаточность, т.е. им не требуются никакие последовательности, кроме двух ITR, включая сайт связывания Rep и сайт концевого разрешения (RBS и TRS), и экзогенную последовательность между ITR, присутствие последовательностей ITR, которые образуют шпильки, и отсутствие метилирования ДНК бактериального типа или фактически любого другого метилирования, которое считается аномальным у млекопитающего-хозяина. В целом векторы согласно настоящему изобретению предпочтительно не содержат никакой прокариотической ДНК, но предусмотрено, что некоторая прокариотическая ДНК может быть вставлена в виде экзогенной последовательности, в качестве неограничивающего примера, в промоторной или энхансерной области. Еще один важный признак, отличающий зкДНК-векторы от экспрессионных векторов на основе плазмид, заключается в том, что зкДНК-векторы представляют собой одноцепочечные линейные ДНК с замкнутыми концами, в то время как плазмиды всегда представляют собой двухцепочечные ДНК.[00227] The transgene expressed by the cDNA FVIII protein expression vector as described herein encodes the FVIII protein. CccDNA vectors for FVIII protein expression differ from plasmid-based expression vectors in many structural features. CccDNA vectors may have one or more of the following characteristics: absence of original (i.e., uninserted) bacterial DNA, absence of a prokaryotic origin of replication, self-sufficiency, i.e. they do not require any sequences other than the two ITRs, including the Rep binding site and the terminal resolution site (RBS and TRS), and exogenous sequence between the ITRs, the presence of ITR sequences that form hairpins, and the absence of bacterial-type DNA methylation or virtually any other methylation, which is considered abnormal in the mammalian host. In general, the vectors of the present invention preferably do not contain any prokaryotic DNA, but it is contemplated that some prokaryotic DNA may be inserted as an exogenous sequence, by way of non-limiting example, in a promoter or enhancer region. Another important feature that distinguishes cccDNA vectors from plasmid-based expression vectors is that cccDNA vectors are single-stranded linear DNA with closed ends, while plasmids are always double-stranded DNA.

[00228] ЗкДНК-векторы для экспрессии белка FVIII, продуцируемые с помощью способов, предложенных в данном документе, предпочтительно имеют линейную и непрерывную структуру, а не прерывистую структуру, согласно определению с помощью анализа с использованием расщепления рестрикционными ферментами (ФИГ. 4D). Как полагают, линейная и непрерывная структура более устойчива к атаке клеточными эндонуклеазами, а также с меньшей вероятностью рекомбинируется и вызывает мутагенез. Таким образом, зкДНК-вектор в виде линейной и непрерывной структуры является предпочтительным вариантом реализации. Непрерывный, линейный, одноцепочечный, с внутримолекулярным дуплексом зкДНК-вектор может иметь ковалентно связанные концевые участки без последовательностей, кодирующих белки капсида ААВ. Эти зкДНК-векторы структурно отличаются от плазмид (включая зкДНК-плазмиды, описанные в данном документе), которые представляют собой кольцевые дуплексные молекулы нуклеиновых кислот бактериального происхождения. Комплементарные цепи плазмид могут быть разделены после денатурации с получением двух молекул нуклеиновых кислот, в то время как зкДНК-векторы, которые имеют комплементарные цепи, представляют собой единую молекулу ДНК и, следовательно, остаются единой молекулой даже после денатурации. Согласно некоторым вариантам реализации зкДНК-векторы, описанные в данном документе, могут быть получены без метилирования оснований ДНК прокариотического типа, в отличие от плазмид. Таким образом, зкДНК-векторы и зкДНК-плазмиды различаются как по структуре (в частности, линейная в сопоставлении с кольцевой), так и с точки зрения методов, используемых для получения и очистки этих различных объектов (см. ниже), а также с точки зрения метилирования ДНК, которое относится к прокариотическому типу для зкДНК-плазмид и эукариотическому типу для зкДНК-вектора.[00228] CCDNA FVIII protein expression vectors produced using the methods provided herein preferably have a linear and continuous structure rather than a discontinuous structure, as determined by restriction enzyme digestion analysis (FIG. 4D). A linear and continuous structure is believed to be more resistant to attack by cellular endonucleases and is also less likely to recombine and cause mutagenesis. Thus, the cccDNA vector in the form of a linear and continuous structure is the preferred embodiment. A continuous, linear, single-stranded, intramolecular duplex cDNA vector may have covalently linked terminal regions without sequences encoding AAV capsid proteins. These cDNA vectors are structurally different from plasmids (including the cDNA plasmids described herein), which are circular duplex nucleic acid molecules of bacterial origin. The complementary strands of plasmids can be separated after denaturation to produce two nucleic acid molecules, while cccDNA vectors, which have complementary strands, constitute a single DNA molecule and therefore remain a single molecule even after denaturation. In some embodiments, the cDNA vectors described herein can be produced without methylation of prokaryotic DNA bases, unlike plasmids. Thus, cccDNA vectors and ccDNA plasmids differ both in structure (in particular, linear versus circular), and in terms of the methods used to obtain and purify these different entities (see below), as well as in terms of in terms of DNA methylation, which refers to the prokaryotic type for cDNA plasmids and the eukaryotic type for cDNA vectors.

[00229] Существует несколько преимуществ применения зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, по сравнению с экспрессионными векторами на основе плазмид, такие преимущества включают, но не ограничиваются перечисленными: 1) плазмиды содержат последовательности бактериальной ДНК и подвергаются метилированию, специфическому для прокариотов, например, метилированию 6-метиладенозина и 5-метилцитозина, в то время как последовательности бескапсидного ААВ-вектора имеют эукариотическое происхождение и не подвергаются метилированию, специфическому для прокариотов; в результате бескапсидные ААВ-векторы с меньшей вероятностью индуцируют воспалительные и иммунные ответы по сравнению с плазмидами; 2) в то время как плазмиды требуют присутствия гена устойчивости во время производственного способа, зкДНК-векторы не требуют; 3) в то время как кольцевая плазмида не доставляется в ядро при введении в клетку и требует чрезмерной нагрузки, чтобы преодолеть разрушение клеточными нуклеазами, зкДНК-векторы содержат вирусные цис-элементы, т.е. ITR, которые придают устойчивость к нуклеазам и могут быть сконструированы для нацеливания и доставки в ядро. Предполагается, что минимальными определяющими элементами, необходимыми для функции ITR, являются сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTTGG-3' (SEQ ID NO: 64) для AAB2) плюс вариабельная палиндромная последовательность, обеспечивающая образование шпильки; и 4) зкДНК-векторы не имеют избыточной представленности динуклеотидов CpG, часто обнаруживаемых в плазмидах прокариотического происхождения, которые, как сообщается, связывают члена Toll-подобного семейства рецепторов, вызывая опосредуемый Т-клетками иммунный ответ. Напротив, трансдукция бескапсидными ААВ-векторами, описанными в данном документе, может быть эффективно нацелена на типы клеток и тканей, которые трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки. IV. Инвертированные концевые повторы (ITR)[00229] There are several advantages to using a cccDNA vector for FVIII protein expression as described herein compared to plasmid-based expression vectors, such advantages include, but are not limited to: 1) plasmids contain bacterial DNA sequences and are methylated, prokaryotic-specific, for example, methylation of 6-methyladenosine and 5-methylcytosine, while the sequences of the capsid-free AAV vector are of eukaryotic origin and do not undergo prokaryotic-specific methylation; as a result, capsidless AAV vectors are less likely to induce inflammatory and immune responses compared to plasmids; 2) while plasmids require the presence of a resistance gene during the production method, cccDNA vectors do not; 3) while a circular plasmid is not delivered to the nucleus when introduced into a cell and requires excessive loading to overcome destruction by cellular nucleases, ccDNA vectors contain viral cis elements, i.e. ITRs, which confer nuclease resistance and can be engineered to target and deliver to the nucleus. The minimum defining elements required for ITR function are proposed to be the Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) for AAB2) and the terminal resolution site (TRS; 5'-AGTTGG-3' (SEQ ID NO: 64) for AAB2) plus a variable palindromic hairpin sequence; and 4) cccDNA vectors do not overrepresent CpG dinucleotides often found in plasmids of prokaryotic origin, which are reported to bind a member of the Toll-like receptor family, inducing a T cell-mediated immune response. In contrast, transduction with the capsidless AAV vectors described herein can effectively target cell and tissue types that are difficult to transduce with conventional AAV virions using different delivery reagents. IV. Inverted terminal repeats (ITRs)

[00230] Как раскрыто в данном документе, зкДНК-векторы для экспрессии белка FVIII содержат трансген или гетерологичную последовательность нуклеиновой кислоты, расположенные между двумя последовательностями инвертированных концевых повторов (ITR), причем указанные последовательности ITR могут представлять собой пару асимметричных ITR или пару симметричных или по существу симметричных ITR, в соответствии с определением этих терминов в данном документе. ЗкДНК-вектор, раскрытый в данном документе, может содержать последовательности ITR, которые выбраны из любых из: (i) по меньшей мере одного WT ITR и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию, при этом указанные способы согласно настоящему раскрытию могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц.[00230] As disclosed herein, cccDNA vectors for FVIII protein expression comprise a transgene or heterologous nucleic acid sequence located between two inverted terminal repeat (ITR) sequences, wherein said ITR sequences may be a pair of asymmetric ITRs or a pair of symmetric or cross-linked ITRs. essentially symmetrical ITRs, as those terms are defined herein. The cccDNA vector disclosed herein may contain ITR sequences that are selected from any of: (i) at least one WT ITR and at least one modified AAV inverted terminal repeat (mod-ITR) (e.g., asymmetric modified ITRs ); (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization relative to each other (e.g., asymmetric modified ITRs), or (iii) pairs of symmetric or substantially symmetric WT-WT ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetrical or substantially symmetrical modified ITRs, each mod-ITR having the same three-dimensional spatial organization, which methods of the present disclosure may further include a delivery system such as, but not limited to , a delivery system based on liposomal nanoparticles.

[00231] Согласно некоторым вариантам реализации последовательность ITR может происходить из вирусов семейства Parvoviridae, которое включает два подсемейства: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих насекомых. Подсемейство Parvovirinae (называемое парвовирусами) включает род Dependovirus, члены которого, в большинстве условий, нуждаются в коинфекции вспомогательным вирусом, таким как аденовирус или вирус герпеса, для эффективной инфекции. Род Dependovirus включает аденоассоциированный вирус (ААВ), который обычно инфицирует людей (например, серотипы 2, 3А, 3В, 5 и 6) или приматов (например, серотипы 1 и 4), а также родственные вирусы, которые инфицируют других теплокровных животных (например, аденоассоциированные вирусы бычьих, собачьих, лошадиных и овечьих). Парвовирусы и другие члены семейства Parvoviridae в общих чертах описаны в Kenneth I. Berns, «Parvoviridae: The Viruses and Their Replication», Chapter 69 в FIELDS VIROLOGY (3d Ed. 1996).[00231] In some embodiments, the ITR sequence may be derived from viruses of the Parvoviridae family, which includes two subfamilies: Parvovirinae, which infect vertebrates, and Densovirinae, which infect insects. The subfamily Parvovirinae (called parvoviruses) includes the genus Dependovirus, whose members, in most conditions, require coinfection with a helper virus such as an adenovirus or herpes virus for effective infection. The genus Dependovirus includes adeno-associated virus (AAV) that commonly infects humans (e.g., serotypes 2, 3A, 3B, 5, and 6) or primates (e.g., serotypes 1 and 4), as well as related viruses that infect other warm-blooded animals (e.g. , adeno-associated viruses of bovine, canine, equine and sheep). Parvoviruses and other members of the family Parvoviridae are described generally in Kenneth I. Berns, “Parvoviridae: The Viruses and Their Replication,” Chapter 69 in FIELDS VIROLOGY (3d Ed. 1996).

[00232] Несмотря на то, что ITR, приведенные в качестве примера в описании и Примерах в данном документе, представляют собой WT-ITR ААВ2, обычный специалист в данной области техники понимает, что, как было указано выше, можно использовать ITR из любого известного парвовируса, например, депендовируса, такого как ААВ (например, из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ 5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261, химерные ITR или ITR из любого синтетического ААВ. Согласно некоторым вариантам реализации ААВ может инфицировать теплокровных животных, например, птичьи (ПААВ), бычьи (БААВ), собачьи, лошадиные и овечьи аденоассоциированные вирусы. Согласно некоторым вариантам реализации ITR происходит из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусиного парвовируса (номер доступа в GenBank NC 001701); змеиного парвовируса 1 (номер доступа в GenBank NC 006148). Согласно некоторым вариантам реализации 5' WT-ITR может происходить из одного серотипа, а 3' WT-ITR может происходить из другого серотипа, как обсуждается в данном документе.[00232] Although the ITRs exemplified in the specification and Examples herein are WT-ITR AAB2, one of ordinary skill in the art will appreciate that, as stated above, ITRs from any known parvovirus, for example, a dependovirus such as AAV (for example, from the genome of AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV11, AAB12, AABrh8, AABrh10, AAB-DJ and AAB-DJ8 For example, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261, chimeric ITRs or ITRs from any synthetic AAV. In some embodiments, AAV can infect warm-blooded animals, such as avian (PAAV), bovine (CAAV), canine, equine, and ovine adeno-associated viruses. In some embodiments, the ITR is derived from parvovirus B19 (GenBank accession no. NC 000883), small mouse virus (MVM) (GenBank accession no. NC 001510); goose parvovirus (GenBank accession no. NC 001510); GenBank accession NC 001701); snake parvovirus 1 (GenBank accession number NC 006148). In some embodiments, the 5' WT-ITR may be from one serotype and the 3' WT-ITR may be from a different serotype, as discussed herein.

[00233] Обычному специалисту известно, что последовательности ITR имеют общую структуру двухцепочечного соединения Холлидея, которое обычно представляет собой Т-образную или Y-образную шпилечную структуру (см., например, ФИГ. 2А и ФИГ. 3А), где каждый WT-ITR образован двумя палиндромными плечами или петлями (В-В' и С-С), встроенными в большее палиндромное плечо (А-А'), и одноцепочечной последовательностью D (при этом порядок этих палиндромных последовательностей определяет «флип» или «флоп» ориентацию ITR). См., например, структурный анализ и сравнение последовательностей ITR из различных серотипов ААВ (ААВ1-ААВ6), описанные в Grimm et at, J. Virology, 2006; 80(1); 426-439; Yan et at, J. Virology, 2005; 364-379; Duan et ai, Virology 1999; 261; 8-14. Обычный специалист в данной области техники может легко определить последовательности WT-ITR из любого серотипа ААВ для использования в зкДНК-векторе или зкДНК-плазмиде на основе примерных последовательностей ITR ААВ2, предложенных в данном документе. См., например, сравнение последовательностей ITR из разных серотипов ААВ (ААВ1-ААВ6, птичий ААВ (ПААВ) и бычий ААВ (БААВ)), описанное в Grimm et al., J. Virology, 2006; 80(1); 426-439; в котором показан % идентичности левого ITR ААВ2 с левым ITR из других серотипов: ААВ-1 (84%), ААВ-3 (86%), ААВ-4 (79%), ААВ-5 (58%), ААВ-6 (левый ITR) (100%) и ААВ-6 (правый ITR) (82%).[00233] One of ordinary skill in the art will recognize that ITR sequences have a general double-stranded Holliday junction structure, which is typically a T- or Y-hairpin structure (see, for example, FIG. 2A and FIG. 3A), where each WT-ITR formed by two palindromic arms or loops (B-B' and C-C) embedded in a larger palindromic arm (A-A'), and a single-stranded sequence D (with the order of these palindromic sequences determining the "flip" or "flop" orientation of the ITR ). See, for example, the structural analysis and comparison of ITR sequences from different AAV serotypes (AAV1-AAV6) described in Grimm et at, J. Virology, 2006; 80(1); 426-439; Yan et at, J. Virology, 2005; 364-379; Duan et ai, Virology 1999; 261; 8-14. One of ordinary skill in the art can readily determine WT-ITR sequences from any AAV serotype for use in a cccDNA vector or ccDNA plasmid based on the exemplary AAB2 ITR sequences provided herein. See, for example, the comparison of ITR sequences from different AAV serotypes (AAV1-AAV6, avian AAV (PAAV) and bovine AAV (BAAV)) described in Grimm et al., J. Virology, 2006; 80(1); 426-439; which shows the % identity of the left ITR of AAV2 with the left ITR from other serotypes: AAV-1 (84%), AAV-3 (86%), AAV-4 (79%), AAV-5 (58%), AAV-6 (left ITR) (100%) and AAV-6 (right ITR) (82%).

А. Пары симметричных ITRA. Pairs of symmetrical ITRs

[00234] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), представляющую интерес нуклеотидную последовательность (например, экспрессионную кассету, описанную в данном документе) и второй ITR ААВ, причем указанный первый ITR (5' ITR) и второй ITR (3' ITR) симметричны или по существу симметричны по отношению друг к другу, то есть зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С и В-В' в трехмерном пространстве. В таком варианте реализации пара симметричных ITR или пара по существу симметричных ITR может представлять собой модифицированные ITR (например, mod-ITR), которые не являются ITR дикого типа. Пара mod-ITR может иметь одну и ту же последовательность, которая имеет одну или более модификаций относительно ITR дикого типа, и они обратно комплементарны друг другу (инвертированы). Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разные последовательности, но соответствующую или одинаковую симметричную трехмерную форму.[00234] In some embodiments, the cccDNA vector for expression of the FVIII protein described herein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (eg , an expression cassette described herein) and a second ITR of AAB, wherein said first ITR (5' ITR) and second ITR (3' ITR) are symmetrical or substantially symmetrical with respect to each other, that is, the ccDNA vector may contain sequences ITRs that have a symmetrical three-dimensional spatial organization such that their structure has the same shape in geometric space, or have the same A, C-C and B-B' loops in three-dimensional space. In such an embodiment, the pair of symmetrical ITRs or the pair of substantially symmetrical ITRs may be modified ITRs (eg, mod-ITRs) that are not wild-type ITRs. A mod-ITR pair may have the same sequence that has one or more modifications relative to the wild-type ITR, and they are inversely complementary to each other (inverted). In alternative embodiments, a pair of modified ITRs is substantially symmetrical as defined herein, that is, a pair of modified ITRs may have different sequences but a corresponding or identical symmetrical three-dimensional shape.

(i) ITR дикого типа(i) Wild type ITR

[00235] Согласно некоторым вариантам реализации симметричные ITR или по существу симметричные ITR относятся к дикому типу (WT-ITR), как описано в данном документе. Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию.[00235] In some embodiments, symmetric ITRs or substantially symmetric ITRs are wild type (WT-ITR), as described herein. In other words, both ITRs have wild-type sequence but do not necessarily have to be WT-ITRs from the same AAV serotype. That is, in some embodiments, one WT-ITR may be derived from one serotype of AAV, and another WT-ITR may be derived from a different serotype of AAV. In such an embodiment, the WT-ITR pair is substantially symmetrical as defined herein, that is, they can have one or more conserved nucleotide modifications while maintaining a symmetrical three-dimensional spatial organization.

[00236] Соответственно, как раскрыто в данном документе, зкДНК-векторы содержат трансген или гетер о логичную последовательность нуклеиновой кислоты, расположенные между двумя фланкирующими последовательностями инвертированных концевых повторов дикого типа (WT-ITR), которые либо обратно комплементарны (инвертированы) по отношению друг к другу, либо, альтернативно, являются по существу симметричными по отношению друг к другу, то есть пара WT-ITR имеет симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации последовательность ITR дикого типа (например, WT-ITR ААВ) содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO: 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62).[00236] Accordingly, as disclosed herein, cccDNA vectors contain a transgene or heterologous nucleic acid sequence located between two flanking wild-type inverted terminal repeat (WT-ITR) sequences that are either reverse complementary (inverted) to each other to each other, or, alternatively, are substantially symmetrical with respect to each other, that is, the WT-ITR pair has a symmetrical three-dimensional spatial organization. In some embodiments, the wild-type ITR sequence (e.g., WT-ITR of AAB) contains a functional Rep binding site (RBS; e.g., 5'-GCGCGCTCGCTCGCTC-3' for AAB2, SEQ ID NO: 60) and a functional terminal resolution site (TRS; e.g. 5'-AGTT-3', SEQ ID NO: 62).

[00237] Согласно одному аспекту зкДНК-векторы для экспрессии белка FVIII могут быть получены из векторного полинуклеотида, который кодирует гетер о логичную нуклеиновую кислоту, функционально расположенную между двумя последовательностями инвертированных концевых повторов WT (WT-ITR) (например, WT-ITR ААВ). Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации 5' WT-ITR происходит из одного серотипа ААВ, а 3' WT-ITR происходит из того же или другого серотипа ААВ. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR являются зеркальными отображениями друг друга, то есть они симметричны. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR происходят из одного и того же серотипа ААВ.[00237] In one aspect, cccDNA vectors for FVIII protein expression can be derived from a vector polynucleotide that encodes a heterologous nucleic acid operably located between two WT inverted terminal repeat (WT-ITR) sequences (e.g., AAB WT-ITR) . In other words, both ITRs have wild-type sequence but do not necessarily have to be WT-ITRs from the same AAV serotype. That is, in some embodiments, one WT-ITR may be derived from one serotype of AAV, and another WT-ITR may be derived from a different serotype of AAV. In such an embodiment, the WT-ITR pair is substantially symmetrical as defined herein, that is, they can have one or more conserved nucleotide modifications while maintaining a symmetrical three-dimensional spatial organization. In some embodiments, the 5' WT-ITR is derived from one AAV serotype and the 3' WT-ITR is derived from the same or a different AAV serotype. In some embodiments, the 5' WT-ITR and 3' WT-ITR are mirror images of each other, that is, they are symmetrical. In some embodiments, the 5' WT-ITR and 3' WT-ITR are from the same serotype of AAV.

[00238] WT-ITR хорошо известны. Согласно одному варианту реализации два ITR происходят из одного и того же серотипа ААВ2. Согласно некоторым вариантам реализации можно использовать WT из других серотипов. Существует ряд гомологичных серотипов, например, ААВ2, ААВ4, ААВ6, ААВ8. Согласно одному варианту реализации можно применять высокогомологичные ITR (например, ITR со сходной петлевой структурой). Согласно другому варианту реализации можно применять WT-ITR ААВ, которые различаются в большей степени, например, ААВ2 и ААВ5, и еще в одном варианте реализации можно применять ITR, который по существу представляет собой WT, то есть он имеет основную петлевую структуру WT, но некоторые консервативные нуклеотидные изменения, которые не изменяют и не влияют на свойства. При использовании WT-ITR из одного и того же вирусного серотипа можно дополнительно использовать одну или более регуляторных последовательностей. Согласно определенным вариантам реализации регуляторная последовательность представляет собой регуляторный переключатель, который позволяет модулировать активность зкДНК, например, экспрессию кодируемого белка FVIII.[00238] WT-ITRs are well known. In one embodiment, the two ITRs are from the same serotype AAB2. In some embodiments, WT from other serotypes can be used. There are a number of homologous serotypes, for example, AAV2, AAV4, AAV6, AAV8. In one embodiment, highly homologous ITRs (eg, ITRs with a similar loop structure) can be used. In another embodiment, a WT-ITR may be used for AABs that are more different, such as AAB2 and AAB5, and in yet another embodiment, an ITR may be used that is essentially a WT, that is, it has the basic loop structure of the WT, but some conservative nucleotide changes that do not change or affect properties. When using WT-ITR from the same viral serotype, one or more regulatory sequences can be additionally used. In certain embodiments, the regulatory sequence is a regulatory switch that allows modulation of the activity of the cccDNA, such as the expression of the encoded FVIII protein.

[00239] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к зкДНК-вектору для экспрессии белка FVIII, причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, кодирующую белок FVIII, функционально расположенную между двумя последовательностями инвертированных концевых повторов дикого типа (WT-ITR), при этом указанные WT-ITR могут происходить из одного и того же серотипа, разных серотипов или по существу симметричны по отношению друг к другу (т.е. они имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и B-B' в трехмерном пространстве). Согласно некоторым вариантам реализации симметричные WT-ITR содержат функциональный сайт концевого разрешения и сайт связывания Rep. Согласно некоторым вариантам реализации гетерологичная последовательность нуклеиновой кислоты кодирует трансген, и при этом вектор не находится в вирусном капсиде.[00239] In some embodiments, one aspect of the technology described herein relates to a cccDNA vector for expression of an FVIII protein, wherein the cccDNA vector comprises at least one heterologous nucleotide sequence encoding an FVIII protein operably located between two inverted sequences. wild-type terminal repeats (WT-ITRs), wherein the WT-ITRs may be from the same serotype, different serotypes, or substantially symmetrical with respect to each other (i.e., they have a symmetrical three-dimensional spatial organization such that their structure has the same shape in geometric space, or have the same loops A, C-C' and B-B' in three-dimensional space). In some embodiments, symmetrical WT-ITRs contain a functional end resolution site and a Rep binding site. In some embodiments, the heterologous nucleic acid sequence encodes a transgene, and the vector is not contained within a viral capsid.

[00240] Согласно некоторым вариантам реализации WT-ITR являются одинаковыми, но обратно комплементарными по отношению друг к другу. Например, последовательность AACG в 5' ITR может представлять собой CGTT (т.е. обратно комплементарную последовательность) в 3' ITR в соответствующем сайте. В одном примере смысловая цепь 5' WT-ITR содержит последовательность ATCGATCG, а соответствующая смысловая цепь 3' WT-ITR содержит CGATCGAT (т.е. обратно комплементарную последовательность ATCGATCG). Согласно некоторым вариантам реализации WT-ITR зкДНК дополнительно содержит сайт концевого разрешения и сайт связывания репликационного белка (RPS) (иногда называемый сайтом связывания репликативного белка), например, сайт связывания Rep.[00240] In some embodiments, the WT-ITRs are the same but inversely complementary to each other. For example, the sequence AACG in the 5' ITR may be a CGTT (ie reverse complementary sequence) in the 3' ITR at the corresponding site. In one example, the 5' sense strand of the WT-ITR contains the sequence ATCGATCG, and the corresponding 3' sense strand of the WT-ITR contains CGATCGAT (ie, the reverse complementary sequence of ATCGATCG). In some embodiments, the WT-ITR cccDNA further comprises an end resolution site and a replication protein binding site (RPS) (sometimes referred to as a replication protein binding site), such as a Rep binding site.

[00241] Примерные последовательности WT-ITR для применения в зкДНК-векторах для экспрессии белка FVIII, содержащих WT-ITR, представлены в Таблице 3 в данном документе, в которой показаны пары WT-ITR (5' WT-ITR и 3' WT-ITR).[00241] Exemplary WT-ITR sequences for use in cDNA FVIII protein expression vectors containing WT-ITR are presented in Table 3 herein, which shows WT-ITR pairs (5' WT-ITR and 3' WT-ITR ITR).

[00242] В качестве иллюстративного примера согласно настоящему раскрытию предложен зкДНК-вектор для экспрессии белка FVIII, содержащий промотор, функционально связанный с трансгеном (например, гетерологичной последовательностью нуклеиновой кислоты), с регуляторным переключателем или без него, причем указанная зкДНК лишена капсидных белков и: (а) продуцируется с зкДНК-плазмиды (например, см. ФИГ. 1F-1G), которая кодирует WT-ITR, при этом каждый WT-ITR имеет одинаковое количество внутримолекулярных дуплексных пар оснований в его шпилечной вторичной конфигурации (предпочтительно исключая делецию любой концевой петли AAA или ТТТ в этой конфигурации по сравнению с этими референсными последовательностями), и (b) идентифицирована как зкДНК с использованием анализа для идентификации зкДНК с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях в Примере 1.[00242] As an illustrative example, the present disclosure provides a cccDNA vector for expressing an FVIII protein comprising a promoter operably linked to a transgene (e.g., a heterologous nucleic acid sequence), with or without a regulatory switch, wherein the ccDNA is devoid of capsid proteins and: (a) is produced from a cccDNA plasmid (e.g., see FIGS. 1F-1G) that encodes a WT-ITR, with each WT-ITR having the same number of intramolecular duplex base pairs in its hairpin secondary configuration (preferably excluding deletion of any terminal AAA or TTT loops in this configuration compared to these reference sequences), and (b) identified as cccDNA using an assay to identify cccDNA using agarose gel electrophoresis on a native gel and under denaturing conditions in Example 1.

[00243] Согласно некоторым вариантам реализации фланкирующие WT-ITR по существу симметричны друг другу. Согласно этому варианту реализации 5' WT-ITR может происходить из одного серотипа ААВ, а 3' WT-ITR может происходить из другого серотипа ААВ так, что WT-ITR не являются идентичными обратно комплементарными последовательностями. Например, 5' WT-ITR может происходить из ААВ2, а 3' WT-ITR может происходить из другого серотипа (например, ААВ1, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12). Согласно некоторым вариантам реализации WT-ITR могут быть выбраны из двух разных парвовирусов, выбранных из любого из: ААВ1, ААВ2, ААВЗ, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Согласно некоторым вариантам реализации такая комбинация WT ITR представляет собой комбинацию WT ITR из ААВ2 и ААВ6. Согласно одному варианту реализации WT-ITR являются по существу симметричными, когда один ITR инвертирован относительно другого ITR, который идентичен по меньшей мере на 90%, идентичен по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, и имеет ту же симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации пара WT-ITR по существу симметрична, поскольку они имеют симметричную трехмерную пространственную организацию, например, имеют одинаковую трехмерную организацию плеч А, С-С', В-В' и D. Согласно одному варианту реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS). Согласно некоторым вариантам реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS) и в дополнение к вариабельной палиндромной последовательности, обеспечивающей образование шпилечной вторичной структуры. Гомология может быть определена с применением стандартных способов, хорошо известных в данной области техники, таких как BLAST («Basic Local Alignment Search Tool»), BLASTN при настройках по умолчанию.[00243] In some embodiments, the flanking WT-ITRs are substantially symmetrical to each other. In this embodiment, the 5' WT-ITR may be derived from one AAV serotype and the 3' WT-ITR may be derived from a different AAV serotype such that the WT-ITRs are not identical reverse complementary sequences. For example, the 5' WT-ITR may be derived from AAB2, and the 3' WT-ITR may be derived from a different serotype (eg, AAB1, 3, 4, 5, 6, 7, 8, 9, 10, 11, and 12). In some embodiments, the WT-ITR may be selected from two different parvoviruses selected from any of: AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, snake parvovirus (eg , royal python parvovirus), bovine parvovirus, goat parvovirus, avian parvovirus, equine parvovirus, shrimp parvovirus, porcine parvovirus or insect AAV. In some embodiments, such a WT ITR combination is a combination of the WT ITRs of AAB2 and AAB6. In one embodiment, WT-ITRs are substantially symmetrical when one ITR is inverted relative to another ITR that is at least 90% identical, at least 95% identical, at least 96%... 97%... 98%... 99%... 99.5%, including all intermediate values, and has the same symmetrical three-dimensional spatial organization. In some embodiments, a pair of WT-ITRs is substantially symmetrical because they have a symmetrical three-dimensional spatial organization, for example, having the same three-dimensional organization of arms A, C-C', B-B', and D. In one embodiment, a pair of substantially symmetrical WTs -ITRs are inverted with respect to each other and are at least 95% identical, at least 96%... 97%... 98%... 99%... 99.5% identical, including all intermediate values, with respect to each other, and one WT-ITR retains a Rep binding site (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) and a terminal resolution site (TRS). In some embodiments, a pair of substantially symmetrical WT-ITRs are inverted with respect to each other and are at least 95% identical, at least 96%... 97%... 98%... 99%... 99.5% identical, including everything in between values, relative to each other, and one WT-ITR retains a Rep binding site (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) and a terminal resolution site (TRS) and in addition to a variable palindromic sequence providing formation of a hairpin secondary structure. Homology can be determined using standard methods well known in the art, such as BLAST (“Basic Local Alignment Search Tool”), BLASTN with default settings.

[00244] Согласно некоторым вариантам реализации структурный элемент ITR может представлять собой любой структурный элемент, который участвует в функциональном взаимодействии ITR с большим белком Rep (например, Rep 78 или Rep 68). Согласно определенным вариантам реализации структурный элемент обеспечивает селективность взаимодействия ITR с большим белком Rep, т.е. определяет, по меньшей мере частично, какой белок Rep функционально взаимодействует с ITR. Согласно другим вариантам реализации структурный элемент физически взаимодействует с большим белком Rep, когда белок Rep связан с ITR. Каждый структурный элемент может представлять собой, например, вторичную структуру ITR, нуклеотидную последовательность ITR, промежуток между двумя или более элементами или комбинацию любого из перечисленных выше. Согласно одному варианту реализации структурные элементы выбраны из группы, состоящей из плеча А и А', плеча В и В', плеча С и С', плеча D, сайта связывания Rep (RBE) и RBE' (т.е. комплементарная последовательность RBE) и сайта концевого разрешения (TRS).[00244] In some embodiments, the ITR structural element can be any structural element that is involved in the functional interaction of the ITR with a large Rep protein (eg, Rep 78 or Rep 68). In certain embodiments, the structural element provides selectivity for the interaction of the ITR with the large Rep protein, i.e. determines, at least in part, which Rep protein functionally interacts with the ITR. In other embodiments, the structural element physically interacts with the large Rep protein when the Rep protein is bound to the ITR. Each structural element may be, for example, an ITR secondary structure, an ITR nucleotide sequence, a gap between two or more elements, or a combination of any of the above. In one embodiment, the structural elements are selected from the group consisting of arm A and A', arm B and B', arm C and C', arm D, a Rep binding site (RBE), and RBE' (i.e., the complementary sequence of the RBE ) and terminal resolution site (TRS).

[00245] Только в качестве примера, в Таблице 2 указаны примерные комбинации WT-ITR.[00245] By way of example only, Table 2 shows exemplary WT-ITR combinations.

[00246] tgcatgc 2: Примерные комбинации WT-ITR из одного и того же серотипа или разных серотипов, или разных парвовирусов. Показанный порядок не указывает на положение ITR, например, «ААВ1, ААВ2» демонстрирует, что зкДНК может содержать WT ITR ААВ1 в 5'-положении и WT ITR ААВ2 в 3'-положении или наоборот WT ITR ААВ2 в 5'-положении, a WT ITR ААВ1 в 3'-положении. Сокращения: ААВ серотипа 1 (ААВ1), ААВ серотипа 2 (ААВ2), ААВ серотипа 3 (ААВ3), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12); геном AABrh8, AABrh10, AAB-DJ и AAB-DJ8 (например, NCBI: NC 002077; NC 001401; NC 001729; NC 001829; NC 006152; NC 006260; NC 006261), ITR из теплокровных животных (птичий ААВ (ПААВ), бычий ААВ (БААВ), собачий, лошадиный и овечий ААВ), ITR из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусь: гусиного парвовируса (номер доступа в GenBank NC 001701); змея: змеиного парвовируса 1 (номер доступа в GenBank NC 006148).[00246] tgcatgc 2: Exemplary combinations of WT-ITRs from the same serotype or different serotypes or different parvoviruses. The order shown does not indicate the position of the ITR, for example, “AAB1, AAB2” demonstrates that cccDNA can contain the WT AAB1 ITR at the 5' position and the WT AAB2 ITR at the 3' position, or vice versa, the WT AAB2 ITR at the 5' position, a WT ITR of AAB1 at the 3' position. Abbreviations: AAV serotype 1 (AAV1), AAV serotype 2 (AAV2), AAV serotype 3 (AAV3), AAV serotype 4 (AAV4), AAV serotype 5 (AAV5), AAV serotype 6 (AAV6), AAV serotype 7 (AAV7) , AAV serotype 8 (AAV8), AAV serotype 9 (AAV9), AAV serotype 10 (AAV10), AAV serotype 11 (AAV11) or AAV serotype 12 (AAV12); genome AABrh8, AABrh10, AAB-DJ and AAB-DJ8 (e.g. NCBI: NC 002077; NC 001401; NC 001729; NC 001829; NC 006152; NC 006260; NC 006261), ITR from warm-blooded animals (avian AAV (PAAV), bovine AAV (BAAV), canine, equine and ovine AAV), ITR from parvovirus B19 (GenBank accession number: NC 000883), small mouse virus (MVM) (GenBank accession number NC 001510); goose: goose parvovirus (GenBank accession number NC 001701); snake: snake parvovirus 1 (GenBank accession number NC 006148).

[00247] Только в качестве примера, в Таблице 3 представлены последовательности примерных WT-ITR из некоторых различных серотипов ААВ.[00247] By way of example only, Table 3 provides sequences of exemplary WT-ITRs from several different AAV serotypes.

[00248] Согласно некоторым вариантам реализации нуклеотидная последовательность последовательности WT-ITR может быть модифицирована (например, путем модификации 1, 2, 3, 4 или 5 или более нуклеотидов или любого их диапазона), при этом указанная модификация представляет собой замену комплементарным нуклеотидом, например, G для С, и наоборот, и Т для А, и наоборот.[00248] In some embodiments, the nucleotide sequence of a WT-ITR sequence may be modified (e.g., by modifying 1, 2, 3, 4, or 5 or more nucleotides or any range thereof), wherein said modification is a substitution with a complementary nucleotide, e.g. , G for C, and vice versa, and T for A, and vice versa.

[00249] Согласно определенным вариантам реализации настоящего изобретения зкДНК-вектор для экспрессии белка FVIII не имеет WT-ITR, состоящего из нуклеотидной последовательности, выбранной из любой из: SEQ ID NO: 1, 2, 5-14. Согласно альтернативным вариантам реализации настоящего изобретения, если зкДНК-вектор имеет WT-ITR, содержащий нуклеотидную последовательность, выбранную из любой из: SEQ ID NO: 1, 2, 5-14, то фланкирующий ITR также представляет собой WT, и зкДНК-вектор содержит регуляторный переключатель, например, как раскрыто в данном документе и в международной заявке PCT/US 18/49996 (например, см. Таблицу 11 PCT/US 18/49996). Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, как раскрыто в данном документе, и выбранный WT-ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 1, 2, 5-14.[00249] In certain embodiments of the present invention, the cDNA vector for expression of the FVIII protein does not have a WT-ITR consisting of a nucleotide sequence selected from any of: SEQ ID NO: 1, 2, 5-14. According to alternative embodiments of the present invention, if the cccDNA vector has a WT-ITR containing a nucleotide sequence selected from any of: SEQ ID NO: 1, 2, 5-14, then the flanking ITR is also WT, and the cccDNA vector contains a control switch, for example, as disclosed herein and in international application PCT/US 18/49996 (for example, see Table 11 of PCT/US 18/49996). In some embodiments, the cccDNA vector for expression of the FVIII protein comprises a regulatory switch as disclosed herein and a selected WT-ITR having a nucleotide sequence selected from any of the group consisting of: SEQ ID NO: 1, 2, 5- 14.

[00250] ЗкДНК-вектор, для экспрессии белка FVIII, описанный в данном документе, может включать структуры WT-ITR, которые сохраняют функциональные части RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В, с использованием ITR дикого типа для иллюстративных целей, показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей WT-ITR, которые содержат Rep-связывающий сайт (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один WT-ITR является функциональным. Согласно альтернативным вариантам реализации, в которых зкДНК-вектор для экспрессии белка FVIII содержит два WT-ITR, которые по существу симметричны друг другу, по меньшей мере один WT-ITR является функциональным и по меньшей мере один WT-ITR является нефункциональным.[00250] The cDNA vector for expression of the FVIII protein described herein may include WT-ITR structures that retain the functional portions of RBE, TRS, and RBE'. FIG. 2A and FIG. 2B, using the wild-type ITR for illustrative purposes, shows one possible mechanism for the TRS site to function within part of the wild-type ITR structure of a ccDNA vector. In some embodiments, the cDNA vector for expressing the FVIII protein comprises one or more functional WT-ITR polynucleotide sequences that contain a Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) for AAB2) and a site end resolution (TRS; 5'-AGTT (SEQ ID NO: 62)). In some embodiments, the at least one WT-ITR is functional. In alternative embodiments, wherein the cccDNA vector for expressing the FVIII protein contains two WT-ITRs that are substantially symmetrical to each other, at least one WT-ITR is functional and at least one WT-ITR is non-functional.

В. Модифицированные ITR (mod-ITR) в целом для зкДНК-векторов, содержащих пары асимметричных ITR или пары симметричных ITRB. Modified ITRs (mod-ITRs) in general for cccDNA vectors containing pairs of asymmetric ITRs or pairs of symmetric ITRs

[00251] Как обсуждается в данном документе, зкДНК-вектор для экспрессии белка FVIII может содержать пару симметричных ITR или пару асимметричных ITR. В обоих случаях один или оба из ITR могут представлять собой модифицированные ITR - различие заключается в том, что в первом случае (то есть симметричные mod-ITR), mod-ITR имеют одинаковую трехмерную пространственную организацию (т.е. имеют одинаковые конфигурации плеча А-А', С-С' и В-В'), в то время как во втором случае (т.е. асимметричные mod-ITR), mod-ITR имеют разную трехмерную пространственную организацию (т.е. имеют разную конфигурацию плеч А-А', С-С' и В-В').[00251] As discussed herein, the cDNA vector for expression of the FVIII protein may contain a pair of symmetric ITRs or a pair of asymmetric ITRs. In both cases, one or both of the ITRs may be modified ITRs - the difference is that in the first case (i.e., symmetrical mod-ITRs), the mod-ITRs have the same three-dimensional spatial organization (i.e., have the same A-arm configurations -A', C-C' and B-B'), while in the second case (i.e. asymmetric mod-ITRs), mod-ITRs have different three-dimensional spatial organization (i.e. have different arm configurations A-A', C-C' and B-B').

[00252] Согласно некоторым вариантам реализации модифицированный ITR представляет собой ITR, который модифицирован путем делеции, вставки и/или замены по сравнению с последовательностью ITR дикого типа (например, ITR ААВ). Согласно некоторым вариантам реализации по меньшей мере один из ITR в зкДНК-векторе содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62). В одном варианте реализации по меньшей мере один из ITR представляет собой нефункциональный ITR. Согласно одному варианту реализации не каждый из разных или модифицированных ITR представляет собой ITR дикого типа из разных серотипов.[00252] In some embodiments, a modified ITR is an ITR that is modified by deletion, insertion, and/or substitution from the wild-type ITR sequence (eg, the AAB ITR). In some embodiments, at least one of the ITRs in the cccDNA vector contains a functional Rep binding site (RBS; e.g., 5'-GCGCGCTCGCTCGCTC-3' for AAB2, SEQ ID NO 60) and a functional terminal resolution site (TRS; e.g., 5 '-AGTT-3', SEQ ID NO: 62). In one embodiment, at least one of the ITRs is a non-functional ITR. In one embodiment, not each of the different or modified ITRs is a wild-type ITR from different serotypes.

[00253] Конкретные изменения и мутации в ITR подробно описаны в данном документе, но в контексте ITR «измененный», «мутированный» или «модифицированный» указывает на то, что нуклеотиды были вставлены, удалены и/или заменены относительно дикого типа, референса или исходной последовательности ITR. Измененный или мутированный ITR может представлять собой модифицированный ITR. В данном документе «сконструированный» относится к аспекту манипулирования человеком. Например, полипептид считается «сконструированным», когда по меньшей мере один аспект полипептида, например, его последовательность, подвергся манипуляции человеком, чтобы отличаться от аспекта, который существует в природе.[00253] Specific changes and mutations in the ITR are described in detail herein, but in the context of an ITR, “altered,” “mutated,” or “modified” indicates that nucleotides have been inserted, deleted, and/or replaced relative to the wild type, reference, or original ITR sequence. The altered or mutated ITR may be a modified ITR. In this document, “designed” refers to the aspect of human manipulation. For example, a polypeptide is considered to be “engineered” when at least one aspect of the polypeptide, such as its sequence, has been manipulated by humans to be different from the aspect that exists in nature.

[00254] Согласно некоторым вариантам реализации mod-ITR может быть синтетическим. Согласно одному варианту реализации синтетический ITR основан на последовательностях ITR более чем из одного серотипа ААВ. Согласно другому варианту реализации синтетический ITR не включает последовательность на основе ААВ. В еще одном варианте реализации синтетический ITR сохраняет структуру ITR, описанную выше, хотя имеет только некоторую часть последовательности, полученной из ААВ, или не имеет ее. Согласно некоторым аспектам синтетический ITR преимущественно может взаимодействовать с Rep дикого типа или Rep конкретного серотипа, или в некоторых случаях не будет распознаваться Rep дикого типа и будет распознаваться только мутированным Rep.[00254] In some embodiments, mod-ITR may be synthetic. In one embodiment, the synthetic ITR is based on ITR sequences from more than one AAV serotype. In another embodiment, the synthetic ITR does not include an AAV-based sequence. In yet another embodiment, the synthetic ITR retains the ITR structure described above, although it has only some or no AAV-derived sequence. In some aspects, the synthetic ITR may preferentially interact with wild-type Rep or Rep of a particular serotype, or in some cases will not be recognized by wild-type Rep and will only be recognized by the mutated Rep.

[00255] Квалифицированный специалист может определить соответствующую последовательность в других серотипах с помощью известных средств. Например, определение того, происходит ли изменение в области А, А', В, В', С, С' или D, и определение соответствующей области в другом серотипе. Для определения соответствующей последовательности можно использовать BLAST® (Basic Local Alignment Search Tool) или другие программы гомологического выравнивания с параметрами по умолчанию. Согласно настоящему изобретению также предложены популяции и множество зкДНК-векторов, содержащих mod-ITR из комбинации различных серотипов ААВ, то есть один mod-ITR может происходить из одного серотипа ААВ, а другой mod-ITR может происходить из другого серотипа. Не ограничиваясь какой-либо теорией, согласно одному варианту реализации один ITR может происходить или основываться на последовательности ITR ААВ2, а другой ITR зкДНК-вектора может происходить или основываться на любой одной или более последовательностях ITR ААВ серотипа 1 (ААВ1), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12).[00255] One of skill in the art can determine the corresponding sequence in other serotypes using known means. For example, determining whether the change occurs in region A, A', B, B', C, C' or D, and determining the corresponding region in another serotype. BLAST® (Basic Local Alignment Search Tool) or other homology alignment programs with default parameters can be used to determine the corresponding sequence. The present invention also provides populations and multiple cccDNA vectors containing mod-ITRs from a combination of different AAV serotypes, that is, one mod-ITR may be derived from one AAV serotype and another mod-ITR may be derived from a different serotype. Without being limited to any theory, in one embodiment, one ITR may be derived from or based on an AAB2 ITR sequence, and the other cDNA vector ITR may be derived from or based on any one or more ITR sequences of AAV serotype 1 (AAV1), AAV serotype 4 ( AAV4), AAV serotype 5 (AAV5), AAV serotype 6 (AAV6), AAV serotype 7 (AAV7), AAV serotype 8 (AAV8), AAV serotype 9 (AAV9), AAV serotype 10 (AAV10), AAV serotype 11 (AAV11 ) or AAV serotype 12 (AAV12).

[00256] Любой ITR парвовируса можно применять в качестве ITR или основного ITR для модификации. Предпочтительно парвовирус представляет собой депендовирус. Более предпочтительно ААВ. Выбранный серотип может быть основан на тканевом тропизме серотипа. ААВ2 обладает широким тканевым тропизмом, ААВ1 преимущественно нацелен на нейроны и скелетные мышцы, а ААВ5 преимущественно нацелен на нейроны, пигментный эпителий сетчатки и фоторецепторы. ААВ6 преимущественно нацелен на скелетные мышцы и легкие. ААВ8 преимущественно нацелен на печень, скелетные мышцы, сердце и ткани поджелудочной железы. ААВ9 преимущественно нацелен на печень, скелетную и легочную ткань. Согласно одному варианту реализации модифицированный ITR основан на ITR ААВ2.[00256] Any parvovirus ITR can be used as an ITR or primary ITR for modification. Preferably, the parvovirus is a dependovirus. AAV is more preferable. The serotype selected may be based on the tissue tropism of the serotype. AAB2 has broad tissue tropism, AAB1 predominantly targets neurons and skeletal muscle, and AAV5 predominantly targets neurons, retinal pigment epithelium, and photoreceptors. AAV6 primarily targets skeletal muscle and lungs. AAB8 primarily targets the liver, skeletal muscle, heart, and pancreatic tissue. AAB9 predominantly targets liver, skeletal and lung tissue. In one embodiment, the modified ITR is based on the AAB2 ITR.

[00257] Более конкретно, способность структурного элемента функционально взаимодействовать с конкретным большим белком Rep может быть изменена путем модификации структурного элемента. Например, нуклеотидная последовательность структурного элемента может быть модифицирована по сравнению с последовательностью ITR дикого типа. Согласно одному варианту реализации структурный элемент (например, плечо А, плечо А', плечо В, плечо В', плечо С, плечо С', плечо D, RBE, RBE' и TRS) ITR можно удалить и заменить структурным элементом дикого типа из другого парвовируса. Например, заменяющая структура может происходить из ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, собачьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Например, ITR может представлять собой ITR ААВ2, а плечо А или А' или RBE могут быть заменены структурным элементом из ААВ5. В другом примере ITR может представлять собой ITR ААВ5, а плечи С или С', RBE и TRS могут быть заменены структурным элементом из ААВ2. В другом примере ITR ААВ может представлять собой ITR ААВ5, в котором плечи В и В' заменены В и В' ITR ААВ2.[00257] More specifically, the ability of a structural element to operably interact with a particular large Rep protein can be altered by modifying the structural element. For example, the nucleotide sequence of the structural element may be modified compared to the wild-type ITR sequence. In one embodiment, a structural element (e.g., arm A, arm A', arm B, arm B', arm C, arm C', arm D, RBE, RBE', and TRS) of the ITR can be removed and replaced with a wild-type structural element from another parvovirus. For example, the replacement structure may be derived from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, snake parvovirus (eg, royal python parvovirus), bovine parvovirus, goat parvovirus, avian parvovirus parvovirus, canine parvovirus, equine parvovirus, shrimp parvovirus, porcine parvovirus or insect AAV. For example, the ITR may be an AAB2 ITR, and arm A or A' or the RBE may be replaced by a structural element from AAB5. In another example, the ITR may be an AAB5 ITR, and the C or C' arms, RBE, and TRS may be replaced by a building block from AAB2. In another example, the AAB ITR may be an AAB5 ITR in which arms B and B' are replaced by B and B' of the AAB2 ITR.

[00258] Только в качестве примера, в Таблице 4 указаны примерные модификации по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях модифицированного ITR, где X указывает на модификацию по меньшей мере одной нуклеиновой кислоты (например, делецию, вставку и/или замену) в этом участке относительно соответствующего ITR дикого типа. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в любой из областей С и/или С', и/или В, и/или В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Например, если модификация приводит к получению любого из: одноплечевого ITR (например, одно плечо С-С' или одно плечо В-В'), или модифицированного плеча С-В' или плеча С'-В, или двухплечевого ITR по меньшей мере с одним усеченным плечом (например, усеченным плечом С-С' и/или усеченным плечом В-В'), по меньшей мере одно плечо или по меньшей мере одно из двух плеч ITR (где одно плечо может быть усечено) сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации усеченное плечо С-С' и/или усеченное плечо В-В' имеет три последовательных Т-нуклеотида (т.е. ТТТ) в концевой петле.[00258] By way of example only, Table 4 sets forth exemplary modifications of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in regions of the modified ITR, where X indicates modification of at least one nucleic acid (e.g., deletion , insertion and/or substitution) in this region relative to the corresponding wild-type ITR. In some embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in any of regions C and/or C' and/or B and/or B' preserves three consecutive nucleotides T (t ie TTT) in at least one terminal loop. For example, if the modification results in any of: a single arm ITR (e.g., one arm C-C' or one arm B-B'), or a modified arm C-B' or an arm C'-B, or a two-arm ITR of at least with one truncated arm (e.g., a C-C' truncated arm and/or a B-B' truncated arm), at least one arm or at least one of two ITR arms (where one arm may be truncated) retains three consecutive nucleotides T (ie TTT) in at least one terminal loop. In some embodiments, the C-C' truncated arm and/or the B-B' truncated arm has three consecutive T nucleotides (ie, TTT) in the terminal loop.

[00259] Таблица 4: Примерные комбинации модификаций по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в различных областях или плечах В-В' и С-С' ITR (X указывает модификацию нуклеотида, например, добавление, делецию или замену по меньшей мере одного нуклеотида в области).[00259] Table 4: Exemplary combinations of modifications to at least one nucleotide (e.g., deletion, insertion, and/or substitution) in various regions or arms B-B' and C-C' of the ITR (X indicates a nucleotide modification, e.g., addition, deletion or substitution of at least one nucleotide in the region).

[00260] Согласно некоторым вариантам реализации mod-ITR для применения в зкДНК-векторе для экспрессии белка FVIII содержит пару асимметричных ITR или пару симметричных mod-ITR, как раскрыто в данном документе, может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида в любой одной или более областях, выбранных из: между А' и С, между С и С', между С' и В, между В и В' и между В' и А. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях С или С' либо В или В' по-прежнему сохраняет концевую петлю структуры стебель-петля. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно альтернативным вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида А (т.е. AAA) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в любой одной или более из областей, выбранных из: А', А и/или D. Например, в некоторых вариантах реализации, модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А и/или А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области D.[00260] In some embodiments, a mod-ITR for use in a cccDNA protein expression vector, FVIII comprises a pair of asymmetric ITRs or a pair of symmetric mod-ITRs as disclosed herein, may contain any of the combinations of modifications presented in Table 4, and also modification of at least one nucleotide in any one or more regions selected from: between A' and C, between C and C', between C' and B, between B and B', and between B' and A. In some embodiments implementation, any modification of at least one nucleotide (eg, deletion, insertion and/or substitution) in regions C or C' or B or B' still retains the terminal loop of the stem-loop structure. In some embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) between C and C' and/or B and B' preserves three consecutive T nucleotides (i.e., TTT) in at least one end loop. In alternative embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) between C and C' and/or B and B' preserves three consecutive nucleotides A (i.e., AAA) in at least one end loop. In some embodiments, a modified ITR for use in the present invention may comprise any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in any one or more of the regions selected from: A', A and/or D. For example, in some embodiments, a modified ITR for use in the present invention may contain any of the combinations of modifications presented in Table 4, as well as a modification of at least one nucleotide (for example, a deletion , insertion, and/or substitution) in region A. In some embodiments, a modified ITR for use in the present invention may contain any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or or replacement) in area A'. In some embodiments, a modified ITR for use in the present invention may comprise any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in the A and/or A' region . In some embodiments, a modified ITR for use in the present invention may contain any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in region D.

[00261] Согласно одному варианту реализации нуклеотидная последовательность структурного элемента может быть модифицирована (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона) для получения модифицированного структурного элемента. Согласно одному варианту реализации конкретные модификации ITR приведены в данном документе в качестве примеров (например, SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или показанные на ФИГ. 7А-7В из PCT/US 2018/064242, поданной 6 декабря 2018 г. (например, SEQ ID NO 97-98, 101-103, 105-108, 111-112, 117-134, 545-54 в PCT/US 2018/064242)). Согласно некоторым вариантам реализации ITR может быть модифицирован (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона). Согласно другим вариантам реализации ITR может иметь по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или более идентичности последовательности с одним из модифицированных ITR, имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или RBE-содержащим участком плеча А-А' и плеч С-С' и В-В', имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или представленных в Таблицах 2-9 (т.е. SEQ ID NO: 110-112, 115-190, 200-468) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00261] In one embodiment, the nucleotide sequence of the building block may be modified (e.g., by modifying 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 , 17, 18, 19 or 20 or more nucleotides or any range thereof) to obtain a modified structural element. In one embodiment, specific modifications to the ITR are provided herein as examples (e.g., SEQ ID NOs: 3, 4, 15-47, 101-116, or 165-187, or shown in FIGS. 7A-7B from PCT/US 2018 /064242, filed December 6, 2018 (e.g., SEQ ID NO 97-98, 101-103, 105-108, 111-112, 117-134, 545-54 in PCT/US 2018/064242)). In some embodiments, the ITR may be modified (e.g., by modifying 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 or 20 or more nucleotides or any range thereof). In other embodiments, the ITR may be at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99% or more sequence identity with one of the modified ITRs having SEQ ID NO: 3, 4, 15-47, 101-116 or 165-187, or the RBE-containing region of the A-A' arm and the C-C arms ' and B-B' having SEQ ID NO: 3, 4, 15-47, 101-116 or 165-187, or presented in Tables 2-9 (i.e. SEQ ID NO: 110-112, 115- 190, 200-468) of international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.

[00262] Согласно некоторым вариантам реализации модифицированный ITR может, например, содержать удаление или делецию всего конкретного плеча, например, всего или части плеча А-А', или всего или части плеча В-В', или всего или части плеча С-С', или, альтернативно, удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований, образующих стебель петли, при условии, что конечная петля, кэпирующая стебель (например, одно плечо), все еще присутствует (например, см. ITR-21 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' (см., например, ITR-1 на ФИГ. 3В или ITR-45 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' и удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Предусмотрена любая комбинация удаления пар оснований, например, могут быть удалены 6 пар оснований в плече С-С' и 2 пары оснований в плече В-В'. В качестве иллюстративного примера, ФИГ. 3В показывает примерный модифицированный ITR по меньшей мере с 7 парами оснований, удаленными из каждой из части С и части С', заменой нуклеотида в петле между областями С и С' и делецией по меньшей мере одной пары оснований из каждой из области В и областей В' так, что модифицированный ITR содержит два плеча, из которых по меньшей мере одно плечо (например, С-С') усечено. Согласно некоторым вариантам реализации модифицированный ITR также содержит делецию по меньшей мере одной пары оснований из каждой из области В и областей В' так, что плечо В-В' также усечено относительно WT ITR.[00262] In some embodiments, the modified ITR may, for example, comprise the removal or deletion of all or a portion of an arm A-A', or all or a portion of an arm B-B', or all or a portion of an arm C-C ', or alternatively, deleting 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs forming a stem loop, provided that the terminal loop capping the stem (e.g., one arm) is all still present (for example, see ITR-21 at FIG. 7A from PCT/US 2018/064242, filed December 6, 2018). In some embodiments, the modified ITR may comprise deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the B-B' arm. In some embodiments, the modified ITR may comprise deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the C-C' arm (see, for example, ITR-1 in FIG. 3B or ITR-45 at FIGURE 7A from PCT/US 2018/064242 filed December 6, 2018). In some embodiments, the modified ITR may comprise deleting 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the C-C' arm and deleting 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs from arm B-B'. Any combination of base pair deletions is possible, for example, 6 base pairs in the C-C' arm and 2 base pairs in the B-B' arm can be deleted. As an illustrative example, FIG. 3B shows an exemplary modified ITR with at least 7 base pairs removed from each of the C portion and the C' portion, a nucleotide substitution in the loop between the C and C' regions, and a deletion of at least one base pair from each of the B region and the B regions. ' such that the modified ITR contains two arms, of which at least one arm (eg, C-C') is truncated. In some embodiments, the modified ITR also contains a deletion of at least one base pair from each of the B region and the B' regions such that the B-B' arm is also truncated relative to the WT ITR.

[00263] Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 50 (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 или 50) делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа. Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 30 делеций нуклеотидов относительно полноразмерной последовательности WT ITR. Согласно некоторым вариантам реализации модифицированный ITR имеет от 2 до 20 делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа.[00263] In some embodiments, the modified ITR may have from 1 to 50 (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, or 50) nucleotide deletions relative to the full-length wild-type ITR sequence. In some embodiments, the modified ITR may have 1 to 30 nucleotide deletions relative to the full-length WT ITR sequence. In some embodiments, the modified ITR has 2 to 20 nucleotide deletions relative to the full-length wild-type ITR sequence.

[00264] Согласно некоторым вариантам реализации модифицированный ITR не содержит никаких делеций нуклеотидов в RBE-содержащей части областей А или А', чтобы не препятствовать репликации ДНК (например, связывание RBE белком Rep или образование одноцепочечного разрыва в сайте концевого разрешения). Согласно некоторым вариантам реализации модифицированный ITR, предусмотренный для применения в данном документе, имеет одну или более делеций в области В, В', С и/или С, как описано в данном документе.[00264] In some embodiments, the modified ITR does not contain any nucleotide deletions in the RBE-containing portion of the A or A' regions so as not to interfere with DNA replication (eg, binding of the RBE by the Rep protein or formation of a single-strand break at the end resolution site). In some embodiments, a modified ITR provided for use herein has one or more deletions in the B, B', C, and/or C region as described herein.

[00265] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару симметричных ITR или пару асимметричных ITR, содержит регуляторный переключатель, как раскрыто в данном документе, и по меньшей мере один выбранный модифицированный ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187.[00265] In some embodiments, a cccDNA FVIII protein expression vector comprising a pair of symmetric ITRs or a pair of asymmetric ITRs comprises a regulatory switch as disclosed herein and at least one selected modified ITR having a nucleotide sequence selected from any from the group consisting of: SEQ ID NO: 3, 4, 15-47, 101-116 or 165-187.

[00266] Согласно другому варианту реализации структура структурного элемента может быть модифицирована. Например, структурный элемент имеет изменение высоты стебля и/или количества нуклеотидов в петле. Например, высота стебля может составлять примерно 2, 3, 4, 5, 6, 7, 8 или 9 нуклеотидов или более или любое значение в пределах указанного диапазона. Согласно одному варианту реализации высота стебля может составлять от примерно 5 нуклеотидов до примерно 9 нуклеотидов и он функционально взаимодействует с Rep. Согласно другому варианту реализации высота стебля может составлять примерно 7 нуклеотидов и он функционально взаимодействует с Rep. В другом примере петля может иметь 3, 4, 5, 6, 7, 8, 9 или 10 нуклеотидов или более или любое значение в пределах указанного диапазона.[00266] According to another embodiment, the structure of the structural element may be modified. For example, a structural element has a change in stem height and/or number of nucleotides in a loop. For example, the stem height may be about 2, 3, 4, 5, 6, 7, 8 or 9 nucleotides or more, or any value within that range. In one embodiment, the stem may be from about 5 nucleotides to about 9 nucleotides in height and operably interacts with Rep. In another embodiment, the stem may be approximately 7 nucleotides in height and operably interacts with Rep. In another example, the loop may be 3, 4, 5, 6, 7, 8, 9 or 10 nucleotides or more, or any value within that range.

[00267] Согласно другому варианту реализации количество сайтов связывания GAGY или родственных GAGY сайтов связывания в RBE или продленном RBE может быть увеличено или уменьшено. В одном примере RBE или продленный RBE может содержать 1, 2, 3, 4, 5 или 6 или более сайтов связывания GAGY или любое значение в пределах указанного диапазона. Каждый сайт связывания GAGY может независимо представлять собой точную последовательность GAGY или последовательность, сходную с GAGY, при условии, что последовательность достаточна для связывания белка Rep.[00267] In another embodiment, the number of GAGY binding sites or GAGY-related binding sites in an RBE or extended RBE may be increased or decreased. In one example, an RBE or extended RBE may contain 1, 2, 3, 4, 5 or 6 or more GAGY binding sites or any value within the specified range. Each GAGY binding site may independently be the exact GAGY sequence or a sequence similar to GAGY, provided that the sequence is sufficient for binding of the Rep protein.

[00268] Согласно другому варианту реализации расстояние между двумя элементами (такими как, но не ограничиваясь перечисленными, RBE и шпилька) может быть изменено (например, увеличено или уменьшено) для изменения функционального взаимодействия с большим белком Rep. Например, расстояние может составлять примерно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или 21 нуклеотид или более или любое значение в пределах указанного диапазона.[00268] In another embodiment, the distance between two elements (such as, but not limited to, an RBE and a hairpin) can be changed (eg, increased or decreased) to change the functional interaction with the large Rep protein. For example, the distance may be about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, or 21 nucleotides or more or any value within the specified range.

[00269] ЗкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, может включать структуру ITR, которая модифицирована относительно структуры ITR дикого типа ААВ2, раскрытой в данном документе, но все еще сохраняет функциональную часть RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей ITR, которые содержат сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один ITR (wt или модифицированный ITR) является функциональным. Согласно альтернативным вариантам реализации, когда зкДНК-вектор для экспрессии белка FVIII содержит два модифицированных ITR, которые отличаются или асимметричны по отношению друг к другу, по меньшей мере один модифицированный ITR является функциональным и по меньшей мере один модифицированный ITR является нефункциональным.[00269] The cDNA FVIII protein expression vector described herein may include an ITR structure that is modified from the wild-type AAB2 ITR structure disclosed herein but still retains the functional portion of RBE, TRS, and RBE'. FIG. 2A and FIG. 2B shows one possible mechanism for the TRS site to function within the wild-type ITR portion of a ccDNA vector for FVIII protein expression. In some embodiments, the cccDNA vector for expression of the FVIII protein contains one or more functional ITR polynucleotide sequences that contain a Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) for AAB2) and an end resolution site ( TRS;5'-AGTT (SEQ ID NO: 62)). In some embodiments, at least one ITR (wt or modified ITR) is functional. In alternative embodiments, when the cccDNA vector for FVIII protein expression contains two modified ITRs that are different or asymmetrical with respect to each other, at least one modified ITR is functional and at least one modified ITR is non-functional.

[00270] Согласно некоторым вариантам реализации модифицированный ITR (например, левый или правый ITR) зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, имеет модификации в плече петли, усеченном плече или спейсере. Примерные последовательности ITR, имеющие модификации в плече петли, усеченном плече или спейсере, перечислены в Таблице 2 (т.е. SEQ ID NO: 135-190, 200-233); Таблице 3 (например, SEQ ID NO: 234-263); Таблице 4 (например, SEQ ID NO: 264-293); Таблице 5 (например, SEQ ID NO: 294-318 в данном документе); Таблице 6 (например, SEQ ID NO: 319-468); и Таблице 7-9 (например, SEQ ID NO: 101-110, 111-112, 115-134) или в Таблице 10А или 10В (например, SEQ ID NO: 9, 100, 469-483, 484-499) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00270] In some embodiments, the modified ITR (eg, left or right ITR) of a cccDNA vector for FVIII protein expression, as described herein, has modifications in a loop arm, truncated arm, or spacer. Exemplary ITR sequences having modifications in the loop arm, truncated arm, or spacer are listed in Table 2 (ie, SEQ ID NO: 135-190, 200-233); Table 3 (eg SEQ ID NO: 234-263); Table 4 (eg SEQ ID NO: 264-293); Table 5 (eg, SEQ ID NO: 294-318 herein); Table 6 (eg SEQ ID NO: 319-468); and Table 7-9 (for example, SEQ ID NO: 101-110, 111-112, 115-134) or in Table 10A or 10B (for example, SEQ ID NO: 9, 100, 469-483, 484-499) international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.

[00271] Согласно некоторым вариантам реализации модифицированный ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR, выбирают из любых или из комбинации ITR, приведенных в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 и 10A-10В международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00271] In some embodiments, the modified ITR for use in a cDNA FVIII protein expression vector containing an asymmetric ITR pair or a symmetric mod-ITR pair is selected from any or a combination of ITRs listed in Tables 2, 3, 4, 5. 6, 7, 8, 9 and 10A-10B of international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.

[00272] Дополнительные примерные модифицированные ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR в каждом из указанных выше классов, представлены в Таблицах 5А и 5В. Прогнозируемая вторичная структура правых модифицированных ITR в Таблице 5А показана на ФИГ. 7А международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., и прогнозируемая вторичная структура левых модифицированных ITR в Таблице 5В показана на ФИГ. 7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ посредством ссылки.[00272] Additional exemplary modified ITRs for use in a cccDNA FVIII protein expression vector containing an asymmetric ITR pair or a symmetric mod-ITR pair in each of the above classes are presented in Tables 5A and 5B. The predicted secondary structure of the right modified ITRs in Table 5A is shown in FIG. 7A of international application PCT/US 2018/064242, filed December 6, 2018, and the predicted secondary structure of the left modified ITRs in Table 5B is shown in FIG. 7B International Application PCT/US 2018/064242, filed December 6, 2018, which is incorporated herein by reference in its entirety.

[00273] В Таблице 5А и Таблице 5В представлены примерные правые и левые модифицированные ITR.[00273] Table 5A and Table 5B show exemplary right and left modified ITRs.

[00274] Таблица 5А: Примерные модифицированные правые ITR. Эти примерные модифицированные правые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).[00274] Table 5A: Example Modified Right ITRs. These exemplary modified right-hand ITRs may comprise the RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), the ACTGAGGC spacer (SEQ ID NO: 69), the complementary spacer sequence GCCTCAGT (SEQ ID NO: 70), and the RBE' (i.e., complementary RBE sequence) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).

[00275] ТАБЛИЦА 5В: Примерные модифицированные левые ITR. Эти примерные модифицированные левые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и комплементарную последовательность RBE (т.е. RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).[00275] TABLE 5B: Example Modified Left ITRs. These exemplary modified left ITRs may comprise the RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), the spacer ACTGAGGC (SEQ ID NO: 69), the complementary spacer sequence GCCTCAGT (SEQ ID NO: 70), and the complementary sequence RBE (i.e. RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).

[00276] Согласно одному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ, причем указанный первый ITR (5'-ITR) и второй ITR (3'-ITR) являются асимметричными по отношению друг к другу, т.е. они имеют разную трехмерную пространственную конфигурацию по отношению друг к другу. В качестве примерного варианта реализации первый ITR может представлять собой ITR дикого типа, а второй ITR может представлять собой мутированный или модифицированный ITR или наоборот первый ITR может представлять собой мутированный или модифицированный ITR, а второй ITR может представлять собой ITR дикого типа. Согласно некоторым вариантам реализации первый ITR и второй ITR оба представляют собой mod-ITR, но имеют разные последовательности или разные модификации и, таким образом, не являются одинаковыми модифицированными ITR и имеют разные трехмерные пространственные конфигурации. Другими словами, зкДНК-вектор с асимметричными ITR содержит ITR, в которых любые изменения в одном ITR относительно WT-ITR не отражаются в другом ITR; или, альтернативно, если асимметричные ITR имеют пару модифицированных асимметричных ITR, они могут иметь различную последовательность и различную трехмерную форму по отношению друг к другу. Примерные асимметричные ITR в зкДНК-векторе для экспрессии белка FVIII и для применения в получении зкДНК-плазмиды представлены в Таблицах 5А и 5В.[00276] In one embodiment, the cDNA vector for expression of the FVIII protein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (for example, an expression cassette described herein) and a second ITR of AAB, wherein said first ITR (5'-ITR) and second ITR (3'-ITR) are asymmetric with respect to each other, i.e. they have different three-dimensional spatial configurations in relation to each other. As an exemplary embodiment, the first ITR may be a wild-type ITR and the second ITR may be a mutated or modified ITR, or conversely, the first ITR may be a mutated or modified ITR and the second ITR may be a wild-type ITR. In some embodiments, the first ITR and the second ITR are both mod-ITRs, but have different sequences or different modifications and thus are not the same modified ITRs and have different three-dimensional spatial configurations. In other words, a cccDNA vector with asymmetric ITRs contains ITRs in which any changes in one ITR relative to the WT-ITR are not reflected in the other ITR; or, alternatively, if the asymmetric ITRs have a pair of modified asymmetric ITRs, they may have a different sequence and a different three-dimensional shape in relation to each other. Exemplary asymmetric ITRs in the cDNA vector for expression of the FVIII protein and for use in the preparation of the cDNA plasmid are presented in Tables 5A and 5B.

[00277] Согласно альтернативному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит два симметричных mod-ITR, то есть оба ITR имеют одинаковую последовательность, но обратно комплементарны (инвертированы) друг другу. Согласно некоторым вариантам реализации пара симметричных mod-ITR содержит по меньшей мере одну или любую комбинацию делеции, вставки или замены относительно последовательности ITR дикого типа из того же серотипа ААВ. Добавления, делеции или замены в симметричных ITR одинаковы, но обратно комплементарны друг другу. Например, вставка 3 нуклеотидов в области С 5' ITR будет отражаться во вставке 3 обратно комплементарных нуклеотидов в соответствующем участке в области С' 3' ITR. Исключительно для целей иллюстрации, если добавление представляет собой AACG в 5' ITR, добавление представляет собой CGTT в 3' ITR в соответствующем сайте. Например, если смысловая цепь 5' ITR представляет собой ATCGATCG с добавлением AACG между G и А, это дает последовательность ATCGAACGATCG (SEQ ID NO: 51). Соответствующая смысловая цепь 3' ITR представляет собой CGATCGAT (обратно комплементарная последовательность ATCGATCG) с добавлением CGTT (т.е. обратно комплементарная последовательность AACG) между Т и С, что дает последовательность CGATCGTTCGAT (SEQ ID NO: 49) (обратно комплементарная последовательность ATCGAACGATCG) (SEQ ID NO: 51).[00277] In an alternative embodiment, the cccDNA vector for expressing the FVIII protein contains two symmetrical mod-ITRs, that is, both ITRs have the same sequence but are inversely complementary to each other. In some embodiments, a pair of symmetric mod-ITRs comprises at least one or any combination of deletions, insertions, or substitutions relative to a wild-type ITR sequence from the same AAV serotype. Additions, deletions, or substitutions in symmetrical ITRs are the same but inversely complementary to each other. For example, an insertion of 3 nucleotides in the C 5' ITR region will be reflected in the insertion of 3 reverse complementary nucleotides in the corresponding region in the C' 3' ITR region. For purposes of illustration only, if the addition is an AACG at the 5' ITR, the addition is a CGTT at the 3' ITR at the corresponding site. For example, if the sense strand of the 5' ITR is ATCGATCG with the addition of AACG between G and A, this gives the sequence ATCGAACGATCG (SEQ ID NO: 51). The corresponding sense strand of the 3' ITR is CGATCGAT (reverse complementary sequence ATCGATCG) with the addition of CGTT (i.e. reverse complementary sequence AACG) between T and C, giving the sequence CGATCGTTCGAT (SEQ ID NO: 49) (reverse complementary sequence ATCGAACGATCG) (SEQ ID NO: 51).

[00278] Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разную последовательность, но иметь соответствующую или одинаковую симметричную трехмерную форму. Например, один модифицированный ITR может происходить из одного серотипа, а другой модифицированный ITR может происходить из другого серотипа, но они имеют одинаковую мутацию (например, вставку, делецию или замену нуклеотидов) в одной и той же области. Другими словами, только для иллюстративных целей, 5'mod-ITR может происходить из ААВ2 и иметь делецию в области С, а 3' mod-ITR может происходить из ААВ5 и иметь соответствующую делецию в области С', и при условии, что 5'mod-ITR и 3'mod-ITR имеют одинаковую или симметричную трехмерную пространственную организацию, они предусмотрены для применения в настоящем изобретении в качестве пары модифицированных ITR.[00278] In alternative embodiments, a pair of modified ITRs is substantially symmetrical as defined herein, that is, a pair of modified ITRs may have a different sequence but have a corresponding or identical symmetrical three-dimensional shape. For example, one modified ITR may be from one serotype and another modified ITR may be from a different serotype, but they have the same mutation (eg, insertion, deletion, or nucleotide substitution) in the same region. In other words, for illustrative purposes only, a 5'mod-ITR may be derived from AAB2 and have a deletion in the C region, and a 3' mod-ITR may be derived from AAB5 and have a corresponding deletion in the C' region, and provided that 5' mod-ITR and 3'mod-ITR have the same or symmetrical three-dimensional spatial organization and are intended for use in the present invention as a pair of modified ITRs.

[00279] Согласно некоторым вариантам реализации пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR. Только в качестве примера, по существу симметричные ITR могут иметь симметричную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве. Это может происходить, например, когда пара G-C модифицирована, например, в пару C-G или наоборот, или когда пара А-Т модифицирована в пару Т-А, или наоборот. Следовательно, используя приведенный выше иллюстративный пример модифицированного 5' ITR как ATCGAACGATCG (SEQ ID NO: 51) и модифицированного 3' ITR как CGATCGTTCGAT (SEQ ID NO: 49) (т.е. обратно комплементарной последовательности для ATCGAACGATCG (SEQ ID NO: 51)), эти модифицированные ITR все равно были бы симметричными, если бы, например, 5' ITR имел последовательность ATCGAACCATCG (SEQ ID NO: 50), где G в добавлении модифицирован на С, и по существу симметричный 3'-ITR имеет последовательность CGATCGTTCGAT (SEQ ID NO: 49), без соответствующей модификации Т в дополнение к а. Согласно некоторым вариантам реализации такая пара модифицированных ITR является по существу симметричной, поскольку пара модифицированных ITR имеет симметричную стереохимию.[00279] In some embodiments, a pair of substantially symmetric mod-ITRs has the same A, C-C', and B-B' loops in three-dimensional space, for example, if a modified ITR in a pair of substantially symmetric mod-ITRs has a deletion of arm C- C', then the cognate mod-ITR has a corresponding deletion of the C-C' loop, and also has a similar three-dimensional structure of the remaining loops A and B-B' of the same shape in geometric space with its cognate mod-ITR. By way of example only, substantially symmetrical ITRs may have a symmetrical spatial organization such that their structure has the same shape in geometric space. This may occur, for example, when a GC pair is modified, for example, into a CG pair or vice versa, or when an A-T pair is modified into a T-A pair, or vice versa. Therefore, using the above illustrative example of a modified 5' ITR as ATCGAACGATCG (SEQ ID NO: 51) and a modified 3' ITR as CGATCGTTCGAT (SEQ ID NO: 49) (i.e., the reverse complementary sequence to ATCGAACGATCG (SEQ ID NO: 51) )), these modified ITRs would still be symmetric if, for example, the 5' ITR had the sequence ATCGAAC C ATCG (SEQ ID NO: 50), where the G in addition is modified to C, and the substantially symmetric 3' ITR has sequence CGATCGTTCGAT (SEQ ID NO: 49), without the corresponding T modification in addition to a. In some embodiments, such a pair of modified ITRs is substantially symmetrical because the pair of modified ITRs has symmetrical stereochemistry.

[00280] Таблица 6 показывает примерные пары симметричных модифицированных ITR (т.е. левого модифицированного ITR и симметричного правого модифицированного ITR) для применения в зкДНК-векторе для экспрессии белка FVIII. Выделенный жирным шрифтом (красным) участок последовательностей идентифицирует часть последовательностей ITR (т.е. последовательности петель А-А', С-С' и В-В'), также показанных на ФИГ. 31А-46В. Эти примерные модифицированные ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).[00280] Table 6 shows exemplary pairs of symmetrical modified ITRs (ie, left-handed modified ITR and symmetrical right-handed modified ITR) for use in a cccDNA vector for expression of the FVIII protein. The bolded (red) sequence region identifies a portion of the ITR sequences (ie, loop sequences A-A', C-C', and B-B') also shown in FIG. 31A-46B. These exemplary modified ITRs may comprise the RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), the spacer ACTGAGGC (SEQ ID NO: 69), the complementary sequence of the spacer GCCTCAGT (SEQ ID NO: 70) and the RBE' (i.e., the complementary sequence RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).

[00281] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару асимметричных ITR, может содержать ITR с модификацией, соответствующей любой из модификаций в последовательностях ITR или неполных последовательностях ITR, представленных в любой одной или более из Таблиц 5А-5В в данном документе, или последовательностях, показанных на ФИГ. 7А-7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ, или раскрытых в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 или 10А-10В международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., полностью включенной в данный документ посредством ссылки.[00281] In some embodiments, a cccDNA FVIII protein expression vector containing a pair of asymmetric ITRs may contain an ITR with a modification corresponding to any of the modifications in the ITR sequences or partial ITR sequences presented in any one or more of Tables 5A-5B in this document, or the sequences shown in FIGS. 7A-7B of international application PCT/US 2018/064242, filed December 6, 2018, which is incorporated herein in its entirety, or disclosed in Tables 2, 3, 4, 5, 6, 7, 8, 9 or 10A-10B of the international Application PCT/US 18/49996, filed September 7, 2018, which is incorporated herein by reference in its entirety.

V. Примерные зкДНК-векторыV. Exemplary cDNA Vectors

[00282] Как описано выше, настоящее раскрытие относится к рекомбинантным экспрессионным зкДНК-векторам и зкДНК-векторам, которые кодируют белок FVIII, содержащим любой из: пары асимметричных ITR, пары симметричных ITR или пары по существу симметричных ITR, как описано выше. Согласно определенным вариантам реализации настоящее раскрытие относится к рекомбинантным зкДНК-векторам для экспрессии белка FVIII, имеющим фланкирующие последовательности ITR и трансген, причем указанные последовательности ITR являются асимметричными, симметричными или по существу симметричными по отношению друг к другу, как определено в данном документе, и зкДНК дополнительно содержит нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, содержащую нуклеиновую кислоту трансгена), расположенную между фланкирующими ITR, при этом указанная молекула нуклеиновой кислоты лишена последовательностей, кодирующих вирусный капсидный белок.[00282] As described above, the present disclosure relates to recombinant cccDNA expression vectors and cccDNA vectors that encode an FVIII protein containing any of: a pair of asymmetric ITRs, a pair of symmetric ITRs, or a pair of substantially symmetric ITRs as described above. In certain embodiments, the present disclosure provides recombinant cDNA FVIII protein expression vectors having ITR and transgene flanking sequences, wherein said ITR sequences are asymmetric, symmetric, or substantially symmetrical with respect to each other as defined herein, and the cccDNA further comprising a nucleotide sequence of interest (eg, an expression cassette containing a transgene nucleic acid) located between flanking ITRs, wherein said nucleic acid molecule lacks sequences encoding a viral capsid protein.

[00283] Экспрессионный зкДНК-вектор для экспрессии белка FVIII может представлять собой любой зкДНК-вектор, который можно удобно подвергнуть методикам рекомбинантной ДНК, включая нуклеотидную последовательность (и), описанную в данном документе, при условии, что по меньшей мере один ITR изменен. ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию совместимы с клеткой-хозяином, в которую должен быть введен зкДНК-вектор. Согласно определенным вариантам реализации зкДНК-векторы могут быть линейными. Согласно определенным вариантам реализации зкДНК-векторы могут существовать как внехромосомные объекты. Согласно определенным вариантам реализации зкДНК-векторы согласно настоящему раскрытию могут содержать элемент (ы), который позволяет интегрировать донорную последовательность в геном клетки-хозяина. В данном документе «трансген» и «гетер о логичная нуклеотидная последовательность» являются синонимами и кодируют белок FVIII, как описано в данном документе.[00283] The cccDNA expression vector for expression of the FVIII protein can be any cccDNA vector that can be conveniently subjected to recombinant DNA techniques, including the nucleotide sequence(s) described herein, provided that at least one ITR is changed. The cDNA vectors for expression of the FVIII protein of the present disclosure are compatible with the host cell into which the cDNA vector is to be introduced. In certain embodiments, the cDNA vectors may be linear. In certain embodiments, cDNA vectors may exist as extrachromosomal entities. In certain embodiments, the cccDNA vectors of the present disclosure may contain element(s) that allow integration of a donor sequence into the genome of a host cell. As used herein, “transgene” and “heterogeneous nucleotide sequence” are synonymous and encode the FVIII protein as described herein.

[00284] На ФИГ. 1A-1G показаны схемы функциональных компонентов двух неограничивающих плазмид, которые можно применять для получения зкДНК-вектора для экспрессии белка FVIII. ФИГ. 1А, 1B, 1D, 1F показывают конструкцию зкДНК-векторов или соответствующих последовательностей зкДНК-плазмид для экспрессии белка FVIII. ЗкДНК-векторы не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, кассету экспрессируемого трансгена и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. ЗкДНК-векторы для экспрессии белка FVIII не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, экспрессируемый трансген (белок или нуклеиновую кислоту) и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. Согласно некоторым вариантам реализации кассета экспрессируемого трансгена включает, при необходимости: энхансер/промотор, одно или более плеч гомологии, донорную последовательность, посттранскрипционный регуляторный элемент (например, WPRE, например, SEQ ID NO: 67), а также сигнал полиаденилирования и терминации (например, BGH поли(А), например, SEQ ID NO: 68).[00284] In FIG. 1A-1G show diagrams of the functional components of two non-limiting plasmids that can be used to generate a cccDNA vector for expression of the FVIII protein. FIG. 1A, 1B, 1D, 1F show the construction of cccDNA vectors or corresponding ccDNA plasmid sequences for expression of the FVIII protein. CccDNA vectors do not have capsids and can be derived from a plasmid encoding, in this order: a first ITR, an expressed transgene cassette, and a second ITR, wherein the sequences of the first and second ITR are asymmetric, symmetrical, or substantially symmetrical to each other, as defined in this document. CccDNA vectors for FVIII protein expression do not have capsids and can be derived from a plasmid encoding, in this order: a first ITR, the transgene (protein or nucleic acid) to be expressed, and a second ITR, wherein the sequences of the first and second ITRs are asymmetric, symmetrical, or substantially symmetrical with respect to each other as defined herein. In some embodiments, the expressed transgene cassette includes, as appropriate, an enhancer/promoter, one or more homology arms, a donor sequence, a post-transcriptional regulatory element (e.g., WPRE, e.g., SEQ ID NO: 67), and a polyadenylation and termination signal (e.g. , BGH poly(A), for example, SEQ ID NO: 68).

[00285] ФИГ. 5 изображает гель, подтверждающий продуцирование зкДНК из нескольких плазмидных конструкций с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4А выше и в Примерах.[00285] FIG. 5 depicts a gel confirming the production of cccDNA from several plasmid constructs using the method described in the Examples. The cctDNA vector is confirmed by the characteristic banding profile in the gel, as discussed in relation to FIG. 4A above and in the Examples.

А. Регуляторные элементыA. Regulatory elements

[00286] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторные переключатели, описанные в данном документе, для регуляции экспрессии трансгена или аварийный выключатель, который может уничтожить клетку, содержащую зкДНК-вектор, кодирующий белок FVIII. Регуляторные элементы, включая регуляторные переключатели, которые можно применять в настоящем изобретении, более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00286] The cDNA FVIII protein expression vectors described herein containing an asymmetric ITR pair or a symmetric ITR pair as defined herein may further contain a particular combination of cis-regulatory elements. Cis-regulatory elements include, but are not limited to, a promoter, a riboswitch, an insulator, a mir-regulated element, a post-transcriptional regulatory element, a tissue- and cell type-specific promoter, and an enhancer. In some embodiments, the ITR may act as a promoter of a transgene, such as the FVIII protein. In some embodiments, the cccDNA FVIII protein expression vector described herein includes additional components for regulating transgene expression, such as regulatory switches described herein for regulating transgene expression or a kill switch that can kill the cell containing the cccDNA -vector encoding the FVIII protein. Regulatory elements, including regulatory switches, that can be used in the present invention are discussed in more detail in international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.

[00287] В вариантах реализации вторая нуклеотидная последовательность включает регуляторную последовательность и нуклеотидную последовательность, кодирующую нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность гена функционально связана с нуклеотидной последовательностью, кодирующей нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность пригодна для контроля экспрессии нуклеазы в клетке-хозяине. Согласно определенным вариантам реализации регуляторная последовательность включает подходящую промоторную последовательность, способную направлять транскрипцию гена, функционально связанного с промоторной последовательностью, такого как нуклеотидная последовательность, кодирующая нуклеазу (нуклеазы) согласно настоящему раскрытию. Согласно определенным вариантам реализации вторая нуклеотидная последовательность включает интронную последовательность, связанную с 5'-концом нуклеотидной последовательности, кодирующей нуклеазу. Согласно определенным вариантам реализации последовательность энхансера обеспечена в 5-направлении относительно промотора для повышения эффективности промотора. Согласно определенным вариантам реализации регуляторная последовательность включает энхансер и промотор, причем вторая нуклеотидная последовательность включает интронную последовательность в 5-направлении от нуклеотидной последовательности, кодирующей нуклеазу, при этом интрон включает один или более сайтов расщепления нуклеазой, и при этом промотор функционально связан с нуклеотидной последовательностью, кодирующей нуклеазу.[00287] In embodiments, the second nucleotide sequence includes a regulatory sequence and a nucleotide sequence encoding a nuclease. In certain embodiments, the gene regulatory sequence is operably linked to a nucleotide sequence encoding a nuclease. In certain embodiments, the regulatory sequence is useful for controlling the expression of a nuclease in a host cell. In certain embodiments, the regulatory sequence includes a suitable promoter sequence capable of directing transcription of a gene operably linked to the promoter sequence, such as a nucleotide sequence encoding a nuclease(s) of the present disclosure. In certain embodiments, the second nucleotide sequence includes an intronic sequence associated with the 5' end of the nucleotide sequence encoding the nuclease. In certain embodiments, the enhancer sequence is provided in the 5-direction relative to the promoter to improve promoter efficiency. In certain embodiments, the regulatory sequence includes an enhancer and a promoter, wherein the second nucleotide sequence includes an intronic sequence upstream of a nucleotide sequence encoding a nuclease, wherein the intron includes one or more nuclease cleavage sites, and wherein the promoter is operably linked to the nucleotide sequence, encoding a nuclease.

[00288] ЗкДНК-векторы для экспрессии белка FVIII, полученные синтетическим путем или с использованием метода продуцирования на основе клеток, как описано в данном документе в Примерах, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов, таких как посттранскрипционный регуляторный элемент WHP (WPRE) (например, SEQ ID NO: 67) и BGH поли(А) (SEQ ID NO: 68). Подходящие экспрессионные кассеты для применения в экспрессионных конструкциях не имеют налагаемого вирусным капсидом ограничения по упаковке.[00288] CCDNA vectors for FVIII protein expression, produced synthetically or using a cell-based production method as described herein in the Examples, may further contain a specific combination of cis-regulatory elements, such as a WHP post-transcriptional regulatory element (WPRE) (eg, SEQ ID NO: 67) and BGH poly(A) (SEQ ID NO: 68). Suitable expression cassettes for use in expression constructs do not have the packaging limitation imposed by the viral capsid.

(i) Промоторы:(i) Promoters:

[00289] Обычный специалист в данной области техники поймет, что промоторы, используемые в зкДНК-векторах для экспрессии белка FVIII, как описано в данном документе, должны быть адаптированы в соответствии с конкретными последовательностями, на которые они оказывают промоторное действие. В соответствии с некоторыми вариантами реализации промотор представляет собой любой промотор или промоторную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.[00289] One of ordinary skill in the art will appreciate that the promoters used in cDNA vectors for expression of the FVIII protein, as described herein, must be tailored according to the particular sequences on which they exert promoter action. In some embodiments, the promoter is any promoter or promoter sequence described in International Application No. PCT/US 2020/021328, filed March 6, 2020, which is incorporated herein by reference in its entirety.

[00290] В соответствии с некоторыми вариантами реализации промотор представляет собой промотор VandenDriessche (VD). В соответствии с некоторыми вариантами реализации промотор VD содержит SEQ ID NO: 191, представленную ниже:[00290] In some embodiments, the promoter is a VandenDriessche (VD) promoter. In accordance with some embodiments, the VD promoter comprises SEQ ID NO: 191, shown below:

[00291] В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 85% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 90% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 95% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 96% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 97% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 98% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 99% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор состоит из последовательности нуклеиновой кислоты SEQ ID NO: 191.[00291] In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 85% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 90% identical to SEQ ID NO: 191. is identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 95% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least is about 96% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 97% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that which is at least about 98% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter comprises a nucleic acid sequence that is at least about 99% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter consists from the nucleic acid sequence SEQ ID NO: 191.

[00292] Экспрессионные кассеты зкДНК-вектора для экспрессии белка FVIII могут включать промотор, который может влиять на общие уровни экспрессии, а также на клеточную специфичность. В случае экспрессии трансгена, например, экспрессии белка FVIII, они могут включать высокоактивный немедленный ранний промотор вирусного происхождения. Экспрессионные кассеты могут содержать тканеспецифические эукариотические промоторы для ограничения экспрессии трансгена конкретными типами клеток и снижения токсических эффектов и иммунных ответов, обусловленных нерегулируемой эктопической экспрессией. Согласно некоторым вариантам реализации экспрессионная кассета может содержать промотор или синтетический регуляторный элемент, такой как промотор CAG (SEQ ID NO: 72). Промотор CAG содержит (i) ранний энхансерный элемент цитомегаловируса (CMV), (ii) промотор, первый экзон и первый интрон гена бета-актина курицы, и (iii) акцептор сплайсинга гена бета-глобина кролика. В качестве альтернативы, экспрессионная кассета может содержать промотор альфа-1-антитрипсина (ААТ) (SEQ ID NO: 73 или SEQ ID NO: 74), специфический для печени (LP1) промотор (SEQ ID NO: 75 или SEQ ID NO: 76) или промотор фактора удлинения-1-альфа (EF1a) человека (например, SEQ ID NO: 77 или SEQ ID NO: 78). Согласно некоторым вариантам реализации экспрессионная кассета включает один или более конститутивных промоторов, например, ретровирусный LTR-промотор вируса саркомы Рауса (RSV) (необязательно с энхансером RSV) или немедленный ранний промотор цитомегаловируса (CMV) (необязательно с энхансером CMV, например, SEQ ID NO: 79). В качестве альтернативы, можно применять индуцируемый промотор, нативный для трансгена промотор, тканеспецифический промотор или различные промоторы, известные в данной области техники.[00292] The cDNA vector expression cassettes for FVIII protein expression may include a promoter that can influence overall expression levels as well as cell specificity. In the case of transgene expression, for example FVIII protein expression, they may include a highly active immediate early promoter of viral origin. Expression cassettes may contain tissue-specific eukaryotic promoters to restrict transgene expression to specific cell types and reduce toxic effects and immune responses caused by unregulated ectopic expression. In some embodiments, the expression cassette may comprise a promoter or a synthetic regulatory element, such as a CAG promoter (SEQ ID NO: 72). The CAG promoter contains (i) the cytomegalovirus (CMV) early enhancer element, (ii) the promoter, first exon, and first intron of the chicken beta-actin gene, and (iii) the splice acceptor of the rabbit beta-globin gene. Alternatively, the expression cassette may comprise an alpha-1 antitrypsin (AAT) promoter (SEQ ID NO: 73 or SEQ ID NO: 74), a liver-specific (LP1) promoter (SEQ ID NO: 75 or SEQ ID NO: 76 ) or human elongation factor-1-alpha (EF1a) promoter (e.g., SEQ ID NO: 77 or SEQ ID NO: 78). In some embodiments, the expression cassette includes one or more constitutive promoters, e.g., a Rous sarcoma virus (RSV) retroviral LTR promoter (optionally with an RSV enhancer) or a cytomegalovirus (CMV) immediate early promoter (optionally with a CMV enhancer, e.g., SEQ ID NO : 79). Alternatively, an inducible promoter, a transgene-native promoter, a tissue-specific promoter, or various promoters known in the art may be used.

[00293] Подходящие промоторы, включая те, которые описаны в данном документе, могут происходить из вирусов и, соответственно, могут называться вирусными промоторами, или они могут происходить из любого организма, в том числе прокариотических или эукариотических организмов. Для управления экспрессией с помощью любой РНК-полимеразы (например, pol I, pol II, pol III) могут применяться подходящие промоторы. Примерные промоторы включают, но не ограничиваются перечисленными, ранний промотор SV40, промотор длинного концевого повтора (LTR) вируса опухоли молочной железы мыши; большой поздний промотор аденовируса (Ad MLP); промотор вируса простого герпеса (HSV), промотор цитомегаловируса (CMV), такой как область немедленного раннего промотора CMV (CMVIE), промотор вируса саркомы Рауса (RSV), промотор U6 малой ядерной РНК человека (U6, например, SEQ ID NO: 80) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), улучшенный промотор U6 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), промотор H1 человека (H1) (например, SEQ ID NO: 81 или SEQ ID NO: 155), промотор CAG, промотор альфа-1-антитрипсина человека (НААТ) (например, SEQ ID NO: 82) и т.п. Согласно определенным вариантам реализации указанные промоторы изменяют на их содержащем интрон 3'-конце так, чтобы они включали один или более сайтов расщепления нуклеазами. Согласно определенным вариантам реализации ДНК, содержащая сайт(ы) расщепления нуклеазой, является чужеродной для ДНК промотора.[00293] Suitable promoters, including those described herein, may be derived from viruses and may thus be referred to as viral promoters, or they may be derived from any organism, including prokaryotic or eukaryotic organisms. Suitable promoters can be used to drive expression by any RNA polymerase (eg, pol I, pol II, pol III). Exemplary promoters include, but are not limited to, the SV40 early promoter, the mouse mammary tumor virus long terminal repeat (LTR) promoter; adenovirus large late promoter (Ad MLP); herpes simplex virus (HSV) promoter, cytomegalovirus (CMV) promoter such as the CMV immediate early (CMVIE) promoter region, Rous sarcoma virus (RSV) promoter, human small nuclear RNA U6 promoter (U6, e.g., SEQ ID NO: 80) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), improved U6 promoter (e.g., Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), human H1 promoter (H1) (eg, SEQ ID NO: 81 or SEQ ID NO: 155), CAG promoter, human alpha-1 antitrypsin (HAAT) promoter (eg, SEQ ID NO: 82), etc. In certain embodiments, said promoters are modified at their intron-containing 3' end to include one or more nuclease cleavage sites. In certain embodiments, the DNA containing the nuclease cleavage site(s) is foreign to the promoter DNA.

[00294] Согласно одному варианту реализации используемый промотор представляет собой нативный промотор гена, кодирующего терапевтический белок. Промоторы и другие регуляторные последовательности соответствующих генов, кодирующих терапевтические белки, известны и были охарактеризованы. Используемая промоторная область может дополнительно включать одну или более дополнительных регуляторных последовательностей (например, нативных), например, энхансеров (например, SEQ ID NO: 79 и SEQ ID NO: 83), включая энхансер SV40 (SEQ ID NO: 126).[00294] In one embodiment, the promoter used is the native promoter of a gene encoding a therapeutic protein. The promoters and other regulatory sequences of the corresponding genes encoding therapeutic proteins are known and have been characterized. The promoter region used may further include one or more additional regulatory sequences (eg, native), such as enhancers (eg, SEQ ID NO: 79 and SEQ ID NO: 83), including the SV40 enhancer (SEQ ID NO: 126).

[00295] Согласно некоторым вариантам реализации промотор также может представлять собой промотор из гена человека, такого как убиквитин С человека (hUbC), актин человека, миозин человека, гемоглобин человека, мышечный креатин человека или металлотионеин человека. Промотор также может представлять собой тканеспецифический промотор, такой как специфический для печени промотор, например, альфа-1-антитрипсина человека (НААТ), природный или синтетический. Согласно одному варианту реализации доставку в печень можно обеспечить с использованием специфичного нацеливания на эндогенный АроЕ композиции, содержащей зкДНК-вектор, которую направляют в гепатоциты за счет рецептора липопротеина низкой плотности (ЛНП), присутствующего на поверхности гепатоцита.[00295] In some embodiments, the promoter may also be a promoter from a human gene, such as human ubiquitin C (hUbC), human actin, human myosin, human hemoglobin, human muscle creatine, or human metallothionein. The promoter may also be a tissue-specific promoter, such as a liver-specific promoter, for example human alpha-1 antitrypsin (HAAT), natural or synthetic. In one embodiment, delivery to the liver can be achieved using specific targeting of endogenous ApoE by a cccDNA vector-containing composition that is directed to hepatocytes by a low-density lipoprotein (LDL) receptor present on the surface of the hepatocyte.

[00296] Неограничивающие примеры промоторов, подходящих для применения в соответствии с настоящим изобретением, включают любой из промоторов, описанных в данном документе, или любой из следующих: промотор CAG, например, (SEQ ID NO: 72), промотор НААТ (SEQ ID NO: 82), промотор EF1-α человека (SEQ ID NO: 77) или фрагмент промотора EF1a (SEQ ID NO: 78), промотор IE2 (например, SEQ ID NO: 84) и промотор EF1-α крысы (SEQ ID NO: 85), промотор mEF1 (SEQ ID NO: 59) или фрагмент промотора 1E1 (SEQ ID NO: 125).[00296] Non-limiting examples of promoters suitable for use in accordance with the present invention include any of the promoters described herein or any of the following: CAG promoter, for example, (SEQ ID NO: 72), HAAT promoter (SEQ ID NO : 82), the human EF1-α promoter (SEQ ID NO: 77) or a fragment of the EF1a promoter (SEQ ID NO: 78), the IE2 promoter (e.g., SEQ ID NO: 84) and the rat EF1-α promoter (SEQ ID NO: 85), the mEF1 promoter (SEQ ID NO: 59) or a fragment of the 1E1 promoter (SEQ ID NO: 125).

(ii) Энхансеры(ii) Enhancers

[00297] Согласно некоторым вариантам реализации зкДНК, экспрессирующая FVIII, содержит один или более энхансеров. Согласно некоторым вариантам реализации последовательность энхансера расположена в 5'-направлении относительно последовательности промотора. Согласно некоторым вариантам реализации последовательность энхансера расположена в 3'-направлении относительно последовательности промотора. В соответствии с некоторыми вариантами реализации энхансер представляет собой любой энхансер или энхансерную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.[00297] In some embodiments, the cccDNA expressing FVIII contains one or more enhancers. In some embodiments, the enhancer sequence is located 5' to the promoter sequence. In some embodiments, the enhancer sequence is located 3' to the promoter sequence. In some embodiments, an enhancer is any enhancer or enhancer sequence described in International Application No. PCT/US 2020/021328, filed March 6, 2020, which is incorporated herein by reference in its entirety.

(iii) Последовательности 5'-UTR и интронные последовательности(iii) 5'UTR sequences and intronic sequences

[00298] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 5'-UTR и/или интронную последовательность, которая расположена в 3'-направлении относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации 5'-UTR расположена в 5-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 5'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9А, которая полностью включена в данный документ посредством ссылки.[00298] In some embodiments, the cccDNA vector contains a 5′-UTR sequence and/or an intronic sequence that is located in the 3′ direction of the 5′-ITR sequence. In some embodiments, the 5'UTR is located upstream of the transgene, for example, the FVIII protein coding sequence. Exemplary 5'UTR sequences are listed in International Application No. PCT/US 2020/021328, for example in Table 9A, which is incorporated herein by reference in its entirety.

(iv) Последовательности 3'-UTR(iv) 3'-UTR sequences

[00299] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 3'-UTR, которая расположена в 5'-направлении относительно последовательности 3'-ITR. Согласно некоторым вариантам реализации 3'-UTR расположена в 3'-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 3'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9В, которая полностью включена в данный документ посредством ссылки.[00299] In some embodiments, the cccDNA vector contains a 3'-UTR sequence that is located in the 5' direction relative to the 3'-ITR sequence. In some embodiments, the 3'UTR is located upstream of a transgene, for example, a sequence encoding an FVIII protein. Exemplary 3'UTR sequences are listed in International Application No. PCT/US 2020/021328, for example in Table 9B, which is incorporated herein by reference in its entirety.

Последовательности полиаденилирования:Polyadenylation sequences:

[00300] Последовательность, кодирующая последовательность полиаденилирования, может быть включена в зкДНК-вектор для экспрессии белка FVIII для стабилизации мРНК, экспрессируемой с указанного зкДНК-вектора, и для содействия ядерному экспорту и трансляции. Согласно одному варианту реализации зкДНК-вектор не включает последовательность полиаденилирования. Согласно другим вариантам реализации зкДНК-вектор для экспрессии белка FVIII включает по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50 или более адениновых динуклеотидов. Согласно некоторым вариантам реализации последовательность полиаденилирования содержит примерно 43 нуклеотида, примерно 40-50 нуклеотидов, примерно 40-55 нуклеотидов, примерно 45-50 нуклеотидов, примерно 35-50 нуклеотидов или любой диапазон между указанными значениями.[00300] A sequence encoding a polyadenylation sequence may be included in a cccDNA vector for expression of the FVIII protein to stabilize the mRNA expressed from the ccDNA vector and to promote nuclear export and translation. In one embodiment, the cDNA vector does not include a polyadenylation sequence. In other embodiments, the cccDNA vector for expression of the FVIII protein includes at least 1, at least 2, at least 3, at least 4, at least 5, at least 10, at least 15, at least 20, at least 25, at least 30, at least 40, at least 45, at least 50 or more adenine dinucleotides. In some embodiments, the polyadenylation sequence is about 43 nucleotides, about 40-50 nucleotides, about 40-55 nucleotides, about 45-50 nucleotides, about 35-50 nucleotides, or any range therebetween.

[00301] Экспрессионные кассеты могут включать любую последовательность полиаденилирования, известную в данной области техники, или ее вариант. Согласно некоторым вариантам реализации последовательность полиаденилирования (поли(А)) выбрана из любой из последовательностей, перечисленных в международной заявке № PCT/US 2020/021328, например, в Таблице 10, которая полностью включена в данный документ посредством ссылки. Также можно использовать другие последовательности поли(А), широко известные в данной области техники, например, включая, но не ограничиваясь перечисленными, природную последовательность, выделенную из бычьего BGHpA (например, SEQ ID NO: 68) или SV40pA вируса (например, SEQ ID NO: 86) или синтетическую последовательность (SEQ ID NO: 87). Некоторые экспрессионные кассеты также могут включать последовательность 5'-энхансера позднего поли(А)-сигнала (USE) SV40. Согласно некоторым вариантам реализации последовательность USE можно применять в комбинации с SV40pA или гетерологичным сигналом поли(А). Последовательности поли(А) расположены в 3-направлении относительно трансгена, кодирующего белок FVIII.[00301] Expression cassettes may include any polyadenylation sequence known in the art, or a variant thereof. In some embodiments, the polyadenylation sequence (poly(A)) is selected from any of the sequences listed in International Application No. PCT/US 2020/021328, for example, Table 10, which is incorporated herein by reference in its entirety. Other poly(A) sequences commonly known in the art may also be used, such as, but not limited to, natural sequence isolated from bovine BGHpA (e.g., SEQ ID NO: 68) or SV40pA virus (e.g., SEQ ID NO: 68) NO: 86) or a synthetic sequence (SEQ ID NO: 87). Some expression cassettes may also include an SV40 5' late poly(A) signal enhancer (USE) sequence. In some embodiments, the USE sequence can be used in combination with SV40pA or a heterologous poly(A) signal. The poly(A) sequences are located in the 3-direction relative to the transgene encoding the FVIII protein.

Экспрессионные кассеты также могут включать посттранскрипционный элемент для повышения экспрессии трансгена. Согласно некоторым вариантам реализации для повышения экспрессии трансгена применяют посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WHP) (WPRE) (например, SEQ ID NO: 67). Можно применять другие элементы посттранскрипционного процессинга, такие как посттранскрипционный элемент из гена тимидинкиназы вируса простого герпеса или вируса гепатита В (HBV). С трансгенами могут быть связаны секреторные последовательности, например, последовательности VH-02 и VK-A26, например, SEQ ID NO: 88 и SEQ ID NO: 89.Expression cassettes may also include a post-transcriptional element to enhance transgene expression. In some embodiments, a woodchuck hepatitis virus post-transcriptional regulatory element (WHP) (WPRE) (eg, SEQ ID NO: 67) is used to enhance transgene expression. Other post-transcriptional processing elements may be used, such as a post-transcriptional element from the herpes simplex virus or hepatitis B virus (HBV) thymidine kinase gene. Secretory sequences, such as VH-02 and VK-A26 sequences, such as SEQ ID NO: 88 and SEQ ID NO: 89, may be associated with the transgenes.

(vi) Последовательности ядерной локализации(vi) Nuclear localization sequences

[00302] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более последовательностей ядерной локализации (NLS), например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. Согласно некоторым вариантам реализации одна или более NLS расположены на амино-конце или рядом с ним, на карбокси-конце или рядом с ним, или в их комбинации (например, одна или более NLS на амино-конце и/или одна или более NLS на карбокси-конце). В случае присутствия более чем одной NLS, каждая из них может быть выбрана независимо от других так, что одна NLS будет присутствовать более чем в одной копии и/или в комбинации с одной или более другими NLS, присутствующими в одной или более копиях. Неограничивающие примеры NLS приведены в Таблице 7.[00302] In some embodiments, the cccDNA vector for expressing the FVIII protein contains one or more nuclear localization sequences (NLS), such as 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLS. In some embodiments, one or more NLSs are located at or near the amino terminus, at or near the carboxy terminus, or a combination thereof (e.g., one or more NLSs at the amino terminus and/or one or more NLSs at the carboxy-terminal). If more than one NLS is present, each may be selected independently of the others such that one NLS will be present in more than one copy and/or in combination with one or more other NLSs present in one or more copies. Non-limiting examples of NLS are given in Table 7.

В. Дополнительные компоненты зкДНК-векторовB. Additional components of cDNA vectors

[00303] ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию могут содержать нуклеотиды, которые кодируют другие компоненты для экспрессии гена. Например, для выбора событий нацеливания на конкретные гены защитная кшРНК может быть встроена в микроРНК и вставлена в рекомбинантный зкДНК-вектор, предназначенный для сайт-специфической интеграции в высокоактивный локус, такой как локус альбумина. Такие варианты реализации могут обеспечивать систему для отбора и размножения генетически модифицированных гепатоцитов in vivo в любом генетическом окружении, например, описанном в Nygaard et al., A universal system to select gene-modified hepatocytes in vivo, Gene Therapy, June 8, 2016. ЗкДНК-векторы согласно настоящему раскрытию могут содержать один или более селективных маркеров, которые позволяют проводить селекцию трансформированных, трансфицированных, трансдуцированных или подобных клеток. Селективный маркер представляет собой ген, продукт которого обеспечивает биоцидную или вирусную устойчивость, устойчивость к тяжелым металлам, прототрофию ауксотрофам, NeoR и т.п. Согласно определенным вариантам реализации в донорные последовательности включены маркеры для положительной селекции, такие как NeoR. Маркеры для отрицательной селекции могут быть включены после донорных последовательностей, например, последовательность нуклеиновой кислоты HSV-tk, кодирующая маркер для отрицательной селекции, может быть включена в конструкцию нуклеиновой кислоты после донорной последовательности.[00303] CCDNA vectors for FVIII protein expression according to the present disclosure may contain nucleotides that encode other components for gene expression. For example, to select targeting events for specific genes, a protective shRNA can be engineered into a microRNA and inserted into a recombinant cccDNA vector designed for site-specific integration at a highly active locus, such as the albumin locus. Such embodiments may provide a system for selecting and propagating genetically modified hepatocytes in vivo in any genetic environment, for example, as described in Nygaard et al., A universal system to select gene-modified hepatocytes in vivo, Gene Therapy, June 8, 2016. cctDNA -vectors according to the present disclosure may contain one or more selectable markers that allow selection of transformed, transfected, transduced or the like cells. A selectable marker is a gene whose product provides biocidal or viral resistance, resistance to heavy metals, prototrophy to auxotrophs, NeoR, etc. In certain embodiments, positive selection markers, such as NeoR, are included in the donor sequences. Negative selection markers may be included after the donor sequences, for example, an HSV-tk nucleic acid sequence encoding a negative selection marker may be included in the nucleic acid construct after the donor sequence.

С. Регуляторные переключателиC. Regulatory switches

[00304] Молекулярный регуляторный переключатель представляет собой переключатель, который генерирует измеряемое изменение состояния в ответ на сигнал. Такие регуляторные переключатели можно подходящим образом комбинировать с зкДНК-векторами для экспрессии белка FVIII, описанными в данном документе, чтобы контролировать выход экспрессии белка FVIII с зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который служит для тонкой настройки экспрессии белка FVIII. Например, он может выполнять функцию биосдерживания зкДНК-вектора. Согласно некоторым вариантам реализации переключатель представляет собой двухпозиционный («ON/OFF») переключатель, который предназначен для запуска или остановки (т.е. прекращения) экспрессии белка FVIII в зкДНК-векторе контролируемым и регулируемым образом. Согласно некоторым вариантам реализации указанный переключатель может включать «аварийный выключатель», который может давать клетке, содержащей указанный зкДНК-вектор, команду для запуска механизма запрограммированной клеточной смерти после активации переключателя. Примерные регуляторные переключатели, предусмотренные для применения в зкДНК-векторе для экспрессии белка FVIII, могут применяться для регуляции экспрессии трансгена и более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00304] A molecular regulatory switch is a switch that generates a measurable change of state in response to a signal. Such regulatory switches can be suitably combined with the cccDNA FVIII protein expression vectors described herein to control the output of FVIII protein expression from the cccDNA vector. In some embodiments, the cccDNA vector for expression of the FVIII protein contains a regulatory switch that serves to fine-tune the expression of the FVIII protein. For example, it may serve as a biocontainment function for the cDNA vector. In some embodiments, the switch is a two-position (“ON/OFF”) switch that is configured to start or stop (ie, stop) expression of the FVIII protein in the cccDNA vector in a controlled and regulated manner. In some embodiments, the switch may include a "kill switch" that may instruct a cell containing the cccDNA vector to initiate programmed cell death upon activation of the switch. Exemplary regulatory switches provided for use in a cccDNA vector for expression of the FVIII protein can be used to regulate transgene expression and are discussed in more detail in international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.

(i) Бинарные регуляторные переключатели(i) Binary control switches

[00305] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который может служить для контролируемой модуляции экспрессии белка FVIII. Например, экспрессионная кассета, расположенная между ITR зкДНК-вектора, может дополнительно содержать регуляторную область, например, промотор, цис-элемент, репрессор, энхансер и т.д., которая функционально связана с последовательностью нуклеиновой кислоты, кодирующей белок FVIII, причем указанная регуляторная область регулируется одним или более кофакторами или экзогенными агентами. В качестве неограничивающего примера, регуляторные области могут модулироваться низкомолекулярными переключателями или индуцируемыми или репрессируемыми промоторами. Неограничивающие примеры индуцируемых промоторов представляют собой индуцируемые гормонами или индуцируемые металлами промоторы. Другие примерные индуцируемые промоторные/энхансерные элементы включают, но не ограничиваются перечисленными, индуцируемый RU486 промотор, индуцируемый экдизоном промотор, индуцируемый рапамицином промотор и промотор металлотионеина.[00305] In some embodiments, the cccDNA vector for expression of the FVIII protein contains a regulatory switch that can serve to controllably modulate the expression of the FVIII protein. For example, an expression cassette located between the ITR of a cccDNA vector may further comprise a regulatory region, for example, a promoter, a cis element, a repressor, an enhancer, etc., which is operably linked to a nucleic acid sequence encoding the FVIII protein, wherein said regulatory region the region is regulated by one or more cofactors or exogenous agents. As a non-limiting example, regulatory regions can be modulated by small molecule switches or inducible or repressible promoters. Non-limiting examples of inducible promoters are hormone inducible or metal inducible promoters. Other exemplary inducible promoter/enhancer elements include, but are not limited to, the RU486 inducible promoter, the ecdysone inducible promoter, the rapamycin inducible promoter, and the metallothionein promoter.

(ii) Низкомолекулярные регуляторные переключатели(ii) Small molecule regulatory switches

[00306] Различные известные из уровня техники регуляторные переключатели на основе малых молекул известны в данной области техники и могут быть скомбинированы с зкДНК-векторами для экспрессии белка FVIII, раскрытыми в данном документе, с получением контролируемого регуляторный переключателем зкДНК-вектора. Согласно некоторым вариантам реализации регуляторный переключатель может быть выбран из чего-либо одного или комбинации следующего: пара ортогональный лиганд/ядерный рецептор, например, вариант ретиноидного рецептора/LG335 и GRQCIMFI, вместе с искусственным промотором, контролирующим экспрессию функционально связанного трансгена, как раскрыто в Taylor et al. ВМС Biotechnology 10 (2010): 15; сконструированные рецепторы стероидов, например, модифицированный рецептор прогестерона с усеченным С-концом, который не может связывать прогестерон, но связывает RU486 (мифепристон) (патент США №5364791); рецептор экдизона дрозофилы (Drosophila) и его экдистероидные лиганды (Saez, et al., PNAS, 97(26)(2000), 14512-14517); или переключатель, контролируемый антибиотиком триметопримом (ТМР), как описано в Sando R 3rd; Nat Methods. 2013, 10(11): 1085-8. Согласно некоторым вариантам реализации регуляторный переключатель для контроля трансгена или экспрессируемый зкДНК-вектором представляет собой переключатель для активации пролекарств, такой как раскрытый в патентах США 8771679 и 6339070.[00306] Various small molecule regulatory switches known in the art are known in the art and can be combined with the cccDNA FVIII protein expression vectors disclosed herein to produce a regulatory switch-controlled cccDNA vector. In some embodiments, the regulatory switch may be selected from any one or combination of the following: an orthogonal ligand/nuclear receptor pair, such as a retinoid receptor variant/LG335 and GRQCIMFI, together with an artificial promoter controlling expression of an operably linked transgene, as disclosed in Taylor et al. BMC Biotechnology 10 (2010): 15; engineered steroid receptors, such as a modified C-terminal truncated progesterone receptor that cannot bind progesterone but binds RU486 (mifepristone) (US Pat. No. 5,364,791); the Drosophila ecdysone receptor and its ecdysteroid ligands (Saez, et al., PNAS, 97(26)(2000), 14512-14517); or a switch controlled by the antibiotic trimethoprim (TMP) as described in Sando R 3 rd ; Nat Methods. 2013, 10(11): 1085-8. In some embodiments, the regulatory switch for controlling the transgene or expressed by the cccDNA vector is a prodrug activation switch, such as disclosed in US Pat. Nos. 8,771,679 and 6,339,070.

(iii) Регуляторные переключатели «с кодом доступа»(iii) Control switches “with access code”

[00307] Согласно некоторым вариантам реализации регуляторный переключатель может представлять собой «переключатель с кодом доступа» или «контур с кодом доступа». Переключатели с кодом доступа позволяют точно настроить контроль экспрессии трансгена с зкДНК-вектора при возникновении конкретных условий, т.е. для осуществления экспрессии и/или репрессии трансгена должна иметься комбинация условий. Например, для осуществления экспрессии трансгена должны возникнуть по меньшей мере условия А и В. Регуляторный переключатель с кодом доступа может представлять собой любое число условий, например, по меньшей мере 2 или по меньшей мере 3, или по меньшей мере 4, или по меньшей мере 5, или по меньшей мере 6, или по меньшей мере 7 или более условий, наличие которых необходимо для осуществления экспрессии трансгена. Согласно некоторым вариантам реализации должны возникнуть по меньшей мере 2 условия (например, условия А, В), а в некоторых вариантах реализации должны возникнуть по меньшей мере 3 условия (например, А, В и С или А, В и D). Только в качестве примера, для осуществления экспрессии гена с зкДНК, содержащей регуляторный переключатель с кодом доступа «АВС», требуется наличие условий А, В и С. Условия А, В и С могут быть следующими; условие А представляет собой наличие состояния или заболевания, условие В представляет собой гормональный ответ, и условие С представляет собой ответ на экспрессию трансгена. Например, если трансген редактирует дефектный ген ЕРО, то условием А является наличие хронической болезни почек (ХБП), условие В осуществляется при наличии гипоксических условий в почках субъекта, условие С заключается в нарушении привлечения эритропоэтин-продуцирующих клеток (ЭПК) в почках; или, альтернативно, в нарушении активации HIF-2. При повышении уровней кислорода или достижении целевого уровня ЕРО трансген снова отключается до момента возникновения 3 условий, которые его опять включат.[00307] In some embodiments, the control switch may be a "passcode switch" or a "passcode circuit." Switches with an access code allow you to fine-tune the control of transgene expression from a cccDNA vector when specific conditions arise, i.e. For expression and/or repression of a transgene to occur, a combination of conditions must be present. For example, at least conditions A and B must occur for transgene expression to occur. The access code regulatory switch may be any number of conditions, such as at least 2 or at least 3 or at least 4 or at least 5, or at least 6, or at least 7 or more conditions, the presence of which is necessary for the expression of the transgene. In some embodiments, at least 2 conditions must occur (eg, conditions A, B), and in some embodiments, at least 3 conditions must occur (eg, A, B, and C or A, B, and D). By way of example only, the expression of a gene with cccDNA containing a regulatory switch with access code "ABC" requires the presence of conditions A, B and C. Conditions A, B and C may be as follows; condition A represents the presence of a condition or disease, condition B represents a hormonal response, and condition C represents a response to transgene expression. For example, if a transgene edits a defective EPO gene, then condition A is the presence of chronic kidney disease (CKD), condition B is the presence of hypoxic conditions in the subject's kidneys, condition C is the presence of impaired recruitment of erythropoietin-producing cells (EPC) to the kidneys; or, alternatively, impaired HIF-2 activation. When oxygen levels rise or a target EPO level is reached, the transgene turns off again until 3 conditions occur that turn it back on.

[00308] Согласно некоторым вариантам реализации регуляторный переключатель с кодом доступа или «контур с кодом доступа», предусмотренный для применения в зкДНК-векторе, содержит гибридные транскрипционные факторы (TF) для расширения диапазона и уровня сложности сигналов окружающей среды, используемых для определения условий биосдерживания. В отличие от блокирующего (deadman) выключателя, который запускает гибель клетки при наличии заранее определенного условия, «контур с кодом доступа» позволяет обеспечить выживание клеток или экспрессию трансгена при наличии конкретного «кода доступа», и может быть легко перепрограммирован, что позволяет обеспечить экспрессию трансгена и/или выживание клеток только при наличии заранее заданного условия окружающей среды или кода доступа.[00308] In some embodiments, a passcode regulatory switch or "passcode circuit" provided for use in a cccDNA vector comprises hybrid transcription factors (TFs) to expand the range and level of complexity of environmental signals used to determine biocontainment conditions . Unlike a deadman switch, which triggers cell death when a predetermined condition is met, a passcode circuit allows for cell survival or transgene expression given a specific passcode, and can be easily reprogrammed to allow expression transgene and/or cell survival only in the presence of a predetermined environmental condition or access code.

[00309] Любые и все комбинации регуляторных переключателей, раскрытых в данном документе, например, низкомолекулярные переключатели, переключатели на основе нуклеиновых кислот, гибридные переключатели на основе малых молекул и нуклеиновых кислот, посттранскрипционные регуляторные переключатели трансгенов, посттрансляционная регуляция, контролируемые излучением переключатели, опосредуемые гипоксией переключатели и другие регуляторные переключатели, известные специалистам в данной области техники, раскрытые в данном документе, могут применяться в регуляторном переключателе с кодом доступа, как раскрыто в данном документе. Регуляторные переключатели, предусмотренные для применения, также обсуждаются в обзорной статье Kis et al., JR Soc Interface. 12: 20141000 (2015) и обобщены в Таблице 1 статьи Kis. Согласно некоторым вариантам реализации регуляторный переключатель для применения в системе с кодом доступа может быть выбран из любых переключателей или их комбинации, раскрытых в Таблице 11 международной заявки на патент PCT/US18/49996, которая полностью включена в данный документ посредством ссылки.[00309] Any and all combinations of regulatory switches disclosed herein, e.g., small molecule switches, nucleic acid-based switches, small molecule-nucleic acid hybrid switches, post-transcriptional transgene regulatory switches, post-translational regulation, radiation-controlled switches, hypoxia-mediated switches switches and other control switches known to those skilled in the art disclosed herein may be used in a passcode control switch as disclosed herein. Regulatory switches provided for the application are also discussed in the review article by Kis et al., JR Soc Interface. 12: 20141000 (2015) and summarized in Table 1 of the Kis paper. In some embodiments, the control switch for use in the passcode system may be selected from any of the switches or combination thereof disclosed in Table 11 of International Patent Application PCT/US18/49996, which is incorporated herein by reference in its entirety.

(iv) Регуляторные переключатели на основе нуклеиновых кислот для контроля экспрессии трансгена(iv) Nucleic acid-based regulatory switches to control transgene expression

[00310] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК основан на механизме контроля на основе нуклеиновых кислот. Примерные механизмы контроля на основе нуклеиновых кислот известны в данной области техники и предусмотрены для применения. Например, такие механизмы включают рибопереключатели, такие как раскрытые, например, в US 2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, патенте США 9222093 и заявке на европейский патент ЕР288071, и раскрытые в обзорной статье Villa JK et al. Microbiol Spectr. 2018 May; 6(3). Также включены чувствительные к метаболитам транскрипционные биосенсоры, такие как раскрытые в WO2018/075486 и WO2017/147585. Другие известные в данной области техники механизмы, предусмотренные для применения, включают подавление трансгена с применением киРНК или молекулы РНКи (например, miR, кшРНК). Например, зкДНК-вектор может содержать регуляторный переключатель, кодирующий молекулу РНКи, которая комплементарна двум частям трансгена, экспрессируемого зкДНК-вектором. При экспрессии такой РНКи, даже если трансген (например, белок FVIII) экспрессируется зкДНК-вектором, будет происходить его подавление под действием комплементарной молекулы РНКи, а если РНКи не экспрессируется, при экспрессии трансгена (например, белка FVIII) зкДНК-вектором, подавление трансгена под действием РНКи не происходит.[00310] In some embodiments, the regulatory switch for controlling expression of the cccDNA FVIII protein is based on a nucleic acid-based control mechanism. Exemplary nucleic acid-based control mechanisms are known in the art and are contemplated for use. For example, such mechanisms include riboswitches such as those disclosed, for example, in US2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, US patent 9222093 and European patent application EP288071, and disclosed in the review article by Villa JK et al. Microbiol Spectr. May 2018; 6(3). Also included are metabolite-sensitive transcriptional biosensors such as those disclosed in WO2018/075486 and WO2017/147585. Other mechanisms known in the art for use include transgene silencing using siRNA or RNAi molecules (eg, miR, shRNA). For example, the cccDNA vector may contain a regulatory switch encoding an RNAi molecule that is complementary to two parts of the transgene expressed by the cccDNA vector. When such RNAi is expressed, even if a transgene (for example, FVIII protein) is expressed by a cccDNA vector, it will be suppressed by a complementary RNAi molecule, and if RNAi is not expressed, when a transgene (for example, FVIII protein) is expressed by a cccDNA vector, the transgene will be suppressed does not occur under the influence of RNAi.

[00311] Согласно некоторым вариантам реализации регуляторный переключатель представляет собой тканеспецифический самоинактивирующийся регуляторный переключатель, например, раскрытый в US2002/0022018, благодаря чему регуляторный переключатель преднамеренно выключает трансген (например, белок FVIII) в сайте, где в противном случае экспрессия трансгена могла бы быть неблагоприятной. Согласно некоторым вариантам реализации регуляторный переключатель представляет собой обратимую с помощью рекомбиназы систему экспрессии гена, например, раскрытую в US2014/0127162 и патенте США 8324436.[00311] In some embodiments, the regulatory switch is a tissue-specific self-inactivating regulatory switch, such as disclosed in US2002/0022018, whereby the regulatory switch intentionally turns off a transgene (e.g., FVIII protein) at a site where expression of the transgene would otherwise be detrimental . In some embodiments, the regulatory switch is a recombinase-reversible gene expression system, such as those disclosed in US2014/0127162 and US Pat. No. 8,324,436.

(v) Посттранскрипционные и посттрансляционные регуляторные переключатели.(v) Post-transcriptional and post-translational regulatory switches.

[00312] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК-вектором представляет собой систему посттранскрипционной модификации. Например, такой регуляторный переключатель может представлять собой рибопереключатель-аптазим, чувствительный к тетрациклину или теофиллину, раскрытый в US2018/0119156, GB201107768, WO2001/064956A3, патенте ЕР 2707487 и Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et at., Elife. 2016 Nov 2;5. pii: e18858. Согласно некоторым вариантам реализации предусмотрено, что обычный специалист в данной области техники может закодировать как трансген, так и ингибиторную киРНК, которая содержит чувствительный к лиганду аптамер (отрицательный переключатель), в результате чего будет получен положительный переключатель, чувствительный к лиганду.[00312] In some embodiments, the regulatory switch for controlling expression of the FVIII protein by the cDNA vector is a post-transcriptional modification system. For example, such a regulatory switch may be a tetracycline- or theophylline-sensitive aptazyme riboswitch disclosed in US2018/0119156, GB201107768, WO2001/064956A3, EP 2707487 and Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et at., Elife. 2016 Nov 2;5. pii: e18858. In some embodiments, one of ordinary skill in the art can encode both the transgene and an inhibitory siRNA that contains a ligand-sensitive aptamer (negative switch), resulting in a positive ligand-sensitive switch.

(vi) Другие примерные регуляторные переключатели(vi) Other exemplary control switches

[00313] Любой известный регуляторный переключатель может быть использован в зкДНК-векторе для контроля экспрессии белка FVIII зкДНК-вектором, включая переключатели, запускаемые изменениями окружающей среды. Дополнительные примеры включают, но не ограничиваются перечисленными; метод ВОС согласно Suzuki et al., Scientific Reports 8; 10051 (2018); расширение генетического кода и нефизиологическую аминокислоту; контролируемые излучением или контролируемые ультразвуком положительные/отрицательные (on/off) переключатели (см., например, Scott S. et at, Gene Ther. 2000 Jul; 7(13): 1121-5; патенты США 5612318; 5571797; 5770581; 5817636; и WO 1999/025385 Al. Согласно некоторым вариантам реализации регуляторный переключатель контролируется имплантируемой системой, например, раскрытой в патенте США 7840263; US2007/0190028А1, в которой экспрессия гена контролируется одной или более формами энергии, включая электромагнитную энергию, что активирует промоторы, функционально связанные с трансгеном в зкДНК-векторе.[00313] Any known regulatory switch can be used in a cccDNA vector to control expression of the FVIII protein by the cccDNA vector, including switches triggered by environmental changes. Additional examples include, but are not limited to those listed; BOC method according to Suzuki et al., Scientific Reports 8; 10051 (2018); genetic code expansion and non-physiological amino acid; radiation controlled or ultrasonic controlled positive/negative (on/off) switches (see, for example, Scott S. et at, Gene Ther. 2000 Jul; 7(13): 1121-5; US patents 5612318; 5571797; 5770581; 5817636 ; and WO 1999/025385 Al. In some embodiments, the regulatory switch is controlled by an implantable system, for example, disclosed in US Pat. No. 7,840,263; US2007/0190028A1, in which gene expression is controlled by one or more forms of energy, including electromagnetic energy, that activates promoters that functionally associated with the transgene in the cDNA vector.

[00314] Согласно некоторым вариантам реализации регуляторный переключатель, предусмотренный для применения в зкДНК-векторе, представляет собой опосредуемый гипоксией или активируемый стрессом переключатель, например, такой как те, которые раскрыты в WO1999060142A2, патентах США 5834306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, а также элементы FROG, TOAD и NRSE и условно индуцируемые подавляющие элементы, включая элементы ответа на гипоксию (HRE), элементы ответа на воспаление (IRE) и активируемые сдвиговым напряжением элементы (SSAE), например, как раскрыто в патенте США 9394526. Такой вариант реализации можно применять для «включения» экспрессии трансгена с зкДНК-вектора после ишемии или в ишемических тканях и/или в опухолях.[00314] In some embodiments, the regulatory switch provided for use in the cccDNA vector is a hypoxia-mediated or stress-activated switch, such as those disclosed in WO1999060142A2, US Pat. No. 5,834,306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, as well as FROG, TOAD, and NRSE elements and conditionally inducible suppressive elements, including hypoxia response elements (HRE), inflammatory response elements (IRE), and shear stress-activated elements (SSAE), for example, as disclosed in US Pat. No. 9,394,526. Such an embodiment can be used to “turn on” expression of a transgene from a cccDNA vector after ischemia or in ischemic tissues and/or tumors.

(vii) «Аварийные выключатели»(vii) "Emergency switches"

[00315] Другие варианты реализации, описанные в данном документе, относятся к зкДНК-вектору для экспрессии белка FVIII, описанному в данном документе, содержащему аварийный выключатель. «Аварийный выключатель», раскрытый в данном документе, позволяет уничтожить клетку, содержащую указанный зкДНК-вектор, или подвергнуть ее программируемой клеточной гибели в качестве способа окончательного удаления введенного зкДНК-вектора из системы субъекта. Обычный специалист в данной области техники поймет, что применение «аварийных выключателей» в зкДНК-векторах для экспрессии белка FVIII, как правило, будет сопряжено с нацеливанием зкДНК-вектора на ограниченное число клеток, потеря которого является приемлемой для субъекта, или на тип клеток, апоптоз которых желателен (например, на раковые клетки). Во всех аспектах «аварийный выключатель», раскрытый в данном документе, разработан таким образом, чтобы обеспечить быстрое и надежное уничтожение клетки, содержащей зкДНК-вектор, в отсутствие входного сигнала выживания или другого заданного условия. Другими словами, «аварийный выключатель», кодируемый зкДНК-вектором для экспрессии белка FVIII, описанным в данном документе, может ограничивать выживание клетки, содержащей зкДНК-вектор, окружающей средой, задаваемой специфическими входными сигналами. Такие «аварийные выключатели» служат для обеспечения функции биологического сдерживания, если потребуется удалить зкДНК-вектор для экспрессии белка FVIII у субъекта или обеспечить отсутствие экспрессии с него кодируемого белка FVIII.[00315] Other embodiments described herein relate to the cDNA FVIII protein expression vector described herein comprising a kill switch. The "kill switch" disclosed herein allows the cell containing the specified cccDNA vector to be destroyed or subjected to programmed cell death as a method of permanently removing the introduced cccDNA vector from the subject's system. One of ordinary skill in the art will appreciate that the use of "kill switches" in cccDNA vectors for FVIII protein expression will typically involve targeting the cccDNA vector to a limited number of cells that the subject can tolerate losing, or to a cell type apoptosis of which is desired (for example, on cancer cells). In all aspects, the “kill switch” disclosed herein is designed to provide rapid and reliable killing of a cell containing the cccDNA vector in the absence of a survival input or other specified condition. In other words, the “safety switch” encoded by the cccDNA vector for expression of the FVIII protein described herein may limit the survival of the cell containing the ccDNA vector to an environment defined by specific input signals. Such “kill switches” serve to provide a biological containment function should the cDNA vector for FVIII protein expression be removed from a subject or ensure that it does not express the encoded FVIII protein.

[00316] Другие «аварийные выключатели», известные обычному специалисту в данной области техники, предусмотрены для применения в зкДНК-векторе для экспрессии белка FVIII, раскрытом в данном документе, например, как раскрыто в US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, а также «аварийные выключатели», раскрытые в Jusiak et al., Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; и в Reinshagen et al, Science Translational Medicine, 2018, 11.[00316] Other “kill switches” known to one of ordinary skill in the art are provided for use in the cDNA FVIII protein expression vector disclosed herein, for example, as disclosed in US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, as well as the “kill switches” disclosed in Jusiak et al., Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; and in Reinshagen et al, Science Translational Medicine, 2018, 11.

[00317] Соответственно, согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может содержать конструкцию нуклеиновой кислоты «аварийного выключателя», которая содержит нуклеиновую кислоту, кодирующую эффекторный токсин или репортерный белок, причем экспрессия эффекторного токсина (например, белка смерти) или репортерного белка контролируется с помощью заранее заданного условия. Например, предварительно заданным условием может быть наличие агента окружающей среды, такого как, например, экзогенный агент, без которого клетка по умолчанию будет экспрессировать эффекторный токсин (например, белок смерти) и будет уничтожена. Согласно альтернативным вариантам реализации предварительно заданным условием является наличие двух или более агентов окружающей среды, например, клетка будет выживать только при подаче двух или более необходимых экзогенных агентов, и без какого-либо из них клетка, содержащая зкДНК-вектор, уничтожается.[00317] Accordingly, in some embodiments, the cccDNA vector for expression of the FVIII protein may comprise a "kill switch" nucleic acid construct that contains a nucleic acid encoding an effector toxin or reporter protein, wherein expression of the effector toxin (e.g., death protein) or reporter The protein is controlled using a predefined condition. For example, a predetermined condition may be the presence of an environmental agent, such as, for example, an exogenous agent, without which the cell will by default express an effector toxin (eg, a death protein) and be killed. In alternative embodiments, the predetermined condition is the presence of two or more environmental agents, for example, the cell will survive only when supplied with two or more required exogenous agents, and without any of them, the cell containing the cccDNA vector is destroyed.

[00318] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII модифицируют для включения «аварийного выключателя» для разрушения клеток, содержащих указанный зкДНК-вектор, для эффективной остановки экспрессии in vivo трансгена, экспрессируемого указанным зкДНК-вектором (например, экспрессии белка FVIII). В частности, зкДНК-вектор дополнительно генетически сконструирован для экспрессии белка-переключателя, который не функционирует в клетках млекопитающих в нормальных физиологических условиях. Клетки, экспрессирующие белок-переключатель, будут разрушены только после введения лекарственного средства или воздействия условия окружающей среды, специфически нацеленных на указанный белок-переключатель, что остановит экспрессию терапевтического белка или пептида. Например, сообщалось, что клетки, экспрессирующие тимидинкиназу HSV, могут быть уничтожены при введении таких лекарственных средств как ганцикловир и цитозиндезаминаза. См., например, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), в Targets in Gene Therapy, под редакцией You (2011); и Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999). Согласно некоторым вариантам реализации зкДНК-вектор может содержать «аварийный выключатель» на основе киРНК, называемый DISE (гибель, индуцируемая устранением гена выживания, «Death Induced by Survival gene Elimination») (Murmann et al., Oncotarget. 2017; 8:84643-84658. Induction of DISE in ovarian cancer cells in vivo).[00318] In some embodiments, the cccDNA FVIII protein expression vector is modified to include a "safety switch" to destroy cells containing the cccDNA vector to effectively stop in vivo expression of a transgene expressed by the cccDNA vector (e.g., FVIII protein expression ). Specifically, the cccDNA vector is further genetically engineered to express a switch protein that does not function in mammalian cells under normal physiological conditions. Cells expressing a switch protein will only be destroyed upon administration of a drug or exposure to an environmental condition that specifically targets said switch protein, stopping expression of the therapeutic protein or peptide. For example, it has been reported that cells expressing HSV thymidine kinase can be killed by administration of drugs such as ganciclovir and cytosine deaminase. See, for example, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), in Targets in Gene Therapy, edited by You (2011); and Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699–8704 (1999). In some embodiments, the cccDNA vector may contain a siRNA-based “kill switch” called DISE (Death Induced by Survival Gene Elimination) (Murmann et al., Oncotarget. 2017;8:84643- 84658. Induction of DISE in ovarian cancer cells in vivo).

VI. Подробное описание способа получения зкДНК-вектораVI. Detailed description of the method for obtaining the cDNA vector

А. Получение в целомA. Receipt in general

[00319] Некоторые способы получения зкДНК-вектора для экспрессии белка FVIII, содержащего пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, описаны в разделе IV международной заявки PCT/US18/49996, поданной 7 сентября 2018 г., которая полностью включена в данный документ посредством ссылки. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с использованием клеток насекомых, как описано в данном документе. Согласно альтернативным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен синтетическим способом и, в некоторых вариантах реализации, бесклеточным способом, как раскрыто в международной заявке PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки.[00319] Certain methods for producing a cccDNA vector for expressing an FVIII protein containing an asymmetric ITR pair or a symmetric ITR pair as defined herein are described in section IV of international application PCT/US18/49996, filed September 7, 2018, which is fully incorporated herein by reference. In some embodiments, the cDNA FVIII protein expression vector disclosed herein can be produced using insect cells as described herein. In alternative embodiments, the cDNA FVIII protein expression vector disclosed herein can be produced synthetically and, in some embodiments, cell-free, as disclosed in international application PCT/US19/14122, filed January 18, 2019. which is incorporated herein by reference in its entirety.

[00320] Как описано в данном документе, согласно одному варианту реализации, зкДНК-вектор для экспрессии белка FVIII может быть получен, например, с помощью способа, включающего этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в atca agcacaacat и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR для продуцирования зкДНК-вектора в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, такое как присутствующее в естественных условиях в ААВ-векторах или других вирусных векторах.[00320] As described herein, in one embodiment, a cccDNA vector for expression of the FVIII protein can be produced, for example, by a method comprising the steps of: a) incubating a population of host cells (e.g., insect cells) carrying the polynucleotide an expression construct template (e.g., cccDNA plasmid, ccDNA bacmid, and/or ccDNA baculovirus) lacking viral capsid coding sequences in the presence of Rep protein under conditions effective to induce production of said ccDNA vector in atca agcacaacat and for a period time sufficient for this, while said host cells do not contain sequences encoding the viral capsid; and b) collecting and isolating the cDNA vector from the host cells. The presence of the Rep protein induces replication of the ITR-modified vector polynucleotide to produce a cccDNA vector in the host cell. However, viral particles (eg, AAV virions) are not expressed. Thus, there is no size limitation such as is present naturally in AAV vectors or other viral vectors.

[00321] Присутствие зкДНК-вектора, выделенного из клеток-хозяев, может быть подтверждено путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на неденатурирующем геле для подтверждения присутствия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.[00321] The presence of a cDNA vector isolated from host cells can be confirmed by digesting DNA isolated from a host cell with a restriction enzyme having a single recognition site on the cDNA vector and analyzing the digested DNA material on a non-denaturing gel for confirmation the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA.

[00322] Согласно еще одному аспекту настоящего изобретения предложено применение линий клеток-хозяев, имеющих стабильно интегрированную в собственный геном полинуклеотидную матрицу для экспрессии ДНК-вектора (зкДНК-матрицу), в получении невирусного ДНК-вектора, например, как описано в Lee, L. et al. (2013) Plos One 8(8): e69879. Предпочтительно Rep добавляют к клеткам-хозяевам при MOI равной примерно 3. Когда линия клеток-хозяев представляет собой линию клеток млекопитающего, например, клетки НЕК293, линии клеток могут иметь стабильно интегрированную полинуклеотидную матрицу вектора, и второй вектор, такой как вирус герпеса, может использоваться для введения в клетки белка Rep, что позволяет вырезать и амплифицировать зкДНК в присутствии Rep и вспомогательного вируса.[00322] According to another aspect of the present invention, the use of host cell lines having a polynucleotide template for expression of a DNA vector (ccDNA template) stably integrated into its genome in the production of a non-viral DNA vector, for example, as described in Lee, L et al. (2013) Plos One 8(8): e69879. Preferably, Rep is added to host cells at an MOI of about 3. When the host cell line is a mammalian cell line, such as HEK293 cells, the cell lines may have a stably integrated vector polynucleotide array, and a second vector, such as a herpes virus, may be used to introduce Rep protein into cells, allowing cctDNA to be excised and amplified in the presence of Rep and a helper virus.

[00323] Согласно одному варианту реализации клетки-хозяева, используемые для получения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, представляют собой клетки насекомых, и для доставки как полинуклеотида, который кодирует белок Rep, так и полинуклеотидной матрицы экспрессионной конструкции невирусного ДНК-вектора для зкДНК используют бакуловирус, например, согласно описанию на ФИГ. 4А-4С и в Примере 1. Согласно некоторым вариантам реализации клетку-хозяина конструируют так, чтобы она экспрессировала белок Rep.[00323] In one embodiment, the host cells used to produce the cccDNA FVIII protein expression vectors described herein are insect cells, and to deliver both the polynucleotide that encodes the Rep protein and the polynucleotide template of the nonviral expression construct The DNA vector for cccDNA uses a baculovirus, for example, as described in FIG. 4A-4C and Example 1. In some embodiments, the host cell is engineered to express the Rep protein.

[00324] Затем зкДНК-вектор собирают и выделяют из клеток-хозяев. Время сбора и извлечения зкДНК-векторов, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Согласно одному варианту реализации клетки культивируют в достаточных условиях и собирают через достаточное время после инфекции бакуловирусом, чтобы получить зкДНК-векторы, но до начала гибели большинства клеток из-за токсичности бакуловируса. ДНК-векторы могут быть выделены с применением наборов для очистки плазмид, таких как не содержащие эндотоксинов наборы для выделения плазмид (Endo-Free Plasmid Kits) от Qiagen. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для ДНК-векторов. Обычно могут быть использованы любые способы очистки нуклеиновых кислот.[00324] The cccDNA vector is then collected and isolated from the host cells. The timing of collection and recovery of the cccDNA vectors described herein from cells can be selected and optimized to achieve high yield production of said cccDNA vectors. For example, the collection time may be selected based on cell viability, cell morphology, cell proliferation, etc. In one embodiment, the cells are cultured under sufficient conditions and harvested sufficiently after infection with the baculovirus to produce cccDNA vectors, but before the majority of cells begin to die due to toxicity of the baculovirus. DNA vectors can be isolated using plasmid purification kits, such as endotoxin-free Plasmid Kits from Qiagen. Other methods developed for isolating plasmids can also be adapted for DNA vectors. Generally, any method for purifying nucleic acids can be used.

[00325] ДНК-векторы могут быть очищены с помощью любых способов очистки ДНК, известных специалистам в данной области техники. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.[00325] DNA vectors can be purified using any DNA purification methods known to those skilled in the art. In one embodiment, the cDNA vectors are purified as DNA molecules. In another embodiment, cccDNA vectors are purified as exosomes or microparticles.

[00326] Наличие зкДНК-вектора для экспрессии белка FVIII может быть подтверждено путем расщепления векторной ДНК, выделенной из клеток, рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, и анализа как расщепленного, так и нерасщепленного ДНК-материала с использованием гель-электрофореза, чтобы подтвердить наличие характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК. ФИГ. 4С и ФИГ. 4D иллюстрируют один вариант реализации для идентификации наличия зкДНК-векторов с замкнутыми концами, продуцируемых с помощью способов, описанных в данном документе.[00326] The presence of a cccDNA vector for FVIII protein expression can be confirmed by digesting vector DNA isolated from cells with a restriction enzyme having a single recognition site on the DNA vector and analyzing both digested and undigested DNA material using a gel. electrophoresis to confirm the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA. FIG. 4C and FIG. 4D illustrates one embodiment for identifying the presence of closed-end cccDNA vectors produced using the methods described herein.

В. зкДНК-плазмидаB. cDNA plasmid

[00327] ЗкДНК-плазмида представляет собой плазмиду, используемую для последующего получения зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-плазмида может быть сконструирована с использованием известных методик, чтобы обеспечить по меньшей мере элементы, перечисленные далее, в виде функционально связанных компонентов в направлении транскрипции: (1) модифицированную последовательность 5'-ITR; (2) экспрессионную кассету, содержащую цис-регуляторный элемент, например, промотор, индуцируемый промотор, регуляторный переключатель, энхансеры и т.п.; и (3) модифицированную последовательность 3'-ITR, причем указанная последовательность 3'-ITR симметрична относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации экспрессионная кассета, фланкированная ITR, содержит сайт клонирования для введения экзогенной последовательности. Экспрессионная кассета заменяет области, кодирующие rep и cap, геномов ААВ.[00327] A cccDNA plasmid is a plasmid used to subsequently obtain a ccDNA vector for expression of the FVIII protein. In some embodiments, the cccDNA plasmid can be constructed using known techniques to provide at least the following elements as operably linked components in the direction of transcription: (1) a modified 5'-ITR sequence; (2) an expression cassette containing a cis-regulatory element, for example, a promoter, an inducible promoter, a regulatory switch, enhancers, and the like; and (3) a modified 3'-ITR sequence, wherein said 3'-ITR sequence is symmetrical with respect to the 5'-ITR sequence. In some embodiments, the ITR-flanked expression cassette contains a cloning site for introducing an exogenous sequence. The expression cassette replaces the rep and cap coding regions of the AAV genomes.

[00328] Согласно одному аспекту зкДНК-вектор для экспрессии белка FVIII получают из плазмиды, называемой в данном документе «зкДНК-плазмидой», кодирующей, в указанном порядке: первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), экспрессионную кассету, содержащую трансген, и мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ. Согласно альтернативным вариантам реализации зкДНК-плазмида кодирует, в указанном порядке: первый (или 5) модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные 5'- и 3'-ITR являются симметричными по отношению друг к другу. Согласно альтернативным вариантам реализации зкДНК-плазмид а кодирует, в указанном порядке: первый (или 5') модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмид а лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные модифицированные 5'- и 3'-ITR имеют одинаковые модификации (т.е. они являются обратно комплементарными или симметричными по отношению друг к другу).[00328] In one aspect, a cccDNA vector for expression of the FVIII protein is derived from a plasmid, referred to herein as a "ccDNA plasmid", encoding, in this order: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), an expression cassette containing a transgene, and a mutated or modified AAV ITR, wherein said cDNA plasmid lacks sequences encoding the AAV capsid protein. In alternative embodiments, the cccDNA plasmid encodes, in that order: a first (or 5') modified or mutated AAV ITR, an expression cassette containing the transgene, and a second (or 3') modified AAV ITR, wherein said ccDNA plasmid lacks sequences encoding AAV capsid protein, and wherein said 5'- and 3'-ITRs are symmetrical with respect to each other. In alternative embodiments, ccDNA plasmid a encodes, in this order: a first (or 5') modified or mutated AAV ITR, an expression cassette containing a transgene, and a second (or 3') mutated or modified AAV ITR, wherein said ccDNA plasmid a is devoid of sequences encoding the AAV capsid protein, and wherein said modified 5' and 3' ITRs have the same modifications (ie, they are reverse complementary or symmetrical to each other).

[00329] Согласно дополнительному варианту реализации система зкДНК-плазмиды лишена последовательностей, кодирующих вирусный капсидный белок (т.е. лишена генов капсида ААВ, а также генов капсидов других вирусов). Кроме того, согласно конкретному варианту реализации зкДНК-плазмида также лишена последовательностей, кодирующих белок Rep ААВ. Соответственно, в предпочтительном варианте реализации зкДНК-плазмида лишена функциональных генов cap ААВ и rep ААВ, GG-3' для ААВ2, а также вариабельной палиндромной последовательности, обеспечивающей образование шпильки.[00329] In a further embodiment, the cDNA plasmid system is devoid of viral capsid protein coding sequences (i.e., devoid of AAV capsid genes as well as capsid genes of other viruses). In addition, in a particular embodiment, the cccDNA plasmid also lacks sequences encoding the AAV Rep protein. Accordingly, in a preferred embodiment, the ccDNA plasmid lacks the functional AAB cap and AAV rep genes, GG-3' for AAV2, and the variable palindromic sequence that provides hairpin formation.

[00330] ЗкДНК-плазмида согласно настоящему изобретению может быть получена с использованием природных нуклеотидных последовательностей из геномов любых серотипов ААВ, хорошо известных в данной области техники. Согласно одному варианту реализации остов зкДНК-плазмиды происходит из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; из указателя вирусов Kotin and Smith («The Springer Index of Viruses»), доступного по ссылке, поддерживаемой Springer (веб-адрес: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (примечание: ссылки на указатель URL или базу данных подразумевают содержание доступного по ссылке ресурса URL или базы данных на фактическую дату подачи данной заявки). В конкретном варианте реализации остов зкДНК-плазмиды происходит из генома ААВ2. В другом конкретном варианте реализации остов зкДНК-плазмиды представляет собой синтетический остов, генетически сконструированный для включения на его 5'- и 3-концах ITR, происходящих из одного из указанных геномов ААВ.[00330] The cDNA plasmid of the present invention can be obtained using natural nucleotide sequences from the genomes of any AAV serotypes well known in the art. In one embodiment, the cccDNA plasmid backbone is derived from the genome of AAB1, AAB2, AAB3, AAB4, AAB5, AAB5, AAB7, AAB8, AAB9, AAB10, AAB11, AAB12, AABrh8, AABrh10, AAB-DJ, and AAB-DJ8. For example, NCBI: NC 002077; NC001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; from the Kotin and Smith virus index ("The Springer Index of Viruses"), available at a link maintained by Springer (web address: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (note: links URL or database refers to the contents of the URL or database available from the link as of the actual filing date of this application). In a specific embodiment, the cDNA plasmid backbone is derived from the AAB2 genome. In another specific embodiment, the cDNA plasmid backbone is a synthetic backbone genetically engineered to include at its 5' and 3 ends ITRs derived from one of the AAV genomes.

[00331] ЗкДНК-плазмида необязательно может включать селектируемый или селективный маркер для использования при создании линии клеток, продуцирующей зкДНК-вектор. Согласно одному варианту реализации селективный маркер может быть вставлен после (т.е. в 3'-направлении) последовательности 3'-ITR. Согласно другому варианту реализации селективный маркер может быть вставлен перед (т.е. в 5'-направлении) последовательностью 5'-ITR. Подходящие селективные маркеры включают, например, маркеры, придающие устойчивость к лекарственному средству. Селективные маркеры могут представлять собой, например, гены устойчивости к бластицидину S, канамицину, генетицину и т.п. Согласно предпочтительному варианту реализации селективный маркер для отбора по чувствительности к лекарственному средству представляет собой ген устойчивости к бластицидину S.[00331] The cccDNA plasmid may optionally include a selectable or selectable marker for use in creating a cell line that produces the ccDNA vector. In one embodiment, the selectable marker may be inserted after (ie, in the 3' direction) the 3' ITR sequence. In another embodiment, the selectable marker may be inserted upstream (ie, in the 5' direction) of the 5' ITR sequence. Suitable selectable markers include, for example, markers that confer drug resistance. Selectable markers may be, for example, resistance genes to blasticidin S, kanamycin, geneticin, and the like. In a preferred embodiment, the selectable marker for selecting for drug sensitivity is a blasticidin S resistance gene.

[00332] Примерный зкДНК-вектор (например, рААВО) для экспрессии белка FVIII получают из плазмиды рААВ. Способ получения рААВ-вектора может включать: (а) доставку в клетку-хозяина плазмиды рААВ, как описано выше, при этом как клетка-хозяин, так и плазмида лишены генов, кодирующих капсидный белок, (b) культивирование клетки-хозяина в условиях, обеспечивающих продуцирование генома зкДНК; и (с) сбор клеток и выделение генома ААВ, продуцированного из указанных клеток.[00332] An exemplary cccDNA vector (eg, pAABO) for expression of the FVIII protein is derived from the pAAB plasmid. A method for producing a rAAV vector may include: (a) delivering the rAAV plasmid to a host cell as described above, wherein both the host cell and the plasmid are deprived of genes encoding the capsid protein, (b) culturing the host cell under conditions ensuring the production of the cDNA genome; and (c) collecting cells and isolating the AAV genome produced from said cells.

C. Примерный способ получения зкДНК-векторов из зкДНК-плазмидC. Exemplary Method for Producing cccDNA Vectors from ccDNA Plasmids

[00333] В данном документе также предложены способы получения бескапсидных зкДНК-векторов для экспрессии белка FVIII, в частности, способ с достаточно высоким выходом для обеспечения достаточного количества вектора для экспериментов in vivo.[00333] This document also provides methods for producing capsidless cccDNA vectors for expression of the FVIII protein, in particular a method with sufficiently high yield to provide sufficient quantities of vector for in vivo experiments.

[00334] Согласно некоторым вариантам реализации способ получения зкДНК-вектора для экспрессии белка FVIII включает следующие этапы: (1) введение конструкции нуклеиновой кислоты, содержащей экспрессионную кассету и последовательности двух симметричных ITR, в клетку-хозяина (например, клетки Sf9), (2) необязательно создание клональной линии клеток, например, с применением селективного маркера, присутствующего на плазмиде, (3) введение кодирующего Rep гена (либо путем трансфекции, либо инфекции бакуловирусом, несущим указанный ген) в указанную клетку насекомого; и (4) сбор клеток и очистку зкДНК-вектора. Конструкция нуклеиновой кислоты, содержащая экспрессионную кассету и последовательности двух ITR, описанная выше для получения зкДНК-вектора, может иметь форму зкДНК-плазмиды или бакмиды, или бакуловируса, полученных с использованием зкДНК-плазмиды, как описано ниже. Конструкция нуклеиновой кислоты может быть введена в клетку-хозяина путем трансфекции, вирусной трансдукции, стабильной интеграции или других способов, известных в данной области техники.[00334] In some embodiments, a method for producing a cccDNA vector for expressing an FVIII protein includes the following steps: (1) introducing a nucleic acid construct containing an expression cassette and two symmetrical ITR sequences into a host cell (e.g., Sf9 cells), (2 ) optionally creating a clonal cell line, for example, using a selectable marker present on a plasmid, (3) introducing a gene encoding Rep (either by transfection or infection with a baculovirus carrying said gene) into said insect cell; and (4) cell collection and cDNA vector purification. The nucleic acid construct containing the expression cassette and two ITR sequences described above to produce the cccDNA vector may be in the form of a ccDNA plasmid or bacmid or baculovirus produced using a ccDNA plasmid as described below. The nucleic acid construct can be introduced into a host cell by transfection, viral transduction, stable integration, or other methods known in the art.

D. Линии клетокD. Cell lines

[00335] Линии клеток-хозяев, используемые в получении зкДНК-вектора для экспрессии белка FVIII, могут включать линии клеток насекомых, происходящие из Spodoptera frugiperda, такие как клетки Sf9, Sf21, или клетки Trichoplusia ni, или линии клеток других беспозвоночных животных, позвоночных животных или других эукариотов, включая клетки млекопитающих. Также могут быть использованы другие линии клеток, известные обычному специалисту в данной области техники, такие как HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1 180, моноциты, а также зрелые и незрелые дендритные клетки. Линии клеток-хозяев могут быть трансфицированы для стабильной экспрессии зкДНК-плазмиды для получения зкДНК-вектора с высоким выходом.[00335] The host cell lines used in the production of the cccDNA vector for expression of the FVIII protein may include insect cell lines derived from Spodoptera frugiperda, such as Sf9, Sf21 cells, or Trichoplusia ni cells, or cell lines of other invertebrate animals, vertebrates animals or other eukaryotes, including mammalian cells. Other cell lines known to one of ordinary skill in the art may also be used, such as HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1 180, monocytes, as well as mature and immature dendritic cells. Host cell lines can be transfected to stably express the cccDNA plasmid to obtain a cccDNA vector with high yield.

[00336] ЗкДНК-плазмиды могут быть введены в клетки Sf9 путем кратковременной трансфекции с использованием реагентов (например, липосомальных, фосфата кальция) или физических средств (например, электропорации), известных в данной области техники. В качестве альтернативы, могут быть созданы стабильные линии клеток Sf9 с зкДНК-плазмидой, стабильно интегрированной в их геномы. Такие стабильные линии клеток могут быть созданы путем включения селективного маркера в зкДНК-плазмиду согласно описанию выше. Если зкДНК-плазмида, используемая для трансфекции линии клеток, включает селективный маркер, например, для антибиотика, клетки, которые были трансфицированы зкДНК-плазмидой и интегрировали ДНК зкДНК-плазмиды в их геном, могут быть отобраны путем добавления антибиотика в среды для культивирования клеток. Затем устойчивые клоны клеток могут быть выделены с помощью методик разведения до получения отдельных клеток или переноса колоний и размножены.[00336] CCDNA plasmids can be introduced into Sf9 cells by transient transfection using reagents (eg, liposomal, calcium phosphate) or physical means (eg, electroporation) known in the art. Alternatively, stable Sf9 cell lines can be generated with the cccDNA plasmid stably integrated into their genomes. Such stable cell lines can be created by incorporating a selectable marker into a cccDNA plasmid as described above. If the cccDNA plasmid used to transfect a cell line includes a selectable marker, for example, for an antibiotic, cells that have been transfected with the ccDNA plasmid and have integrated the ccDNA plasmid DNA into their genome can be selected by adding the antibiotic to the cell culture media. Stable cell clones can then be isolated using single cell dilution or colony transfer techniques and expanded.

Е. Выделение и очистка зкДНК-векторов:E. Isolation and purification of cDNA vectors:

[00337] Примеры способа получения и выделения зкДНК-векторов описаны на ФИГ. 4А-4Е и в конкретных примерах ниже. ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть получены из клеток-продуцентов, экспрессирующих белок (белки) Rep ААВ, дополнительно трансформированных зкДНК-плазмидой, зкДНК-бакмидой или зкДНК-бакуло вирусом. Плазмиды, которые можно применять для получения зкДНК-векторов, включают плазмиды, которые кодируют белок FVIII, или плазмиды, кодирующие один или более белков REP.[00337] Examples of the method for preparing and isolating cccDNA vectors are described in FIG. 4A-4E and in specific examples below. The cDNA FVIII protein expression vectors disclosed herein can be derived from producer cells expressing the AAV Rep protein(s) further transformed with a ccDNA plasmid, a ccDNA bacmid, or a ccDNA baculovirus. Plasmids that can be used to generate cccDNA vectors include plasmids that encode the FVIII protein or plasmids that encode one or more REP proteins.

[00338] Согласно одному аспекту полинуклеотид кодирует белок Rep ААВ (Rep 78 или 68), доставляемый в клетку-продуцент в плазмиде (Rep-плазмиде), бакмиде (Rep-бакмиде) или бакуловирусе (Rep-бакуловирусе). Rep-плазмида, Rep-бакмида и Rep-бакуловирус могут быть получены с помощью способов, описанных выше.[00338] In one aspect, the polynucleotide encodes an AAV Rep protein (Rep 78 or 68) delivered to the producing cell on a plasmid (Rep-plasmid), bacmid (Rep-bacmid), or baculovirus (Rep-baculovirus). Rep plasmid, Rep bacmid and Rep baculovirus can be produced using the methods described above.

[00339] В данном документе описаны способы получения зкДНК-вектора для экспрессии белка FVIII. Экспрессионные конструкции, используемые для получения зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут представлять собой плазмиду (например, зкДНК-плазмиды), бакмиду (например, зкДНК-бакмиду) и/или бакуловирус (например, зкДНК-бакуловирус). В качестве неограничивающего примера, зкДНК-вектор может быть получен из клеток, коинфицированных зкДНК-бакуловирусом и Rep-бакуловирусом. Белки Rep продуцированные с Rep-бакуловируса, могут реплицировать зкДНК-бакуловирус с получением зкДНК-векторов. В качестве варианта, зкДНК-векторы для экспрессии белка FVIII могут быть получены из клеток, стабильно трансфицированных конструкцией, содержащей последовательность, кодирующую белок Rep ААВ (Rep78/52), доставленной в Rep-плазмидах, Rep-бакмидах или Rep-бакуловирусе. зкДНК-бакуловирус может быть кратковременно трансфицирован в клетки, реплицирован с помощью белка Rep и может продуцировать зкДНК-векторы.[00339] Described herein are methods for producing a cDNA vector for the expression of FVIII protein. The expression constructs used to produce the cccDNA vector for expression of the FVIII protein described herein may be a plasmid (e.g., ccDNA plasmids), bacmid (e.g., ccDNA-baculovirus), and/or a baculovirus (e.g., ccDNA-baculovirus). . As a non-limiting example, a cccDNA vector can be obtained from cells coinfected with a cccDNA baculovirus and a Rep baculovirus. Rep proteins produced from Rep baculovirus can replicate cccDNA baculovirus to produce cccDNA vectors. Alternatively, cccDNA vectors for expression of the FVIII protein can be obtained from cells stably transfected with a construct containing the AAV Rep protein coding sequence (Rep78/52) delivered in Rep plasmids, Rep bacmids or Rep baculovirus. The cccDNA baculovirus can be transiently transfected into cells, replicated using the Rep protein, and can produce cccDNA vectors.

[00340] Бакмида (например, зкДНК-бакмида) может быть трансфицирована в пермиссивные клетки насекомых, такие как клетка Sf9, Sf21, Tni (Trichoplusia ni), клетка High Five, и генерировать зкДНК-бакуловирус, который представляет собой рекомбинантный бакуловирус, включающий последовательности, содержащие симметричные ITR и экспрессионную кассету. Клетки насекомых могут быть снова инфицированы зкДНК-бакуловирусом для получения следующего поколения рекомбинантного бакуловируса. Необязательно этап может быть повторен один или более раз для получения большего количества рекомбинантного бакуловируса.[00340] A bacmid (e.g., cccDNA bacmid) can be transfected into permissive insect cells such as Sf9, Sf21, Tni (Trichoplusia ni), High Five cell, and generate a cccDNA baculovirus, which is a recombinant baculovirus including the sequences , containing symmetrical ITRs and an expression cassette. Insect cells can be reinfected with cDNA baculovirus to produce the next generation of recombinant baculovirus. Optionally, the step can be repeated one or more times to obtain more recombinant baculovirus.

[00341] Время сбора и извлечения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Обычно клетки могут быть собраны через период времени после инфекции бакуловирусом, достаточный для получения зкДНК-векторов (например, зкДНК-векторов), но до начала гибели большинства клеток из-за вирусной токсичности. ЗкДНК-векторы могут быть выделены из клеток Sf9 с использованием наборов для очистки плазмид, таких как наборы Qiagen ENDO-FREE PLASMID®. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для зкДНК-векторов. Обычно можно использовать любые известные в данной области техники способы очистки нуклеиновых кислот, а также коммерчески доступные наборы для экстракции ДНК.[00341] The timing of collection and recovery of the cDNA FVIII protein expression vectors described herein from cells can be selected and optimized to achieve high yield production of said ccDNA vectors. For example, the collection time may be selected based on cell viability, cell morphology, cell proliferation, etc. Typically, cells can be collected a period of time after baculovirus infection sufficient to obtain cDNA vectors (e.g., cDNA vectors) but before most cells begin to die due to viral toxicity. CctDNA vectors can be isolated from Sf9 cells using plasmid purification kits such as the Qiagen ENDO-FREE PLASMID ® kits. Other methods developed for plasmid isolation can also be adapted for cDNA vectors. Typically, any nucleic acid purification methods known in the art, as well as commercially available DNA extraction kits, can be used.

[00342] В качестве альтернативы, очистку можно осуществлять путем щелочного лизиса клеточного осадка, центрифугирования полученного лизата и выполнения хроматографического разделения. В качестве одного неограничивающего примера, указанный способ можно выполнять путем загрузки супернатанта на ионообменную колонку (например, SARTOBIND Q®), которая удерживает нуклеиновые кислоты, с последующим элюированием (например, 1,2 М раствором NaCl) и выполнением дальнейшей хроматографической очистки на колонке для гель-фильтрации (например, на 6 Fast Flow GE). Бескапсидный ААВ-вектор затем выделяют, например, путем осаждения.[00342] Alternatively, purification can be accomplished by alkaline lysis of the cell pellet, centrifuging the resulting lysate, and performing chromatographic separation. As one non-limiting example, this method can be performed by loading the supernatant onto an ion exchange column (eg, SARTOBIND ) that retains nucleic acids, followed by elution (eg, 1.2 M NaCl solution) and further chromatographic purification on a column to gel filtration (for example, on 6 Fast Flow GE). The capsidless AAV vector is then isolated, for example, by precipitation.

[00343] Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII также могут быть очищены в форме экзосом или микрочастиц. В данной области техники известно, что многие типы клеток высвобождают не только растворимые белки, но и сложные грузы белок/нуклеиновая кислота путем отделения мембранных микровезикул (Cocucci et al, 2009; ЕР 10306226.1). Такие везикулы включают микровезикулы (также называемые микрочастицами) и экзосомы (также называемые нановезикулами), и первые, и вторые содержат в качестве груза белки и РНК. Микровезикулы образуются в результате прямого отпочковывания плазматической мембраны, а экзосомы высвобождаются во внеклеточную среду при слиянии мультивезикулярных эндосом с плазматической мембраной. Соответственно, содержащие зкДНК-вектор микровезикулы и/или экзосомы могут быть выделены из клеток, трансдуцированных зкДНК-плазмидой или бакмидой, или бакуловирусом, полученным с использованием зкДНК-плазмиды.[00343] In some embodiments, cccDNA vectors for FVIII protein expression may also be purified in the form of exosomes or microparticles. It is known in the art that many cell types release not only soluble proteins, but also complex protein/nucleic acid cargos by shedding membrane microvesicles (Cocucci et al, 2009; EP 10306226.1). Such vesicles include microvesicles (also called microparticles) and exosomes (also called nanovesicles), both of which contain proteins and RNA as cargo. Microvesicles are formed by direct budding of the plasma membrane, and exosomes are released into the extracellular environment upon fusion of multivesicular endosomes with the plasma membrane. Accordingly, cccDNA vector-containing microvesicles and/or exosomes can be isolated from cells transduced with a ccDNA plasmid or bacmid, or with a baculovirus produced using a ccDNA plasmid.

[00344] Микровезикулы могут быть выделены путем фильтрации или ультрацентрифугирования культуральной среды при 20000×g, а экзосомы при 100000×g. Оптимальная продолжительность ультрацентрифугирования может быть определена экспериментально и зависит от конкретного типа клеток, из которых выделяют везикулы. Предпочтительно культуральную среду сначала очищают с помощью низкоскоростного центрифугирования (например, при 2000×g в течение 5-20 минут) и подвергают центробежному концентрированию с использованием, например, центрифужной колонки AMICON® (Millipore, Уотфорд, Великобритания). Микровезикулы и экзосомы могут быть дополнительно очищены с помощью FACS или MACS с использованием специфичных антител, распознающих конкретные поверхностные антигены, присутствующие на микровезикулах и экзосомах. Другие способы очистки микровезикул и экзосом включают, но не ограничиваются перечисленными, иммунопреципитацию, аффинную хроматографию, фильтрацию и магнитные гранулы, покрытые специфичными антителами или аптамерами. После очистки везикулы промывают, например, фосфатно-солевым буфером (ФСБ). Одним из преимуществ использования микровезикул или экзосом для доставки содержащих зкДНК везикул является то, что такие везикулы могут быть нацелены на клетки различных типов путем включения в их мембрану белков, распознаваемых специфическими рецепторами на соответствующих типах клеток. (см. также ЕР 10306226)[00344] Microvesicles can be isolated by filtration or ultracentrifugation of the culture medium at 20,000×g, and exosomes at 100,000×g. The optimal duration of ultracentrifugation can be determined experimentally and depends on the specific cell type from which the vesicles are isolated. Preferably, the culture medium is first clarified by low-speed centrifugation (eg at 2000×g for 5-20 minutes) and subjected to centrifugal concentration using, for example, an AMICON® spin column (Millipore, Watford, UK). Microvesicles and exosomes can be further purified by FACS or MACS using specific antibodies that recognize specific surface antigens present on microvesicles and exosomes. Other methods for purifying microvesicles and exosomes include, but are not limited to, immunoprecipitation, affinity chromatography, filtration, and magnetic beads coated with specific antibodies or aptamers. After purification, the vesicles are washed, for example, with phosphate-buffered saline (PBS). One advantage of using microvesicles or exosomes to deliver cccDNA-containing vesicles is that such vesicles can be targeted to different cell types by incorporating proteins into their membrane that are recognized by specific receptors on the relevant cell types. (see also EP 10306226)

[00345] Другой аспект настоящего изобретения относится к способам очистки зкДНК-векторов из линий клеток-хозяев, которые стабильно интегрировали конструкцию зкДНК в их собственный геном. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.[00345] Another aspect of the present invention relates to methods for purifying cccDNA vectors from host cell lines that have stably integrated the cccDNA construct into their own genome. In one embodiment, the cDNA vectors are purified as DNA molecules. In another embodiment, cccDNA vectors are purified as exosomes or microparticles.

[00346] ФИГ. 5 международной заявки PCT/US18/49996 показывает гель, подтверждающий продуцирование зкДНК из нескольких конструкций зкДНК-плазмид с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4D в Примерах.[00346] FIG. 5 of international application PCT/US18/49996 shows a gel confirming the production of cccDNA from several ccDNA plasmid constructs using the method described in the Examples. The cctDNA vector is confirmed by the characteristic banding profile in the gel, as discussed in relation to FIG. 4D in Examples.

VII. Фармацевтические композицииVII. Pharmaceutical compositions

[00347] Согласно другому аспекту предложены фармацевтические композиции. Фармацевтическая композиция содержит зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, и фармацевтически приемлемый носитель или разбавитель.[00347] In another aspect, pharmaceutical compositions are provided. The pharmaceutical composition contains a cccDNA vector for expression of the FVIII protein described herein and a pharmaceutically acceptable carrier or diluent.

[00348] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтические композиции, пригодные для введения субъекту для in vivo доставки в клетки, ткани или органы субъекта. Как правило, фармацевтическая композиция содержит зкДНК-вектор, раскрытый в данном документе, и фармацевтически приемлемый носитель. Например, зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтическую композицию, подходящую для целевого пути терапевтического введения (например, парентерального введения). Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция. Фармацевтические композиции для терапевтических целей могут быть изготовлены в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации, включая зкДНК-вектор, который может быть изготовлен для доставки трансгена в нуклеиновой кислоте в клетки реципиента, что приводит к терапевтической экспрессии в них трансгена или донорной последовательности. Композиция также может включать фармацевтически приемлемый носитель.[00348] The cDNA FVIII protein expression vectors described herein can be included in pharmaceutical compositions suitable for administration to a subject for in vivo delivery to cells, tissues or organs of the subject. Typically, the pharmaceutical composition contains a cccDNA vector disclosed herein and a pharmaceutically acceptable carrier. For example, the cccDNA vectors for expression of the FVIII protein described herein can be included in a pharmaceutical composition suitable for the intended route of therapeutic administration (eg, parenteral administration). Passive tissue transduction by intravenous or intra-arterial high-pressure infusion, as well as intracellular injection such as intranuclear microinjection or intracytoplasmic injection, is also contemplated. Pharmaceutical compositions for therapeutic purposes can be formulated as a solution, microemulsion, dispersion, liposomes or other ordered structure suitable for high concentration of cccDNA vector. Sterile injection solutions can be prepared by incorporating the cccDNA vector compound in the required amount in an appropriate buffer with one or a combination of the ingredients listed above, if necessary, followed by sterilization by filtration, including the ccDNA vector that can be prepared to deliver the transgene to nucleic acid into recipient cells, which leads to therapeutic expression of a transgene or donor sequence in them. The composition may also include a pharmaceutically acceptable carrier.

[00349] Фармацевтически активные композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, могут быть изготовлены для доставки трансгена для различных целей в клетку, например, в клетки субъекта.[00349] Pharmaceutically active compositions containing a cccDNA vector for expression of the FVIII protein can be formulated to deliver the transgene for various purposes into a cell, for example, into the cells of a subject.

[00350] Фармацевтические композиции для терапевтических целей, как правило, должны быть стерильными и стабильными в условиях изготовления и хранения. Композиция может быть изготовлена в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации.[00350] Pharmaceutical compositions for therapeutic purposes generally must be sterile and stable under the conditions of manufacture and storage. The composition can be formulated as a solution, microemulsion, dispersion, liposome, or other ordered structure suitable for high concentration of cccDNA vector. Sterile injection solutions can be prepared by incorporating the cDNA vector compound in the required amount in an appropriate buffer with one or a combination of the ingredients listed above, if necessary, followed by sterilization by filtration.

[00351] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть включен в фармацевтическую композицию, пригодную для местного, системного, внутриамниотического, интратекального, внутричерепного, внутриартериального, внутривенного, внутрилимфатического, внутрибрюшинного, подкожного, трахеального, внутритканевого (например, внутримышечного, внутрисердечного, внутрипеченочного, внутрипочечного, интрацеребрального), интратекального, интравезикального, конъюнктивального (например, экстраорбитального, интраорбитального, ретроорбитального, интраретинального, субретинального, хориоидального, субхориоидального, интрастромального, интракамерального и интравитреального), интракохлеарного и мукозального (например, перорального, ректального, назального) введения. Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция.[00351] The cDNA FVIII protein expression vector disclosed herein may be included in a pharmaceutical composition suitable for topical, systemic, intra-amniotic, intrathecal, intracranial, intra-arterial, intravenous, intralymphatic, intraperitoneal, subcutaneous, tracheal, interstitial (e.g. , intramuscular, intracardiac, intrahepatic, intrarenal, intracerebral), intrathecal, intravesical, conjunctival (eg, extraorbital, intraorbital, retroorbital, intraretinal, subretinal, choroidal, subchoroidal, intrastromal, intracameral and intravitreal), intracochlear and mucosal (eg, oral, rectal , nasal) administration. Passive tissue transduction by intravenous or intra-arterial high-pressure infusion, as well as intracellular injection such as intranuclear microinjection or intracytoplasmic injection, is also contemplated.

[00352] В некоторых аспектах способы, предложенные в данном документе, включают доставку одного или более зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, в клетку-хозяина. В данном документе также предложены клетки, полученные с помощью таких способов, и организмы (такие как животные, растения или грибы), содержащие или полученные из таких клеток. Способы доставки нуклеиновых кислот могут включать липофекцию, нуклеофекцию, микроинъекцию, биолистику, липосомы, иммунолипосомы, конъюгаты поликатион или липид:нуклеиновая кислота, «незащищенную» ДНК и усиленное агентом поглощение ДНК. Липофекция описана, например, в патентах США №№5049386, 4946787 и 4897355, и реагенты для липофекции продаются коммерчески (например, трансфектам (Transfectam™) и липофектин (Lipofectin™)). Доставка может осуществляться в клетки (например, введение in vitro или ex vivo) или в ткани-мишени (например, введение in vivo).[00352] In some aspects, the methods provided herein include delivering one or more cDNA FVIII protein expression vectors disclosed herein into a host cell. Also provided herein are cells produced by such methods and organisms (such as animals, plants or fungi) containing or derived from such cells. Methods for delivering nucleic acids may include lipofection, nucleofection, microinjection, biolistics, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, bare DNA, and agent-enhanced DNA uptake. Lipofection is described, for example, in US Pat. Nos. 5,049,386, 4,946,787 and 4,897,355, and lipofection reagents are sold commercially (eg, Transfectam™ and Lipofectin™). Delivery may be to cells (eg, in vitro or ex vivo administration) or to target tissues (eg, in vivo administration).

[00353] В данной области техники известны различные методики и способы доставки нуклеиновых кислот в клетки. Например, нуклеиновые кислоты, такие как зкДНК для экспрессии белка FVIII, могут быть изготовлены в виде состава липидных наночастиц (ЛНЧ), липидоидов, липосом, липидных наночастиц, липоплексов или наночастиц типа ядро-оболочка. Как правило, ЛНЧ состоят из молекул нуклеиновой кислоты (например, зкДНК), одного или более ионизируемых или катионных липидов (или их солей), одного или более неионных или нейтральных липидов (например, фосфолипида), молекулы, которая предотвращает агрегацию (например, ПЭГ или конъюгата ПЭГ-липид), и необязательно стерина (например, холестерина).[00353] Various techniques and methods for delivering nucleic acids into cells are known in the art. For example, nucleic acids, such as cccDNA for FVIII protein expression, can be formulated as lipid nanoparticles (LNPs), lipidoids, liposomes, lipid nanoparticles, lipoplexes, or core-shell nanoparticles. Typically, LNPs are composed of a nucleic acid molecule (e.g., cccDNA), one or more ionizable or cationic lipids (or salts thereof), one or more nonionic or neutral lipids (e.g., a phospholipid), a molecule that prevents aggregation (e.g., PEG or a PEG-lipid conjugate), and optionally a sterol (eg cholesterol).

[00354] Другой способ доставки нуклеиновых кислот, таких как зкДНК для экспрессии белка FVIII, в клетку заключается в конъюгации нуклеиновой кислоты с лигандом, который интернализуется клеткой. Например, лиганд может связывать рецептор на поверхности клетки и интернализоваться за счет эндоцитоза. Лиганд может быть ковалентно связан с нуклеотидом в нуклеиновой кислоте. Примерные конъюгаты для доставки нуклеиновых кислот в клетку описаны, например, в WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 и WO2017/177326.[00354] Another method of delivering nucleic acids, such as cccDNA for FVIII protein expression, into a cell is by conjugating the nucleic acid to a ligand that is internalized by the cell. For example, a ligand can bind to a cell surface receptor and be internalized through endocytosis. A ligand may be covalently linked to a nucleotide in a nucleic acid. Exemplary conjugates for delivering nucleic acids into a cell are described, for example, in WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO 2004/090108, WO2004/091515 and WO2017 /177326.

[00355] Нуклеиновые кислоты, такие как зкДНК-векторы для экспрессии белка FVIII, также могут быть доставлены в клетку путем трансфекции. Подходящие способы трансфекции включают, но не ограничиваются перечисленными, опосредуемую липидами трансфекцию, опосредуемую катионным полимером трансфекцию или осаждение фосфатом кальция. Реагенты для трансфекции хорошо известны в данной области техники и включают, но не ограничиваются перечисленными, реагент для трансфекции TurboFect (Thermo Fisher Scientific), реагент Pro-Ject (Thermo Fisher Scientific), реагент для трансфекции белков TRANSPASS™ Р (New England Biolabs), реагент для доставки белков CHARIOT™ (Active Motif), реагент для трансфекции белков PROTEOJUICE™ (EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTIN™ (Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Базель, Швейцария), FUGENE™ HD (Roche), TRANSFECTAM™ (трансфектам, Promega, Мэдисон, Висконсин), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Геркулес, Калифорния), SILENTFECT™ (Bio-Rad), EfFectene™ (Qiagen, Валенсия, Калифорния), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, Сан-Диего, Калифорния), DHARMAFECT 1™ (Dharmacon, Лафайет, Колорадо), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, Сент-Луис, Миссури) и ESCORT™ IV (Sigma Chemical Co.). Нуклеиновые кислоты, такие как зкДНК, также могут быть доставлены в клетку с помощью микроструйных способов, известных специалистам в данной области техники.[00355] Nucleic acids, such as cDNA vectors for FVIII protein expression, can also be delivered into cells by transfection. Suitable transfection methods include, but are not limited to, lipid-mediated transfection, cationic polymer-mediated transfection, or calcium phosphate precipitation. Transfection reagents are well known in the art and include, but are not limited to, TurboFect Transfection Reagent (Thermo Fisher Scientific), Pro-Ject Reagent (Thermo Fisher Scientific), TRANSPASS™ P Protein Transfection Reagent (New England Biolabs), CHARIOT™ Protein Delivery Reagent (Active Motif), PROTEOJUICE™ Protein Transfection Reagent (EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTIN™ (Thermo Fisher Scientific) Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Basel, Switzerland), FUGENE™ HD (Roche), TRANSFECTAM™ (transfectam, Promega, Madison, WI), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Hercules, CA), SILENTFECT™ (Bio-Rad), EfFectene™ ( Qiagen, Valencia, CA), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, San Diego, CA), DHARMAFECT 1™ (Dharmacon, Lafayette, CO), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3 ™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, St. Louis, MO), and ESCORT™ IV (Sigma Chemical Co.). Nucleic acids such as cctDNA can also be delivered into cells using microfluidic techniques known to those skilled in the art.

[00356] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, также можно вводить непосредственно в организм для трансдукции клеток in vivo. Введение осуществляют любым из путей, обычно используемых для приведения молекулы в максимальный контакт с клетками крови или тканей, включая, но не ограничиваясь перечисленными, инъекцию, инфузию, местное нанесение и электропорацию. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области техники, и хотя для введения конкретной композиции можно использовать более одного пути, конкретный путь часто может обеспечить более быструю и более эффективную реакцию по сравнению с другим путем введения.[00356] The cDNA FVIII protein expression vectors described herein can also be administered directly into the body to transduce cells in vivo. Administration is accomplished by any of the routes commonly used to bring the molecule into maximum contact with blood or tissue cells, including, but not limited to, injection, infusion, topical application, and electroporation. Suitable routes for administering such nucleic acids are available and well known to those skilled in the art, and although more than one route may be used to administer a particular composition, a particular route can often provide a faster and more efficient response than another route of administration.

[00357] Способы введения векторной нуклеиновой кислоты, такой как зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут включать доставку в гемопоэтические стволовые клетки, например, с помощью способов, описанных, например, в патенте США №5928638.[00357] Methods of administering a vector nucleic acid, such as the cDNA FVIII protein expression vector disclosed herein, may include delivery to hematopoietic stem cells, for example, using methods described, for example, in US Pat. No. 5,928,638.

[00358] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды. Примерные липосомы и липосомные составы, включая, но не ограничиваясь перечисленными, соединения, содержащие функциональные группы полиэтиленгликоля (ПЭГ), раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и в международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., например, см. раздел, озаглавленный «Фармацевтические составы».[00358] CCDNA vectors for expression of the FVIII protein in accordance with the present invention can be added to liposomes for delivery to a cell or target organ in a subject. Liposomes are vesicles that have at least one lipid bilayer. Liposomes are typically used as carriers for drug/therapeutic delivery in the context of pharmaceutical development. They work by fusing with the cell membrane and rearranging its lipid structure to deliver a drug or active pharmaceutical ingredient (API). Liposomal compositions for such delivery consist of phospholipids, in particular compounds containing a phosphatidylcholine group, however, these compositions may also include other lipids. Exemplary liposomes and liposome formulations, including, but not limited to, compounds containing polyethylene glycol (PEG) functional groups, are disclosed in International Application PCT/US2018/050042, filed September 7, 2018, and International Application PCT/US2018/064242. filed December 6, 2018, for example, see the section entitled “Pharmaceutical Formulations.”

[00359] Различные способы доставки, известные в данной области техники, или их модификации, могут быть использованы для доставки зкДНК-векторов in vitro или in vivo. Например, согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII доставляют, образуя кратковременное отверстие в клеточной мембране с использованием механической, электрической, ультразвуковой, гидродинамической или лазерной энергии так, чтобы облегчить вход ДНК в целевые клетки. Например, зкДНК-вектор может быть доставлен путем кратковременного разрыва клеточной мембраны путем продавливания клетки через канал ограниченного размера или другими способами, известными в данной области техники. В некоторых случаях зкДНК-вектор по отдельности напрямую вводят в виде незащищенной ДНК путем инъекции в любую из: любой одной или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка, кожи, тимуса, сердечной мышцы или скелетной мышцы. В некоторых случаях зкДНК-вектор доставляют с помощью генной пушки. Сферические частицы золота или вольфрама (диаметром 1-3 мкм), покрытые бескапсидными ААВ-векторами, могут быть разогнаны до высокой скорости с помощью сжатого газа для проникновения в клетки целевой ткани.[00359] Various delivery methods known in the art, or modifications thereof, can be used to deliver cccDNA vectors in vitro or in vivo. For example, in some embodiments, cccDNA vectors for FVIII protein expression are delivered by creating a transient hole in the cell membrane using mechanical, electrical, ultrasonic, hydrodynamic, or laser energy so as to facilitate entry of DNA into target cells. For example, the cccDNA vector can be delivered by transiently rupturing the cell membrane by forcing the cell through a channel of limited size or other methods known in the art. In some cases, the cccDNA vector individually is directly administered as unprotected DNA by injection into any of: any one or more tissues selected from: liver, kidney, gallbladder, prostate, adrenal gland, heart, intestine, lung and stomach, skin, thymus, cardiac muscle or skeletal muscle. In some cases, the cccDNA vector is delivered using a gene gun. Spherical gold or tungsten particles (1-3 μm in diameter) coated with capsidless AAV vectors can be accelerated to high speed using compressed gas to penetrate the cells of the target tissue.

[00360] Композиции, содержащие зкДНК-вектор для экспрессии белка FVIII и фармацевтически приемлемый носитель, конкретно предусмотрены в данном документе. Согласно некоторым вариантам реализации зкДНК-вектор изготовлен с липидной системой доставки, например, липосомами, как описано в данном документе. Согласно некоторым вариантам реализации такие композиции вводят любым путем, желательным для квалифицированного специалиста. Композиции могут быть введены субъекту различными путями, включая пероральный, парентеральный, сублингвальный, трансдермальный, ректальный, трансмукозальный, местный, путем ингаляции, путем буккального введения, внутриплевральный, внутривенный, внутриартериальный, внутрибрюшинный, подкожный, внутримышечный, интраназальный, интратекальный и внутрисуставной или их комбинации. Для ветеринарного применения композиция может быть введена в виде достаточно приемлемого состава в соответствии с обычной ветеринарной практикой. Ветеринарный врач может легко определить схему дозирования и путь введения, которые наиболее подходят для конкретного животного. Композиции могут быть ведены с помощью обычных шприцев, безыгольных инъекционных устройств, «генных пушек с бомбардировкой микрочастицами» или других физических методов, таких как электропорация («ЭП»), гидродинамические методы или применение ультразвука.[00360] Compositions comprising a cccDNA vector for expression of the FVIII protein and a pharmaceutically acceptable carrier are specifically provided herein. In some embodiments, the cccDNA vector is formulated with a lipid delivery system, such as liposomes, as described herein. In some embodiments, such compositions are administered by any route desired by a skilled practitioner. The compositions may be administered to a subject by various routes, including oral, parenteral, sublingual, transdermal, rectal, transmucosal, topical, inhalation, buccal, intrapleural, intravenous, intraarterial, intraperitoneal, subcutaneous, intramuscular, intranasal, intrathecal and intraarticular, or combinations thereof. . For veterinary use, the composition may be administered in a reasonably acceptable formulation in accordance with normal veterinary practice. The veterinarian can easily determine the dosage schedule and route of administration that is most appropriate for a particular animal. The compositions can be administered using conventional syringes, needleless injection devices, "microparticle bombardment gene guns" or other physical methods such as electroporation ("EP"), hydrodynamic methods or the use of ultrasound.

[00361] В некоторых случаях зкДНК-вектор для экспрессии белка FVIII доставляют путем гидродинамической инъекции, которая представляет собой простой и высокоэффективный способ прямой внутриклеточной доставки любых водорастворимых соединений и частиц во внутренние органы и скелетные мышцы во всей конечности.[00361] In some cases, the cccDNA vector for FVIII protein expression is delivered by hydrodynamic injection, which provides a simple and highly effective method for direct intracellular delivery of any water-soluble compounds and particles to internal organs and skeletal muscle throughout the limb.

[00362] В некоторых случаях зкДНК-векторы для экспрессии белка FVIII доставляют с помощью ультразвука, создавая наноскопические поры в мембране для облегчения внутриклеточной доставки частиц ДНК в клетки внутренних органов или опухолей, поэтому размер и концентрация плазмидной ДНК имеют большое значение для эффективности системы. В некоторых случаях зкДНК-векторы доставляют путем магнитофекции с использованием магнитных полей для концентрирования частиц, содержащих нуклеиновую кислоту, в клетках-мишенях.[00362] In some cases, cccDNA vectors for FVIII protein expression are delivered by ultrasound, creating nanoscopic pores in the membrane to facilitate intracellular delivery of DNA particles to internal organ or tumor cells, so the size and concentration of plasmid DNA is of great importance to the efficiency of the system. In some cases, cccDNA vectors are delivered by magnetofection, using magnetic fields to concentrate particles containing the nucleic acid into target cells.

[00363] В некоторых случаях могут быть использованы химические системы доставки, например, с использованием наномерных комплексов, которые включают уплотнение отрицательно заряженной нуклеиновой кислоты поликатионными наномерными частицами, в составе катионной липосомы/мицеллы или катионных полимеров. Катионные липиды, используемые в указанном способе доставки, включают, но не ограничиваются перечисленными, моновалентные катионные липиды, поливалентные катионные липиды, гуанидин-содержащие соединения, соединения производных холестерина, катионные полимеры (например, полиэтиленимин, поли-L-лизин, протамин, другие катионные полимеры) и гибриды липид-полимер.[00363] In some cases, chemical delivery systems can be used, for example, using nanometer complexes that involve the compaction of negatively charged nucleic acid with polycationic nanometer particles, in the composition of a cationic liposome/micelle or cationic polymers. Cationic lipids used in this delivery method include, but are not limited to, monovalent cationic lipids, polyvalent cationic lipids, guanidine-containing compounds, cholesterol derivative compounds, cationic polymers (e.g., polyethylenimine, poly-L-lysine, protamine, other cationic polymers) and lipid-polymer hybrids.

А. ЭкзосомыA. Exosomes

[00364] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют упакованным в экзосоме. Экзосомы представляют собой небольшие мембранные везикулы эндоцитарного происхождения, которые высвобождаются во внеклеточную среду после слияния мультивезикулярных телец с плазматической мембраной. Их поверхность состоит из липидного бислоя клеточной мембраны донорной клетки, они содержат цитозоль из клетки, которая продуцировала экзосому, и экспонируют на поверхности мембранные белки родительской клетки. Экзосомы продуцируются различными типами клеток, в том числе эпителиальными клетками, В- и Т-лимфоцитами, тучными клетками (МС), а также дендритными клетками (DC). Согласно некоторым вариантам реализации для применения предусмотрены экзосомы с диаметром от 10 нм до 1 мкм, от 20 нм до 500 нм, от 30 нм до 250 нм, от 50 до 100 нм. Экзосомы могут быть выделены для доставки в целевые клетки либо с использованием их донорных клеток, либо путем введения в них конкретных нуклеиновых кислот. Для получения экзосом, содержащих бескапсидные ААВ-векторы согласно настоящему изобретению, могут быть использованы различные подходы, известные в данной области техники.[00364] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is delivered packaged in an exosome. Exosomes are small membrane vesicles of endocytic origin that are released into the extracellular environment after the fusion of multivesicular bodies with the plasma membrane. Their surface consists of the lipid bilayer of the cell membrane of the donor cell, they contain cytosol from the cell that produced the exosome, and they expose membrane proteins of the parent cell on the surface. Exosomes are produced by various cell types, including epithelial cells, B and T lymphocytes, mast cells (MCs), and dendritic cells (DCs). In some embodiments, exosomes with a diameter of 10 nm to 1 μm, 20 nm to 500 nm, 30 nm to 250 nm, or 50 to 100 nm are provided for use. Exosomes can be isolated for delivery to target cells either by using their donor cells or by introducing specific nucleic acids into them. To obtain exosomes containing capsidless AAV vectors according to the present invention, various approaches known in the art can be used.

В. Микрочастица/наночастицыB. Microparticle/nanoparticles

[00365] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью липидной наночастицы. Обычно липидные наночастицы содержат ионизируемый аминолипид (например, гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат, DLin-MC3-DMA, фосфатидилхолин(1,2-дистеароил-sn-глицеро-3-фосфохолин, DSPC), холестерин и липид оболочки (полиэтиленгликоль-димиристоилглицерин, ПЭГ-ДМГ), например, как раскрыто Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507.[00365] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is delivered via a lipid nanoparticle. Typically, lipid nanoparticles contain an ionizable aminolipid (e.g., heptatriakonta-6,9,28,31-tetraen-19-yl-4-(dimethylamino)butanoate, DLin-MC3-DMA, phosphatidylcholine (1,2-distearoyl-sn-glycero- 3-phosphocholine, DSPC), cholesterol and envelope lipid (polyethylene glycol dimyristoylglycerol, PEG-DMG), for example, as disclosed by Tam et al (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507 .

[00366] Согласно некоторым вариантам реализации липидная наночастица имеет средний диаметр от примерно 10 до примерно 1000 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 10 до примерно 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 200 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 25 до примерно 200 нм. Согласно некоторым вариантам реализации препарат липидных наночастиц (например, композиция, содержащая множество липидных наночастиц) имеет распределение по размерам, при котором средний размер (например, диаметр) составляет от примерно 70 нм до примерно 200 нм, и более типично средний размер составляет примерно 100 нм или менее.[00366] In some embodiments, the lipid nanoparticle has an average diameter of from about 10 nm to about 1000 nm. In some embodiments, the lipid nanoparticle has a diameter of less than 300 nm. In some embodiments, the lipid nanoparticle has a diameter of from about 10 nm to about 300 nm. In some embodiments, the lipid nanoparticle has a diameter of less than 200 nm. In some embodiments, the lipid nanoparticle has a diameter of from about 25 nm to about 200 nm. In some embodiments, the lipid nanoparticle formulation (e.g., a composition containing a plurality of lipid nanoparticles) has a size distribution such that the average size (e.g., diameter) is from about 70 nm to about 200 nm, and more typically the average size is about 100 nm or less.

[00367] Для доставки ДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, могут быть использованы различные липидные наночастицы, известные в данной области техники. Например, различные способы доставки с применением липидных наночастиц описаны в патентах США №№9404127, 9006417 и 9518272.[00367] Various lipid nanoparticles known in the art can be used to deliver the FVIII protein expression DNA vector disclosed herein. For example, various delivery methods using lipid nanoparticles are described in US Patent Nos. 9404127, 9006417 and 9518272.

[00368] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью наночастицы золота. Обычно нуклеиновая кислота может быть ковалентно связана с наночастицей золота или нековалентно связана с наночастицей золота (например, связана заряд-зарядным взаимодействием), например, согласно описанию Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. Согласно некоторым вариантам реализации конъюгаты наночастицы золота с нуклеиновой кислотой получают с использованием способов, описанных, например, в патенте США №6812334.[00368] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is delivered using a gold nanoparticle. Typically, the nucleic acid may be covalently associated with the gold nanoparticle or non-covalently associated with the gold nanoparticle (eg, associated by charge-charge interaction), for example, as described by Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. In some embodiments, gold nanoparticle-nucleic acid conjugates are prepared using methods described, for example, in US Pat. No. 6,812,334.

C. КонъюгатыC. Conjugates

[00369] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован (например, ковалентно связан) с агентом, который увеличивает клеточное поглощение. «Агент, который увеличивает клеточное поглощение» представляет собой молекулу, которая облегчает транспорт нуклеиновой кислоты через липидную мембрану. Например, нуклеиновая кислота может быть конъюгирована с липофильным соединением (например, холестерином, токоферолом и т.д.), проникающим в клетки пептидом (СРР) (например, пенетратином, TAT, Syn1B и т.д.) и полиаминами (например, спермином). Дополнительные примеры агентов, которые увеличивают поглощение клетками, раскрыты, например, в Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.[00369] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated (eg, covalently linked) to an agent that enhances cellular uptake. A "cellular uptake enhancing agent" is a molecule that facilitates the transport of nucleic acid across a lipid membrane. For example, the nucleic acid may be conjugated to a lipophilic compound (e.g., cholesterol, tocopherol, etc.), cell penetrating peptide (CPP) (e.g., penetratin, TAT, Syn1B, etc.), and polyamines (e.g., spermine ). Additional examples of agents that increase cellular uptake are disclosed, for example, in Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.

[00370] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полимером (например, полимерной молекулой) или молекулой фолата (например, молекулой фолиевой кислоты). В целом, доставка нуклеиновых кислот, конъюгированных с полимерами, известна в данной области техники, например, описана в WO2000/34343 и WO2008/022309. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полиамидным полимером, например, согласно описанию в патенте США №8987377. Согласно некоторым вариантам реализации нуклеиновая кислота, описанная в настоящем раскрытии, конъюгирована с молекулой фолиевой кислоты согласно описанию в патенте США №8507455.[00370] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated to a polymer (eg, a polymer molecule) or a folate molecule (eg, a folic acid molecule). In general, delivery of nucleic acids conjugated to polymers is known in the art, for example, described in WO2000/34343 and WO2008/022309. In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated to a polyamide polymer, for example, as described in US Pat. No. 8,987,377. In some embodiments, the nucleic acid described in the present disclosure is conjugated to a folic acid molecule as described in US Pat. No. 8,507,455.

[00371] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с углеводом, например, как описано в патенте США №8450467.[00371] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated to a carbohydrate, for example, as described in US Pat. No. 8,450,467.

D. НанокапсулаD. Nanocapsule

[00372] В качестве альтернативы, могут применяться нанокапсульные составы зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Обычно нанокапсулы могут захватывать вещества стабильным и воспроизводимым образом. Чтобы избежать побочных эффектов, обусловленных внутриклеточной перегрузкой полимерами, такие ультрадисперсные частицы (размером около 0,1 мкм) необходимо конструировать с использованием полимеров, способных разлагаться in vivo. Предусмотрено применение биоразлагаемых полиалкил-цианоакрилатных наночастиц, которые удовлетворяют таким требованиям.[00372] Alternatively, nanocapsule formulations of the cDNA vector for expression of the FVIII protein disclosed herein may be used. Generally, nanocapsules can entrap substances in a stable and reproducible manner. To avoid side effects caused by intracellular polymer overload, such ultrafine particles (about 0.1 μm in size) must be constructed using polymers that can degrade in vivo. The use of biodegradable polyalkyl cyanoacrylate nanoparticles that meet such requirements is envisaged.

E. ЛипосомыE. Liposomes

[00373] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.[00373] CCDNA vectors for expression of FVIII protein in accordance with the present invention can be added to liposomes for delivery to a cell or target organ in a subject. Liposomes are vesicles that have at least one lipid bilayer. Liposomes are typically used as carriers for drug/therapeutic delivery in the context of pharmaceutical development. They work by fusing with the cell membrane and rearranging its lipid structure to deliver a drug or active pharmaceutical ingredient (API). Liposomal compositions for such delivery consist of phospholipids, in particular compounds containing a phosphatidylcholine group, however, these compositions may also include other lipids.

[00374] Изготовление и применение липосом в целом известно специалистам в данной области техники. Были разработаны липосомы с улучшенной стабильностью в сыворотке и временем полужизни в кровотоке (патент США №5741516). Кроме того, были описаны различные способы получения липосом и липосомоподобных препаратов в качестве потенциальных носителей лекарственных средств (патенты США №№5567434; 5552157; 5565213; 5738868 и 5795587).[00374] The preparation and use of liposomes is generally known to those skilled in the art. Liposomes with improved serum stability and circulation half-life have been developed (US Patent No. 5,741,516). In addition, various methods for preparing liposomes and liposome-like preparations as potential drug carriers have been described (US Patent Nos. 5,567,434; 5,552,157; 5,565,213; 5,738,868 and 5,795,587).

F. Примерные композиции липосом и липидных наночастиц (ЛНЧ)F. Exemplary Compositions of Liposomes and Lipid Nanoparticles (LNPs)

[00375] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку, например, в клетку, нуждающуюся в экспрессии трансгена. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.[00375] CCDNA vectors for expression of the FVIII protein in accordance with the present invention can be added to liposomes for delivery into a cell, for example, into a cell in need of transgene expression. Liposomes are vesicles that have at least one lipid bilayer. Liposomes are typically used as carriers for drug/therapeutic delivery in the context of pharmaceutical development. They work by fusing with the cell membrane and rearranging its lipid structure to deliver a drug or active pharmaceutical ingredient (API). Liposomal compositions for such delivery consist of phospholipids, in particular compounds containing a phosphatidylcholine group, however, these compositions may also include other lipids.

[00376] Липидные наночастицы (ЛНЧ), содержащие зкДНК-векторы, раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ, и предусмотрены для применения в способах и композициях зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.[00376] Lipid nanoparticles (LNPs) containing cccDNA vectors are disclosed in International Application PCT/US2018/050042, filed September 7, 2018, and International Application PCT/US2018/064242, filed December 6, 2018, which are fully included herein, and are provided for use in the methods and compositions of cDNA vectors for expression of FVIII protein disclosed herein.

[00377] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который включает одно или более соединений с функциональной группой полиэтиленгликоля (ПЭГ) (так называемых «пегилированных соединений»), которые могут снижать иммуногенность/антигенность, обеспечивать гидрофильность и гидрофобность, а также уменьшать частоту дозирования соединения (соединений). В других случаях, липосомальный состав просто включает полимер полиэтиленгликоль (ПЭГ) в качестве дополнительного компонента. В таких аспектах молекулярная масса ПЭГ или функциональной группы ПЭГ может составлять от 62 Да до примерно 5000 Да.[00377] According to some aspects of the present disclosure, there is provided a liposomal formulation that includes one or more polyethylene glycol (PEG) functional compounds (so-called "PEGylated compounds") that can reduce immunogenicity/antigenicity, provide hydrophilicity and hydrophobicity, and reduce the incidence of dosing the compound(s). In other cases, the liposomal formulation simply includes the polymer polyethylene glycol (PEG) as an additional component. In such aspects, the molecular weight of the PEG or PEG functionality may range from 62 Da to about 5000 Da.

[00378] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который доставит АФИ с профилем пролонгированного или контролируемого высвобождения на протяжении периода времени от нескольких часов до недель. Согласно некоторым родственным аспектам липосомальный состав может содержать водные камеры, которые ограничены липидными бислоями. Согласно другим родственным аспектам липосомальный состав инкапсулирует АФИ с компонентами, которые претерпевают физический переход при повышенной температуре, который высвобождает АФИ в течение периода от нескольких часов до недель.[00378] According to some aspects of the present disclosure, a liposomal formulation is provided that will deliver an API with a sustained or controlled release profile over a period of time ranging from several hours to weeks. In some related aspects, the liposomal formulation may contain aqueous chambers that are limited by lipid bilayers. In other related aspects, the liposomal formulation encapsulates the API with components that undergo a physical transition at elevated temperature that releases the API over a period of hours to weeks.

[00379] Согласно некоторым аспектам липосомальный состав содержит сфингомиелин и один или более липидов, раскрытых в данном документе. Согласно некоторым аспектам липосомальный состав содержит оптисомы.[00379] In some aspects, the liposomal composition contains sphingomyelin and one or more lipids disclosed herein. In some aspects, the liposomal composition contains optisomes.

[00380] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит один или более липидов, выбранных из: натриевой соли N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина, (дистеароил-sn-глицерофосфоэтаноламина), MPEG (метоксиполиэтиленгликоль)-конъюгированного липида, HSPC (гидрогенизированного соевого фосфатидилхолина); ПЭГ (полиэтиленгликоля); DSPE (дистеароил-sn-глицерофосфоэтаноламина); DSPC (дистеароилфосфатидилхолина); DOPC (диолеоилфосфатидилхолина); DPPG (дипальмитоилфосфатидилглицерина); ЕРС (яичного фосфатидилхолина); DOPS (диолеоилфосфатидилсерина); РОРС (пальмитоилолеоилфосфатидилхолина); SM (сфингомиелина); MPEG (метоксиполиэтиленгликоля); DMPC (димиристоилфосфатидилхолина); DMPG (димиристоилфосфатидилглицерина); DSPG (дистеароилфосфатидилглицерина); DEPC (диэрукоилфосфатидилхолина); DOPE (диолеоил-sn-глицерофосфоэтаноламина); сульфата холестерина (CS); дипальмитоилфосфатидилглицерина (DPPG); DOPC (диолеоил-sn-глицерофосфатидилхолина) или любой их комбинации.[00380] According to some aspects of the present disclosure, there is provided a liposomal formulation that contains one or more lipids selected from: N-(carbonylmethoxypolyethylene glycol 2000)-1,2-distearoyl-sn-glycero-3-phosphoethanolamine sodium salt, (distearoyl-sn- glycerophosphoethanolamine), MPEG (methoxypolyethylene glycol)-conjugated lipid, HSPC (hydrogenated soy phosphatidylcholine); PEG (polyethylene glycol); DSPE (distearoyl-sn-glycerophosphoethanolamine); DSPC (distearoylphosphatidylcholine); DOPC (dioleoylphosphatidylcholine); DPPG (dipalmitoylphosphatidylglycerol); EPC (egg phosphatidylcholine); DOPS (dioleoylphosphatidylserine); POPC (palmitoyloleoylphosphatidylcholine); SM (sphingomyelin); MPEG (methoxy polyethylene glycol); DMPC (dimyristoylphosphatidylcholine); DMPG (dimyristoylphosphatidylglycerol); DSPG (distearoylphosphatidylglycerol); DEPC (dierucoylphosphatidylcholine); DOPE (dioleoyl-sn-glycerophosphoethanolamine); cholesterol sulfate (CS); dipalmitoylphosphatidylglycerol (DPPG); DOPC (dioleoyl-sn-glycerophosphatidylcholine) or any combination thereof.

[00381] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий фосфолипид, холестерин и пегилированный липид в молярном соотношении 56:38:5. Согласно некоторым аспектам общее содержание липидов в липосомальном составе составляет 2-16 мг/мл. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид, в молярном соотношении 3:0,015:2, соответственно. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, холестерин и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, и холестерин. Согласно некоторым аспектам пегилированный липид представляет собой ПЭГ-2000-DSPE. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий DPPG, соевый ФХ, липидный конъюгат MPEG-DSPE и холестерин.[00381] According to some aspects of the present disclosure, there is provided a liposomal formulation comprising a phospholipid, cholesterol, and a PEGylated lipid in a molar ratio of 56:38:5. In some aspects, the total lipid content of the liposomal formulation is 2-16 mg/ml. According to some aspects of the present disclosure, there is provided a liposomal composition comprising a phosphatidylcholine-functional lipid, an ethanolamine-functional lipid, and a PEGylated lipid. According to some aspects of the present invention, there is provided a liposomal composition comprising a phosphatidylcholine-functional lipid, an ethanolamine-functional lipid, and a PEGylated lipid in a molar ratio of 3:0.015:2, respectively. According to some aspects of the present invention, there is provided a liposomal composition comprising a lipid containing a phosphatidylcholine functionality, cholesterol and a pegylated lipid. According to some aspects of the present invention, there is provided a liposomal composition comprising a phosphatidylcholine functional group-containing lipid and cholesterol. In some aspects, the PEGylated lipid is PEG-2000-DSPE. According to some aspects of the present disclosure, a liposomal formulation is provided comprising DPPG, soy PC, MPEG-DSPE lipid conjugate and cholesterol.

[00382] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более липидов, содержащих фосфатидилхолиновую функциональную группу, и один или более липидов, содержащих этаноламиновую функциональную группу. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более из: липидов, содержащих фосфатидилхолиновую функциональную группу, липидов, содержащих этаноламиновую функциональную группу, и стеринов, например, холестерина. Согласно некоторым аспектам липосомальный состав содержит DOPC/DEPC; и DOPE.[00382] According to some aspects of the present disclosure, there is provided a liposomal formulation comprising one or more phosphatidylcholine functional group-containing lipids and one or more ethanolamine functional group-containing lipids. According to some aspects of the present disclosure, there is provided a liposomal composition comprising one or more of: phosphatidylcholine-functional lipids, ethanolamine-functional lipids, and sterols, such as cholesterol. In some aspects, the liposomal composition contains DOPC/DEPC; and DOPE.

[00383] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, дополнительно содержащий одно или более фармацевтических вспомогательных веществ, например, сахарозу и/или глицин.[00383] According to some aspects of the present disclosure, a liposomal formulation is provided, further comprising one or more pharmaceutical excipients, for example, sucrose and/or glycine.

[00384] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав с униламеллярной или мультиламеллярной структурой. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит мультивезикулярные частицы и/или частицы на основе пены. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, относительный размер которого больше, чем у обычных наночастиц, и составляет примерно от 150 до 250 нм. Согласно некоторым аспектам липосомальный состав представляет собой лиофилизированный порошок.[00384] According to some aspects of the present disclosure, a liposomal formulation with a unilamellar or multilamellar structure is provided. In accordance with some aspects of the present disclosure, a liposomal formulation is provided that contains multivesicular particles and/or foam-based particles. In some aspects of the present disclosure, a liposomal formulation is provided that has a relative size greater than that of conventional nanoparticles, ranging from about 150 to 250 nm. In some aspects, the liposomal formulation is a lyophilized powder.

[00385] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который получают и нагружают зкДНК-векторами, раскрытыми или описанными в данном документе, путем добавления слабого основания к смеси, содержащей выделенную зкДНК вне липосомы. Такое добавление повышает значение рН вне липосом до приблизительно 7,3 и стимулирует вход АФИ в липосому. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, имеющий кислый рН внутри липосомы. В таких случаях значение рН внутри липосом может составлять 4-6,9 и более предпочтительно рН 6,5. Согласно другим аспектам настоящего раскрытия предложен липосомальный состав, полученный с применением технологии внутрилипосомальной стабилизации лекарственных средств. В таких случаях используют полимерные или неполимерные высокозаряженные анионы и внутрилипосомальные захватывающие агенты, например, полифосфат или октасульфат сахарозы.[00385] According to some aspects of the present disclosure, a liposomal formulation is provided that is prepared and loaded with cccDNA vectors disclosed or described herein by adding a weak base to a mixture containing isolated cccDNA outside a liposome. This addition increases the pH outside the liposomes to approximately 7.3 and stimulates the entry of the API into the liposome. In accordance with some aspects of the present disclosure, a liposomal formulation is provided having an acidic pH within the liposome. In such cases, the pH value within the liposomes may be 4-6.9, and more preferably pH 6.5. According to other aspects of the present disclosure, a liposomal formulation is provided using intraliposomal drug stabilization technology. In such cases, polymeric or non-polymeric highly charged anions and intraliposomal entrapment agents, such as polyphosphate or sucrose octasulfate, are used.

[00386] Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК, полученной с помощью способа, раскрытого в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая включена в данный документ.Это можно осуществлять путем интенсивного смешивания этанольных растворов липидов с водным раствором зкДНК при низком рН, при котором происходит протонирование ионизируемого липида и обеспечиваются благоприятные энергетические характеристики для ассоциации зкДНК/липида и нуклеации частиц. Частицы могут быть дополнительно стабилизированы путем разбавления водой и удаления органического растворителя. Частицы могут быть сконцентрированы до целевого уровня.[00386] In accordance with some aspects of the present disclosure, a lipid nanoparticle is provided comprising cccDNA and an ionizable lipid. For example, a lipid nanoparticle formulation that is prepared and loaded with cccDNA obtained using the method disclosed in international application PCT/US2018/050042, filed September 7, 2018, which is incorporated herein. This can be done by intensively mixing ethanol solutions of lipids with an aqueous solution of ccDNA at a low pH, at which protonation of the ionizable lipid occurs and provides favorable energetic characteristics for ccDNA/lipid association and particle nucleation. The particles can be further stabilized by diluting with water and removing the organic solvent. Particles can be concentrated to a target level.

[00387] Обычно липидные частицы получают при соотношении общего количества липида и зкДНК (массовом или весовом) от примерно 10:1 до 30:1. Согласно некоторым вариантам реализации соотношение липида и зкДНК (массовое соотношение; отношение масс/масс.) может находиться в диапазоне значений от примерно 1:1 до примерно 25:1, от примерно 10:1 до примерно 14:1, от примерно 3:1 до примерно 15:1, от примерно 4:1 до примерно 10:1, от примерно 5:1 до примерно 9:1 или от примерно 6:1 до примерно 9:1. Количества липидов и зкДНК могут быть скорректированы, чтобы обеспечить целевое соотношение N/P, например, соотношение N/P, равное 3, 4, 5, 6, 7, 8, 9, 10 или выше. Обычно общее содержание липидов в составе липидных частиц может быть в диапазоне от примерно 5 мг/мл до примерно 30 мг/мл.[00387] Typically, lipid particles are prepared at a ratio of total lipid to cccDNA (w/w) of about 10:1 to 30:1. In some embodiments, the lipid to cccDNA ratio (mass ratio; w/w ratio) may range from about 1:1 to about 25:1, from about 10:1 to about 14:1, from about 3:1 to about 15:1, from about 4:1 to about 10:1, from about 5:1 to about 9:1, or from about 6:1 to about 9:1. The amounts of lipids and cccDNA can be adjusted to provide a target N/P ratio, for example, an N/P ratio of 3, 4, 5, 6, 7, 8, 9, 10 or higher. Typically, the total lipid content of the lipid particles may range from about 5 mg/ml to about 30 mg/ml.

[00388] Ионизируемый липид, как правило, применяется для конденсации груза нуклеиновой кислоты, например, зкДНК, при низком рН, и для стимуляции ассоциации мембран и их фузогенности. Обычно ионизируемые липиды представляют собой липиды, содержащие по меньшей мере одну аминогруппу, которая положительно заряжена или становится протонированной в кислых условиях, например, при рН 6,5 или ниже. В данном документе ионизируемые липиды также называют катионными липидами.[00388] An ionizable lipid is typically used to condense a nucleic acid cargo, such as cccDNA, at low pH and to promote membrane association and fusogenicity. Typically, ionizable lipids are lipids containing at least one amino group that is positively charged or becomes protonated under acidic conditions, such as pH 6.5 or lower. In this document, ionizable lipids are also referred to as cationic lipids.

[00389] Примерные ионизируемые липиды описаны в международных РСТ публикациях патентов WO 2015/095340, WO 2015/199952, WO 2018/011633, WO 2017/049245, WO 2015/061467, WO 2012/040184, WO 2012/000104, WO 2015/074085, WO 2016/081029, WO 2017/004143, WO 2017/075531, WO 2017/117528, WO 2011/022460, WO 2013/148541, WO 2013/116126, WO 2011/153120, WO 2012/044638, WO 2012/054365, WO 2011/090965, WO 2013/016058, WO 2012/162210, WO 2008/042973, WO 2010/129709, WO 2010/144740, WO 2012/099755, WO 2013/049328, WO 2013/086322, WO 2013/086373, WO 2011/071860, WO 2009/132131, WO 2010/048536, WO 2010/088537, WO 2010/054401, WO 2010/054406, WO 2010/054405, WO 2010/054384, WO 2012/016184, WO 2009/086558, WO 2010/042877, WO 2011/000106, WO 2011/000107, WO 2005/120152, WO 2011/141705, WO 2013/126803, WO 2006/007712, WO 2011/038160, WO 2005/121348, WO 2011/066651, WO 2009/127060, WO 2011/141704, WO 2006/069782, WO 2012/031043, WO 2013/006825, WO 2013/033563, WO 2013/089151, WO 2017/099823, WO 2015/095346 и WO 2013/086354, и публикациях патентов США US 2016/0311759, US 2015/0376115, US 2016/0151284, US 2017/0210697, US 2015/0140070, US 2013/0178541, US 2013/0303587, US 2015/0141678, US 2015/0239926, US 2016/0376224, US 2017/0119904, US 2012/0149894, US 2015/0057373, US 2013/0090372, US 2013/0274523, US 2013/0274504, US 2013/0274504, US 2009/0023673, US 2012/0128760, US 2010/0324120, US 2014/0200257, US 2015/0203446, US 2018/0005363, US 2014/0308304, US 2013/0338210, US 2012/0101148, US 2012/0027796, US 2012/0058144, US 2013/0323269, US 2011/0117125, US 2011/0256175, US 2012/0202871, US 2011/0076335, US 2006/0083780, US 2013/0123338, US 2015/0064242, US 2006/0051405, US 2013/0065939, US 2006/0008910, US 2003/0022649, US 2010/0130588, US 2013/0116307, US 2010/0062967, US 2013/0202684, US 2014/0141070, US 2014/0255472, US 2014/0039032, US 2018/0028664, US 2016/0317458 и US 2013/0195920, содержание которых полностью включено в данный документ посредством ссылки.[00389] Exemplary ionizable lipids are described in international PCT patent publications WO 2015/095340, WO 2015/199952, WO 2018/011633, WO 2017/049245, WO 2015/061467, WO 2012/040184, WO 2012/ 000104, WO 2015/ 074085, WO 2016/081029, WO 2017/004143, WO 2017/075531, WO 2017/117528, WO 2011/022460, WO 2013/148541, WO 2013/116126, WO 2011/153 120, WO 2012/044638, WO 2012/ 054365, WO 2011/090965, WO 2013/016058, WO 2012/162210, WO 2008/042973, WO 2010/129709, WO 2010/144740, WO 2012/099755, WO 2013/049 328, WO 2013/086322, WO 2013/ 086373, WO 2011/071860, WO 2009/132131, WO 2010/048536, WO 2010/088537, WO 2010/054401, WO 2010/054406, WO 2010/054405, WO 2010/054 384, WO 2012/016184, WO 2009/ 086558, WO 2010/042877, WO 2011/000106, WO 2011/000107, WO 2005/120152, WO 2011/141705, WO 2013/126803, WO 2006/007712, WO 2011/038 160, WO 2005/121348, WO 2011/ 066651, WO 2009/127060, WO 2011/141704, WO 2006/069782, WO 2012/031043, WO 2013/006825, WO 2013/033563, WO 2013/089151, WO 2017/099 823, WO 2015/095346 and WO 2013/ 086354, and US patent publications US 2016/0311759, US 2015/0376115, US 2016/0151284, US 2017/0210697, US 2015/0140070, US 2013/0178541, US 2013/0303587, US 201 5/0141678, US 2015/0239926 , US 2016/0376224, US 2017/0119904, US 2012/0149894, US 2015/0057373, US 2013/0090372, US 2013/0274523, US 2013/0274504, US 2013/0274504, US 2009/0023673, US 2012/0128760 , US 2010/0324120, US 2014/0200257, US 2015/0203446, US 2018/0005363, US 2014/0308304, US 2013/0338210, US 2012/0101148, US 2012/0027796, US 2012/0058144, US 2013/0323269 , US 2011/0117125, US 2011/0256175, US 2012/0202871, US 2011/0076335, US 2006/0083780, US 2013/0123338, US 2015/0064242, US 2006/0051405, US 2013/0065939, US 2006/0008910 , US 2003/0022649, US 2010/0130588, US 2013/0116307, US 2010/0062967, US 2013/0202684, US 2014/0141070, US 2014/0255472, US 2014/0039032, US 2018/0028664, US 2016/0317458 and US 2013/0195920, the contents of which are incorporated herein by reference in their entirety.

[00390] Согласно некоторым вариантам реализации ионизируемый липид представляет собой МС3 (6Z,9Z,28Z,31Z)-гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат (DLin-MC3-DMA или МСЗ), имеющий следующую структуру:[00390] In some embodiments, the ionizable lipid is MC3 (6Z,9Z,28Z,31Z)-heptatriaconta-6,9,28,31-tetraen-19-yl-4-(dimethylamino)butanoate (DLin-MC3-DMA or MRZ), having the following structure:

[00391] Липид DLin-MC3-DMA описан в Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533, содержание которой полностью включено в данный документ посредством ссылки.[00391] The DLin-MC3-DMA lipid is described in Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533, the contents of which are incorporated herein by reference in their entirety.

[00392] Согласно некоторым вариантам реализации ионизируемый липид представляет собой липид АТХ-002, описанный в WO 2015/074085, содержание которого полностью включено в данный документ посредством ссылки.[00392] In some embodiments, the ionizable lipid is lipid ATX-002, described in WO 2015/074085, the contents of which are incorporated herein by reference in their entirety.

[00393] Согласно некоторым вариантам реализации ионизируемый липид представляет собой (13Z,16Z)-N,N-диметил-3-нонилдокоза-13,16-диен-1-амин (Соединение 32), описанный в WO 2012/040184, содержание которого полностью включено в данный документ посредством ссылки.[00393] In some embodiments, the ionizable lipid is (13Z,16Z)-N,N-dimethyl-3-nonyldocose-13,16-dien-1-amine (Compound 32), described in WO 2012/040184, the content of which is incorporated herein by reference in its entirety.

[00394] Согласно некоторым вариантам реализации ионизируемый липид представляет собой Соединение 6 или Соединение 22, описанные в WO 2015/199952, содержание которого полностью включено в данный документ посредством ссылки.[00394] In some embodiments, the ionizable lipid is Compound 6 or Compound 22, described in WO 2015/199952, the contents of which are incorporated herein by reference in their entirety.

[00395] Без ограничений, ионизируемый липид может составлять 20-90% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, молярное содержание ионизируемого липида может составлять 20-70% (мол.), 30-60% (мол.) или 40-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации ионизируемый липид составляет от примерно 50 мол. % до примерно 90 мол. % от общего количества липидов, присутствующих в липидной наночастице.[00395] Without limitation, the ionizable lipid may comprise 20-90 mol% of the total lipids present in the lipid nanoparticle. For example, the molar content of the ionizable lipid may be 20-70 mol%, 30-60 mol%, or 40-50 mol% of the total lipids present in the lipid nanoparticle. In some embodiments, the ionizable lipid is from about 50 mol. % to about 90 mol. % of the total amount of lipids present in the lipid nanoparticle.

[00396] Согласно некоторым аспектам липидная наночастица может дополнительно содержать некатионный липид. Неионогенные липиды включают амфипатические липиды, нейтральные липиды и анионные липиды. Соответственно, некатионный липид может представлять собой нейтральный незаряженный, цвиттерионный или анионный липид. Некатионные липиды, как правило, применяют для усиления фузогенности.[00396] In some aspects, the lipid nanoparticle may further comprise a non-cationic lipid. Nonionic lipids include amphipathic lipids, neutral lipids and anionic lipids. Accordingly, the non-cationic lipid may be a neutral, uncharged, zwitterionic or anionic lipid. Non-cationic lipids are usually used to enhance fusogenicity.

[00397] Примерные некатионные липиды, предусмотренные для применения в способах и композициях, раскрытых в данном документе, описаны в международной заявке PCT7US 2018/050042, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ. Примерные некатионные липиды описаны в публикации международной заявки WO 2017/099823 и публикации патента США US 2018/0028664, содержание которых полностью включено в данный документ посредством ссылки.[00397] Exemplary non-cationic lipids contemplated for use in the methods and compositions disclosed herein are described in international application PCT7US 2018/050042, filed September 7, 2018, and PCT/US 2018/064242, filed December 6, 2018. , which are included in this document in their entirety. Exemplary non-cationic lipids are described in International Application Publication WO 2017/099823 and US Patent Publication US 2018/0028664, the contents of which are incorporated herein by reference in their entirety.

[00398] Некатионный липид может составлять 0-30% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, содержание некатионного липида составляет 5-20% (мол.) или 10-15% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно различным вариантам реализации молярное соотношение ионизируемого липида и нейтрального липида колеблется от примерно 2:1 до примерно 8:1.[00398] The non-cationic lipid may comprise 0-30 mol% of the total lipids present in the lipid nanoparticle. For example, the content of non-cationic lipid is 5-20% (mol.) or 10-15% (mol.) of the total amount of lipids present in the lipid nanoparticle. In various embodiments, the molar ratio of ionizable lipid to neutral lipid ranges from about 2:1 to about 8:1.

[00399] Согласно некоторым вариантам реализации липидные наночастицы не содержат каких-либо фосфолипидов. Согласно некоторым аспектам липидная наночастица может дополнительно содержать компонент, такой как стерин, для обеспечения целостности мембраны.[00399] In some embodiments, the lipid nanoparticles do not contain any phospholipids. In some aspects, the lipid nanoparticle may further comprise a component, such as a sterol, to provide membrane integrity.

[00400] Один примерный стерин, который подходит для применения в липидной наночастице, представляет собой холестерин и его производные. Примерные производные холестерина описаны в международной заявке WO 2009/127060 и публикации патента США US 2010/0130588, содержание которых полностью включено в данный документ посредством ссылки.[00400] One exemplary sterol that is suitable for use in a lipid nanoparticle is cholesterol and its derivatives. Exemplary cholesterol derivatives are described in international application WO 2009/127060 and US patent publication US 2010/0130588, the contents of which are incorporated herein by reference in their entirety.

[00401] Компонент, обеспечивающий целостность мембраны, такой как стерин, может составлять 0-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации такой компонент составляет 20-50% (мол.) 30-40% (мол.) от общего содержания липидов липидной наночастицы.[00401] The membrane integrity component, such as sterol, may comprise 0-50 mol% of the total lipids present in the lipid nanoparticle. In some embodiments, such a component constitutes 20-50 mol% and 30-40 mol% of the total lipid content of the lipid nanoparticle.

[00402] 1200[00402] 1200

содержать полиэтиленгликоль (ПЭГ) или молекулу конъюгированного липида. Обычно их используют для ингибирования агрегации липидных наночастиц и/или для обеспечения стерической стабилизации. Примерные конъюгированные липиды включают, но не ограничиваются перечисленными, конъюгаты ПЭГ-липид, конъюгаты полиоксазолин (Р07)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид), конъюгаты катионная группа-полимер-липид (CPL); и их смеси. Согласно некоторым вариантам реализации молекула конъюгированного липида представляет собой конъюгат ПЭГ-липид, например, метоксиполиэтиленгликоль-конъюгированный липид. Примерные конъюгаты ПЭГ-липид включают, но не ограничиваются перечисленными, ПЭГ-диацилглицерин (ДАТ) (такой как 1-(монометоксиполиэтиленгликоль)-2,3-димиристоилглицерин (ПЭГ-ДМГ)), ПЭГ-диалкилоксипропил (ДАА), ПЭГ-фосфолипид, ПЭГ-церамид (Cer), пегилированный фосфатидилэтаноламин (ПЭГ-ФЭ), ПЭГ-сукцинатдиацилглицерин (PEGS-DAG) (такой как 4-O-(2',3'-ди(тетрадеканоилокси)пропил-1-O)-(w-метокси(полиэтокси)этил)бутандиоат (PEG-S-DMG)), ПЭГ-диалкоксипропилкарбам, натриевая соль N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина или их смесь. Дополнительные примерные конъюгаты ПЭГ-липид описаны, например, в US5885613, US6287591, US 2003/0077829, US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2010/0130588, US 2016/0376224 и US 2017/0119904, содержание которых полностью включено в данный документ посредством ссылки.contain polyethylene glycol (PEG) or a conjugated lipid molecule. They are typically used to inhibit the aggregation of lipid nanoparticles and/or to provide steric stabilization. Exemplary conjugated lipids include, but are not limited to, PEG-lipid conjugates, polyoxazoline (PO7)-lipid conjugates, polyamide-lipid conjugates (such as ATTA-lipid conjugates), cationic polymer-lipid (CPL) conjugates; and mixtures thereof. In some embodiments, the conjugated lipid molecule is a PEG-lipid conjugate, such as a methoxy polyethylene glycol conjugated lipid. Exemplary PEG-lipid conjugates include, but are not limited to, PEG-diacylglycerol (DAT) (such as 1-(monomethoxypolyethylene glycol)-2,3-dimyristoylglycerol (PEG-DMG)), PEG-dialkyloxypropyl (DAA), PEG-phospholipid, PEG-ceramide (Cer), PEGylated phosphatidylethanolamine (PEG-PE), PEG-succinate diacylglycerol (PEGS-DAG) (such as 4-O-(2',3'-di(tetradecanoyloxy)propyl-1-O)-(w -methoxy(polyethoxy)ethyl)butanedioate (PEG-S-DMG)), PEG-dialkoxypropylcarbam, sodium salt of N-(carbonylmethoxypolyethylene glycol 2000)-1,2-distearoyl-sn-glycero-3-phosphoethanolamine or a mixture thereof. Additional exemplary PEG-lipid conjugates are described, for example, in US5885613, US6287591, US2003/0077829, US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2010/01305 88, US 2016/0376224 and US 2017/0119904, the contents of which are incorporated herein by reference in their entirety.

[00403] Согласно некоторым вариантам реализации ПЭГ-липид представляет собой соединение, раскрытое в US 2018/0028664, содержание которого включено в данный документ посредством ссылки в полном объеме. Согласно некоторым вариантам реализации ПЭГ-липид раскрыт в US 20150376115 или в US 2016/0376224, содержание которых полностью включено в данный документ посредством ссылки.[00403] In some embodiments, the PEG lipid is a compound disclosed in US 2018/0028664, the contents of which are incorporated herein by reference in their entirety. In some embodiments, a PEG lipid is disclosed in US 20150376115 or US 2016/0376224, the contents of which are incorporated herein by reference in their entirety.

[00404] Конъюгат ПЭГ-ДАА может представлять собой, например, ПЭГ-дилаурилоксипропил, ПЭГ-димиристилоксипропил, ПЭГ-дипальмитилоксипропил или ПЭГ-дистеарилоксипропил. ПЭГ-липид может представлять собой одно или более из ПЭГ-ДМГ, ПЭГ-дилаурилглицерина, ПЭГ-дипальмитоилглицерина, ПЭГ-дистерилглицерина, ПЭГ-дилаурилгликамида, ПЭГ-димиристилгликамида, ПЭГ-дипальмитоилгликамида, ПЭГ-дистерилгликамида, ПЭГ-холестерина (1-[8'-(холест-5-ен-3β-окси)карбоксамидо-3',6'-диоксаоктанил]карбамоил-[омега]-метилполиэтиленгликоль), ПЭГ-DMB (простой эфир 3,4-дитетрадекоксилбензил-[омега]-метилполиэтиленгликоля) и 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-К-[метоксиполиэтиленгликоля-2000]. В некоторых примерах ПЭГ-липид может быть выбран из группы, состоящей из ПЭГ-ДМГ, 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-N-[метоксиполиэтиленгликоля-2000].[00404] The PEG-DAA conjugate may be, for example, PEG-dilauryloxypropyl, PEG-dimyristyloxypropyl, PEG-dipalmityloxypropyl, or PEG-distearyloxypropyl. The PEG lipid may be one or more of PEG-DMG, PEG-dilaurylglycerol, PEG-dipalmitoylglycerol, PEG-disterylglycerol, PEG-dilaurylglycamide, PEG-dimyristylglycamide, PEG-dipalmitoylglycamide, PEG-disterylglycamide, PEG-cholesterol (1-[8 '-(cholest-5-en-3β-oxy)carboxamido-3',6'-dioxaoctanyl]carbamoyl-[omega]-methylpolyethylene glycol), PEG-DMB (3,4-ditetradecoxybenzyl-[omega]-methylpolyethylene glycol ether) and 1,2-dimyristoyl-sn-glycero-3-phosphoethanolamine-K-[methoxypolyethylene glycol-2000]. In some examples, the PEG lipid may be selected from the group consisting of PEG-DMG, 1,2-dimyristoyl-sn-glycero-3-phosphoethanolamine-N-[methoxypolyethylene glycol-2000].

[00405] Липиды, конъюгированные с молекулой, отличной от ПЭГ, также могут быть использованы вместо ПЭГ-липида. Например, конъюгаты полиоксазолин (POZ)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид) и конъюгаты катионная группа-полимер-липид (CPL) могут применяться вместо или вместе с ПЭГ-липидом. Примерные конъюгированные липиды, т.е. ПЭГ-липиды, конъюгаты (POZ)-липид, конъюгаты АТТА-липид и катионный полимер-липиды, описаны в публикациях международных заявок на патент WO1996/010392, WO1998/051278, WO 2002/087541, WO 2005/026372, WO 2008/147438, WO 2009/086558, WO 2012/000104, WO 2017/117528, WO 2017/099823, WO 2015/199952, WO 2017/004143, WO 2015/095346, WO 2012/000104, WO 2012/000104 и WO 2010/006282, публикациях заявок на патент США US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2013/0303587, US 2018/0028664, US 2015/0376115, US 2016/0376224, US 2016/0317458, US 2013/0303587, US 2013/0303587 и US 20110123453, и патентах США US 5885613, US 6287591, US 6320017 и US 6586559, содержание которых полностью включено в данный документ посредством ссылки.[00405] Lipids conjugated to a molecule other than PEG can also be used in place of PEG lipid. For example, polyoxazoline (POZ)-lipid conjugates, polyamide-lipid conjugates (such as ATTA-lipid conjugates), and cationic polymer-lipid (CPL) conjugates can be used instead of or in conjunction with PEG lipid. Exemplary conjugated lipids, i.e. PEG-lipids, (POZ)-lipid conjugates, ATTA-lipid conjugates and cationic polymer-lipids are described in international patent application publications WO1996/010392, WO1998/051278, WO 2002/087541, WO 2005/026372, WO 2008/147438 , WO 2009/086558, WO 2012/000104, WO 2017/117528, WO 2017/099823, WO 2015/199952, WO 2017/004143, WO 2015/095346, WO 2012/000104, WO 2012/000104 and WO 2010/006282 , publications of US patent applications US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2013/0303587, US 2018/0028664, US 2015/0376115, US 2016/0376 224, US 2016/0317458 , US 2013/0303587, US 2013/0303587 and US 20110123453, and US patents US 5885613, US 6287591, US 6320017 and US 6586559, the contents of which are incorporated herein by reference in their entirety.

[00406] Согласно некоторым вариантам реализации одно или более дополнительных соединений могут представлять собой терапевтический агент. Терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран в соответствии с терапевтической целью и целевым биологическим действием. Например, если зкДНК в ЛНЧ можно применять для лечения гемофилии А, дополнительное соединение может представлять собой агент, направленный против гемофилии А (например, химиотерапевтический агент или другую терапию гемофилии А (включая, но не ограничиваясь перечисленными, малую молекулу или антитело). Согласно другому примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения инфекции, дополнительное соединение может представлять собой антимикробный агент (например, антибиотик или противовирусное соединение). Согласно еще одному примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения иммунного заболевания или нарушения, дополнительное соединение может представлять собой соединение, которое модулирует иммунный ответ (например, иммуносупрессор, иммуностимулирующее соединение или соединение, модулирующее один или более конкретных иммунных путей). Согласно некоторым вариантам реализации в композициях и способах согласно настоящему изобретению могут применяться другие смеси различных липидных наночастиц, содержащих другие соединения, такие как зкДНК, кодирующая другой белок или другое соединение, такое как терапевтическое средство.[00406] In some embodiments, one or more additional compounds may be a therapeutic agent. The therapeutic agent may be selected from any class suitable for use for therapeutic purposes. In other words, the therapeutic agent may be selected from any class suitable for use for therapeutic purposes. In other words, the therapeutic agent may be selected according to the therapeutic purpose and the target biological effect. For example, if the cccDNA in the LNP can be used to treat hemophilia A, the additional compound may be an agent directed against hemophilia A (for example, a chemotherapeutic agent or other therapy for hemophilia A (including, but not limited to, a small molecule or antibody). According to another For example, if the LNP containing cccDNA can be used to treat an infection, the additional compound may be an antimicrobial agent (for example, an antibiotic or an antiviral compound).In yet another example, if the LNP containing cccDNA can be used to treat an immune disease or disorder, the additional compound may be a compound that modulates the immune response (e.g., an immunosuppressive compound, an immunostimulatory compound, or a compound that modulates one or more specific immune pathways).In some embodiments, other mixtures of various lipid nanoparticles containing other compounds, such as cDNA, encoding another protein or another compound, such as a therapeutic agent.

[00407] Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуномодулирующий агент. Например, дополнительное соединение представляет собой иммуносупрессор. Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуностимулирующий агент. В данном документе также предложена фармацевтическая композиция, содержащая инкапсулированный в липидную наночастицу продуцируемый клеткой насекомого или синтетически продуцируемый зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и фармацевтически приемлемый носитель или вспомогательное вещество.[00407] In some embodiments, the additional compound is an immunomodulatory agent. For example, the additional compound is an immunosuppressant. In some embodiments, the additional compound is an immunostimulating agent. Also provided herein is a pharmaceutical composition comprising a lipid nanoparticle-encapsulated insect cell-derived or synthetically produced cDNA FVIII protein expression vector disclosed herein and a pharmaceutically acceptable carrier or excipient.

[00408] Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, дополнительно содержащий одно или более фармацевтических вспомогательных веществ. Согласно некоторым вариантам реализации состав липидных наночастиц дополнительно содержит сахарозу, tris, трегалозу и/или глицин.[00408] According to some aspects of the present disclosure, a lipid nanoparticle formulation is provided, further comprising one or more pharmaceutical excipients. In some embodiments, the lipid nanoparticle formulation further comprises sucrose, tris, trehalose, and/or glycine.

[00409] ЗкДНК-вектор может образовывать комплексы с липидной частью (portion) частицы или может быть инкапсулирован в липидной части (position) липидной наночастицы. Согласно некоторым вариантам реализации зкДНК может быть полностью инкапсулирована в липидной части липидной наночастицы, что защищает ее от разрушения нуклеазой, например, в водном растворе. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после воздействия на липидную наночастицу нуклеазы при 37°С в течение по меньшей мере примерно 20, 30, 45 или 60 минут. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после инкубации частицы в сыворотке при 37°С в течение по меньшей мере примерно 30, 45 или 60 минут, или по меньшей мере примерно 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 или 36 часов.[00409] The cDNA vector can form complexes with the lipid portion (portion) of the particle or can be encapsulated in the lipid portion (position) of the lipid nanoparticle. In some embodiments, the cccDNA may be completely encapsulated in the lipid portion of the lipid nanoparticle, thereby protecting it from degradation by a nuclease, for example, in an aqueous solution. In some embodiments, the cccDNA in the lipid nanoparticle is not significantly degraded after exposing the lipid nanoparticle to a nuclease at 37° C. for at least about 20, 30, 45, or 60 minutes. In some embodiments, the cccDNA in a lipid nanoparticle is not significantly degraded after the particle is incubated in serum at 37°C for at least about 30, 45, or 60 minutes, or at least about 2, 3, 4, 5, 6. 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 or 36 hours.

[00410] Согласно определенным вариантам реализации липидные наночастицы по существу нетоксичны для субъекта, например, млекопитающего, такого как человек. Согласно некоторым аспектам состав липидных наночастиц представляет собой лиофилизированный порошок.[00410] In certain embodiments, the lipid nanoparticles are substantially non-toxic to a subject, such as a mammal such as a human. In some aspects, the lipid nanoparticle formulation is a lyophilized powder.

[00411] Согласно некоторым вариантам реализации липидные наночастицы представляют собой частицы с твердой сердцевиной, которые имеют по меньшей мере один липидный бислой. Согласно другим вариантам реализации липидные наночастицы имеют небислойную структуру, т.е. имеют неламеллярную (т.е. небислойную) морфологию. Без ограничений, небислойная морфология может включать, например, трехмерные трубки, стержни, частицы кубической симметрии и т.д. Например, морфологию липидных наночастиц (ламеллярных в сравнении с неламеллярными) можно легко оценить и охарактеризовать с использованием, например, анализа методом «крио-ТЭМ» (криотрансмиссионная электронная микроскопия), как описано в US 2010/0130588, содержание которого полностью включено в данный документ посредством ссылки.[00411] In some embodiments, lipid nanoparticles are solid core particles that have at least one lipid bilayer. In other embodiments, the lipid nanoparticles have a non-bilayer structure, i.e. have a non-lamellar (i.e. non-bilayer) morphology. Without limitation, non-bilayer morphologies may include, for example, three-dimensional tubes, rods, cubic particles, etc. For example, the morphology of lipid nanoparticles (lamellar versus non-lamellar) can be easily assessed and characterized using, for example, cryo-TEM (cryotransmission electron microscopy) analysis as described in US 2010/0130588, the contents of which are incorporated herein in their entirety via link.

[00412] Согласно некоторым другим вариантам реализации липидные наночастицы, имеющие неламеллярную морфологию, являются электронно-плотными. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, которая является либо однослойной, либо многослойной по структуре. Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, который содержит мультивезикулярные частицы и/или частицы на основе пены.[00412] In some other embodiments, lipid nanoparticles having a non-lamellar morphology are electron dense. In accordance with certain aspects of the present disclosure, a lipid nanoparticle is provided that is either single-layered or multilayered in structure. According to some aspects of the present disclosure, a lipid nanoparticle composition is provided that contains multivesicular particles and/or foam-based particles.

[00413] Контролируя композицию и содержание липидных компонентов, можно контролировать скорость, с которой липидный конъюгат высвобождается из липидной частицы, и, в свою очередь, скорость, с которой липидная наночастица становится фузогенной. Кроме того, другие переменные, включая, например, рН, температуру или ионную силу, могут применяться для изменения и/или контроля скорости, с которой липидная наночастица становится фузогенной. Другие способы, которые могут применяться для контроля скорости, с которой указанная липидная наночастица становится фузогенной, будут понятны обычным специалистам в данной области техники после ознакомления с указанным описанием. Также будет понятно, что размер липидных частиц можно контролировать путем контроля композиции и концентрации липидного конъюгата.[00413] By controlling the composition and content of lipid components, it is possible to control the rate at which the lipid conjugate is released from the lipid particle and, in turn, the rate at which the lipid nanoparticle becomes fusogenic. In addition, other variables, including, for example, pH, temperature, or ionic strength, can be used to alter and/or control the rate at which the lipid nanoparticle becomes fusogenic. Other methods that can be used to control the rate at which a specified lipid nanoparticle becomes fusogenic will be apparent to those of ordinary skill in the art upon review of the disclosure. It will also be understood that the size of the lipid particles can be controlled by controlling the composition and concentration of the lipid conjugate.

[00414] pKa катионных липидов в составах может быть сопоставлена с эффективностью ЛНЧ для доставки нуклеиновых кислот (см. Jayaraman et al., Angewandte Chemie, International Edition (2012), 51(34), 8529-8533; Semple et al, Nature Biotechnology 28, 172-176 (2010), обе работы полностью включены в данный документ посредством ссылки). Предпочтительный диапазон pKa составляет от ~5 до ~7. pKa катионного липида в липидных наночастицах может быть определена с использованием анализа, основанного на флуоресценции 2-(п-толуидино)-6-нафталинсульфоновой кислоты (TNS). VIII. Способы применения[00414] The pKa of cationic lipids in formulations can be compared with the efficiency of LNPs for delivering nucleic acids (see Jayaraman et al., Angewandte Chemie, International Edition (2012), 51(34), 8529-8533; Semple et al., Nature Biotechnology 28, 172-176 (2010), both works are incorporated herein by reference in their entirety). The preferred pKa range is from ~5 to ~7. The pKa of a cationic lipid in lipid nanoparticles can be determined using an assay based on 2-(p-toluidino)-6-naphthalenesulfonic acid (TNS) fluorescence. VIII. Methods of application

[00415] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также можно применять в способе доставки представляющей интерес нуклеотидной последовательности (например, кодирующей белок FVIII) в клетку-мишень (например, клетку-хозяина). Способ может представлять собой, в частности, способ доставки белка FVIII к клетке субъекта, нуждающегося в этом, и лечения гемофилии А. Настоящее изобретение обеспечивает экспрессию in vivo белка FVIII, закодированного в зкДНК-векторе, в клетке у субъекта так, чтобы возник терапевтический эффект экспрессии белка FVIII. Указанные результаты наблюдаются как в in vivo, так и в in vitro режимах доставки зкДНК-вектора.[00415] The cDNA FVIII protein expression vector disclosed herein can also be used in a method of delivering a nucleotide sequence of interest (eg, encoding an FVIII protein) to a target cell (eg, a host cell). The method may be, in particular, a method of delivering FVIII protein to a cell of a subject in need thereof and treating hemophilia A. The present invention provides for in vivo expression of FVIII protein encoded in a cccDNA vector in a cell of a subject so that a therapeutic effect occurs FVIII protein expression. These results are observed both in vivo and in vitro delivery modes of the cDNA vector.

[00416] Кроме того, согласно настоящему изобретению предложен способ доставки белка FVIII в клетку субъекта, нуждающегося в этом, включающий многократные введения зкДНК-вектора согласно настоящему изобретению, кодирующего указанный белок FVIII. Поскольку зкДНК-вектор согласно настоящему изобретению не индуцирует иммунный ответ, подобный тому, который обычно наблюдается против инкапсидированных вирусных векторов, такая стратегия многократного введения, вероятно, будет иметь больший успех в системе на основе зкДНК. ЗкДНК-вектор вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса генов и экспрессии белка FVIII без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются перечисленными, введение в сетчатку (например, субретинальную инъекцию, супрахориоидальную инъекцию или интравитреальную инъекцию), внутривенное введение (например, в липосомальном составе), прямую доставку в выбранный орган (например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка), внутримышечный и другие парентеральные пути введения. Пути введения могут быть скомбинированы, если требуется.[00416] In addition, the present invention provides a method of delivering FVIII protein to a cell of a subject in need thereof, comprising repeated administrations of a cccDNA vector of the present invention encoding said FVIII protein. Since the cccDNA vector of the present invention does not induce an immune response similar to that typically observed against encapsidated viral vectors, such a multiple administration strategy is likely to be more successful in a cccDNA-based system. The cccDNA vector is administered in quantities sufficient to transfect cells of the target tissue and provide sufficient levels of gene transfer and FVIII protein expression without undue unwanted effects. Common and pharmaceutically acceptable routes of administration include, but are not limited to, intraretinal injection (eg, subretinal injection, suprachoroidal injection, or intravitreal injection), intravenous administration (eg, in a liposomal formulation), direct delivery to an organ of choice (eg, any one or more tissues selected from: liver, kidney, gallbladder, prostate, adrenal gland, heart, intestine, lung and stomach), intramuscular and other parenteral routes of administration. Routes of administration can be combined if required.

[00417] Доставка зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, не ограничивается доставкой экспрессируемого белка FVIII. Например, зкДНК-векторы, полученные с помощью обычного способа (например, с использованием способа продуцирования на основе клеток (например, способов продуцирования в клетках насекомых)) или синтетического способа, как описано в данном документе, можно применять вместе с другими предложенными системами доставки, чтобы обеспечить часть генной терапии. Один неограничивающий пример системы, которую можно комбинировать с зкДНК-векторами в соответствии с настоящим раскрытием, включает системы, которые доставляют по отдельности один или более кофакторов или иммунных супрессоров для эффективной генной экспрессии зкДНК-вектора, экспрессирующего белок FVIII.[00417] Delivery of the cccDNA vector for FVIII protein expression described herein is not limited to delivery of the FVIII protein to be expressed. For example, cccDNA vectors produced by a conventional method (e.g., using a cell-based production method (e.g., insect cell production methods)) or a synthetic method, as described herein, can be used in conjunction with other proposed delivery systems, to provide part of the gene therapy. One non-limiting example of a system that can be combined with cccDNA vectors in accordance with the present disclosure includes systems that separately deliver one or more cofactors or immune suppressors for efficient gene expression of a cccDNA vector expressing FVIII protein.

[00418] Согласно настоящему изобретению также предложен способ лечения гемофилии А у субъекта, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Выбранный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, который можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую последовательность белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.[00418] The present invention also provides a method of treating hemophilia A in a subject, comprising administering to a target cell in need thereof (particularly a muscle cell or tissue) of said subject a therapeutically effective amount of a cccDNA vector, optionally with a pharmaceutically acceptable carrier. Although the cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The selected cccDNA vector contains a nucleotide sequence encoding an FVIII protein that can be used to treat hemophilia A. In particular, the cccDNA vector may contain a target FVIII protein sequence operably linked to control elements capable of directing the transcription of the target FVIII protein encoded by the exogenous DNA sequence , when administered to a subject. The cccDNA vector can be introduced by any suitable route suggested above and elsewhere in this document.

[00419] Композиции и векторы, предложенные в данном документе, можно применять для доставки белка FVIII с различными целями. Согласно некоторым вариантам реализации трансген кодирует белок FVIII, который предназначен для применения в исследовательских целях, например, для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции продукта белка FVIII. В другом примере трансген кодирует белок FVIII, который предназначен для применения с целью создания модели гемофилии А на животных. Согласно некоторым вариантам реализации кодируемый белок FVIII можно применять для лечения или предотвращения состояний гемофилии А у млекопитающего-субъекта. Белок FVIII может быть перенесен в организм пациента (например, экспрессирован у пациента) в количестве, достаточном для лечения гемофилии А, ассоциированной с пониженной экспрессией, отсутствием экспрессии или дисфункцией указанного гена.[00419] The compositions and vectors provided herein can be used to deliver FVIII protein for a variety of purposes. In some embodiments, the transgene encodes an FVIII protein that is intended to be used for research purposes, for example, to create a somatic transgenic animal model carrying the transgene, for example, to study the function of the FVIII protein product. In another example, the transgene encodes the FVIII protein, which is intended for use in creating an animal model of hemophilia A. In some embodiments, the encoded FVIII protein can be used to treat or prevent hemophilia A conditions in a mammalian subject. The FVIII protein may be transferred into a patient (eg, expressed in the patient) in an amount sufficient to treat hemophilia A associated with decreased expression, absence of expression, or dysfunction of the gene.

[00420] В принципе, экспрессионная кассета может включать нуклеиновую кислоту или любой трансген, который кодирует белок FVIII, который либо снижен, либо отсутствует из-за мутации, либо который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего изобретения. Предпочтительно не вставленная бактериальная ДНК не присутствует и предпочтительно бактериальная ДНК не присутствует в композициях зкДНК, предложенных в данном документе.[00420] In principle, an expression cassette may include a nucleic acid or any transgene that encodes an FVIII protein that is either reduced or absent due to mutation, or that provides a therapeutic benefit when overexpressed, and is considered to be included within the scope of the present invention. Preferably, uninserted bacterial DNA is not present, and preferably, bacterial DNA is not present in the cccDNA compositions provided herein.

[00421] ЗкДНК-вектор не ограничивается одной молекулой зкДНК-вектора. Таким образом, в другом аспекте несколько зкДНК-векторов, экспрессирующих разные белки или один и тот же белок FVIII, но функционально связанный с различными промоторами или цис-регуляторными элементами, могут быть доставлены одновременно или последовательно в целевую клетку, ткань, орган или в организм субъекта. Таким образом, эта стратегия может обеспечить одновременную генную терапию несколькими белками или доставку их генов. Также можно разместить разные части белка FVIII в отдельных зкДНК-векторах (например, разные домены и/или кофакторы, необходимые для функциональности белка FVIII), например, которые могут быть введены одновременно или в разные моменты времени, и которые можно регулировать по отдельности, добавляя посредством этого дополнительный уровень контроля экспрессии белка FVIII. Доставку также можно выполнять несколько раз и, что важно для генной терапии в клинических условиях, с последующим увеличением или снижением доз, учитывая отсутствие иммунного ответа хозяина против капсида вследствие отсутствия вирусного капсида. Ожидается, что ответ против капсида не возникнет из-за отсутствия капсида.[00421] The cccDNA vector is not limited to one ccDNA vector molecule. Thus, in another aspect, multiple cccDNA vectors expressing different proteins or the same FVIII protein but operably linked to different promoters or cis-regulatory elements can be delivered simultaneously or sequentially to a target cell, tissue, organ or organism subject. Thus, this strategy could enable simultaneous gene therapy or gene delivery of multiple proteins. It is also possible to place different parts of the FVIII protein in separate cccDNA vectors (e.g., different domains and/or cofactors required for the functionality of the FVIII protein), for example, which can be introduced simultaneously or at different times, and which can be adjusted separately by adding thereby providing an additional level of control over FVIII protein expression. Delivery can also be performed multiple times and, importantly for gene therapy in a clinical setting, followed by increasing or decreasing doses based on the lack of host immune response against the capsid due to the absence of the viral capsid. An anti-capsid response is not expected to occur due to the absence of a capsid.

[00422] Согласно настоящему изобретению также предложен способ лечения у субъекта гемофилии А, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, представляющую интерес, которую можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую экзогенную последовательность ДНК, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого полипептида, белка или олигонуклеотида, кодируемого указанной экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.[00422] The present invention also provides a method of treating a subject with hemophilia A, comprising administering to a target cell in need thereof (particularly a muscle cell or tissue) of said subject a therapeutically effective amount of a cccDNA vector disclosed herein, optionally with a pharmaceutical acceptable medium. Although the cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The implemented cDNA vector contains a nucleotide sequence of interest that can be used for the treatment of hemophilia A. In particular, the cDNA vector may contain a target exogenous DNA sequence operably linked to control elements capable of directing the transcription of the target polypeptide, protein or oligonucleotide encoded by the specified exogenous DNA sequence when administered to a subject. The cccDNA vector can be introduced by any suitable route suggested above and elsewhere in this document.

Способы доставки зкДНК-векторов для продукции белка FVIIIMethods for delivering cccDNA vectors for FVIII protein production

[00423] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может быть доставлен в клетку-мишень in vitro или in vivo различными подходящими способами. ЗкДНК-векторы могут быть применены или инъецированы по отдельности. ДНК-векторы могут быть доставлены в клетку без помощи реагента для трансфекции или других физических средств. В качестве альтернативы, зкДНК-векторы для экспрессии белка FVIII могут быть доставлены с использованием любого известного в данной области техники реагента для трансфекции или других известных в данной области техники физических средств, которые облегчают проникновение ДНК в клетку, например, липосом, спиртов, соединений, богатых полилизином, соединений, богатых аргинином, фосфата кальция, микровезикул, микроинъекции, электропорации и т.п.[00423] In some embodiments, the cDNA vector for expression of the FVIII protein can be delivered to the target cell in vitro or in vivo by various suitable methods. CctDNA vectors can be used or injected individually. DNA vectors can be delivered into a cell without the aid of a transfection reagent or other physical means. Alternatively, cDNA FVIII protein expression vectors can be delivered using any transfection reagent known in the art or other physical means known in the art that facilitate entry of DNA into the cell, such as liposomes, alcohols, compounds, polylysine-rich compounds, arginine-rich compounds, calcium phosphate, microvesicles, microinjection, electroporation, etc.

[00424] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть эффективно нацелены на типы клеток и тканей, которые обычно трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки.[00424] The cDNA FVIII protein expression vectors disclosed herein can be effectively targeted to cell and tissue types that are typically difficult to transduce with conventional AAV virions using various delivery reagents.

[00425] Один аспект технологии, описанной в данном документе, относится к способу доставки белка FVIII в клетку. Как правило, для способов in vivo и in vitro зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен в клетку с использованием способов, раскрытых в данном документе, а также других способов, известных в данной области техники. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, предпочтительно вводят в клетку в биологически эффективном количестве. Если зкДНК-вектор вводят в клетку in vivo (например, субъекту), биологически эффективное количество зкДНК-вектора представляет собой количество, достаточное для трансдукции и экспрессии белка FVIII в клетке-мишени.[00425] One aspect of the technology described herein relates to a method for delivering FVIII protein into a cell. In general, for in vivo and in vitro methods, the cDNA FVIII protein expression vector disclosed herein can be introduced into a cell using the methods disclosed herein as well as other methods known in the art. The cDNA FVIII protein expression vector disclosed herein is preferably introduced into the cell in a biologically effective amount. If a cccDNA vector is introduced into a cell in vivo (eg, a subject), a biologically effective amount of cccDNA vector is an amount sufficient to transduce and express FVIII protein in the target cell.

[00426] Примерные способы введения зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают пероральный, ректальный, трансмукозальный, интраназальный, ингаляционный (например, с помощью аэрозоля), буккальный (например, сублингвальный), вагинальный, интратекальный, внутриглазной, трансдермальный, внутриэндотелиальный, in utero (или in ovo), парентеральный (например, внутривенный, подкожный, внутрикожный, внутричерепной, внутримышечный [включая введение в скелетную, диафрагмальную и/или сердечную мышцу], внутриплевральный, внутримозговой и внутрисуставной). Введение может представлять собой системную или прямую доставку в печень или куда-либо еще (например, в любые почки, желчный пузырь, простату, надпочечники, сердце, кишечник, легкое и желудок).[00426] Exemplary methods of administering the cccDNA vector for expression of the FVIII protein disclosed herein include oral, rectal, transmucosal, intranasal, inhalation (e.g., aerosol), buccal (e.g., sublingual), vaginal, intrathecal, intraocular, transdermal, intraendothelial, in utero (or in ovo), parenteral (eg, intravenous, subcutaneous, intradermal, intracranial, intramuscular [including injection into skeletal, diaphragmatic and/or cardiac muscle], intrapleural, intracerebral, and intraarticular). Administration may be systemic or direct delivery to the liver or elsewhere (eg, any kidney, gall bladder, prostate, adrenal gland, heart, intestine, lung, and stomach).

[00427] Введение может быть местным (например, на поверхность кожи и слизистых оболочек, включая поверхности дыхательных путей и трансдермальное введение), внутрилимфатическим и т.п., а также путем прямой инъекции в ткань или орган (например, но не ограничиваясь этим, в печень, а также в глаз, мышцы, включая скелетную мышцу, сердечную мышцу, диафрагмальную мышцу, или головной мозг).[00427] Administration may be local (for example, to the surface of the skin and mucous membranes, including surfaces of the respiratory tract and transdermal administration), intralymphatic, etc., or by direct injection into a tissue or organ (for example, but not limited to, into the liver, as well as into the eye, muscles including skeletal muscle, cardiac muscle, diaphragmatic muscle, or brain).

[00428] ЗкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из печени и/или также глаз, головного мозга, скелетной мышцы, гладкой мышцы, сердца, диафрагмы, эпителия дыхательных путей, почки, селезенки, поджелудочной железы, кожи.[00428] The cccDNA vector can be introduced into any site in a subject, including, without limitation, a site selected from the group consisting of liver and/or also eyes, brain, skeletal muscle, smooth muscle, heart, diaphragm, respiratory epithelium tract, kidney, spleen, pancreas, skin.

[00429] Наиболее подходящий путь в любом конкретном случае будет зависеть от характера и тяжести состояния, подлежащего лечению, облегчению и/или предотвращению, а также от характера конкретного используемого зкДНК-вектора. Кроме того, зкДНК позволяет вводить более одного белка FVIII в одном векторе или в нескольких зкДНК-векторах (например, смесь зкДНК).[00429] The most appropriate route in any given case will depend on the nature and severity of the condition being treated, ameliorated and/or prevented, as well as the nature of the particular cccDNA vector used. In addition, cccDNA allows the introduction of more than one FVIII protein in one vector or in multiple cccDNA vectors (eg, a mixture of cccDNA).

А. Внутримышечное введение зкДНК-вектораA. Intramuscular injection of cDNA vector

[00430] Согласно некоторым вариантам реализации способ лечения заболевания у субъекта включает введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, кодирующего белок FVIII, необязательно с фармацевтически приемлемым носителем. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в мышечную ткань субъекта.[00430] In some embodiments, a method of treating a disease in a subject comprises administering to a target cell in need thereof (such as a muscle cell or tissue) of the subject a therapeutically effective amount of a cccDNA vector encoding an FVIII protein, optionally with a pharmaceutically acceptable carrier. In some embodiments, the cDNA vector for expressing the FVIII protein is introduced into muscle tissue of a subject.

[00431] Согласно некоторым вариантам реализации зкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из скелетной мышцы, гладкой мышцы, сердца, диафрагмы или мышц глаза.[00431] In some embodiments, the cccDNA vector can be administered to any site in a subject, including, without limitation, a site selected from the group consisting of skeletal muscle, smooth muscle, heart, diaphragm, or ocular muscle.

[00432] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в скелетную мышцу в соответствии с настоящим изобретением включает, но не ограничивается этим, введение в скелетную мышцу в конечностях (например, верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. ЗкДНК-вектор, раскрытый в данном документе, может быть доставлен в скелетную мышцу путем внутривенного введения, внутриартериального введения, внутрибрюшинного введения, перфузии конечности (необязательно изолированной перфузии конечности для ноги и/или руки; см., например, Arruda et al., (2005) Blood 105: 3458-3464), и/или путем прямой внутримышечной инъекции. Согласно конкретным вариантам реализации зкДНК-вектор, раскрытый в данном документе, вводят в печень, глаз, конечность (руку и/или ногу) субъекта (например, субъекта с мышечной дистрофией, такой как МДД) путем перфузии конечности, необязательно изолированной перфузии конечности (например, путем внутривенного или внутрисуставного введения). В вариантах реализации зкДНК-вектор, раскрытый в данном документе, можно вводить без применения «гидродинамических» методик.[00432] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into skeletal muscle in accordance with the present invention includes, but is not limited to, administration into skeletal muscle in the extremities (e.g., upper arm, lower arm, upper parts of the leg and/or lower leg), back, neck, head (eg tongue), chest, abdomen, pelvis/perineum and/or fingers. The cctDNA vector disclosed herein can be delivered to skeletal muscle by intravenous administration, intra-arterial administration, intraperitoneal administration, limb perfusion (optionally isolated limb perfusion for the leg and/or arm; see, for example, Arruda et al., ( 2005) Blood 105: 3458-3464), and/or by direct intramuscular injection. In specific embodiments, the cccDNA vector disclosed herein is administered to the liver, eye, limb (arm and/or leg) of a subject (e.g., a subject with a muscular dystrophy such as DMD) by perfusion of the limb, optionally isolated perfusion of the limb (e.g. , by intravenous or intra-articular administration). In embodiments, the cDNA vector disclosed herein can be administered without the use of “hydrodynamic” techniques.

[00433] Например, доставка в ткань (например, сетчатку) обычных вирусных векторов часто усиливается гидродинамическими методиками (например, внутривенным/внутривенным введением в большом объеме), которые увеличивают давление в сосудистой сети и облегчают способность вирусного вектора пересекать барьер из эндотелиальных клеток. Согласно конкретным вариантам реализации зкДНК-векторы, описанные в данном документе, можно вводить без гидродинамических методик, таких как инфузии большого объема и/или повышенное внутрисосудистое давление (например, выше нормального систолического давления, например, повышение внутрисосудистого давления на величину менее или равную 5%, 10%, 15%, 20%, 25% от нормального систолического давления). Такие методы могут уменьшить или позволяют избежать побочных эффектов, ассоциированных с гидродинамическими методиками, таких как отек, повреждение нервов и/или синдром сдавливания.[00433] For example, tissue (eg, retinal) delivery of conventional viral vectors is often enhanced by hydrodynamic techniques (eg, high-volume intravenous/intravenous administration) that increase vasculature pressure and facilitate the ability of the viral vector to cross the endothelial cell barrier. In specific embodiments, the cccDNA vectors described herein can be administered without hydrodynamic techniques such as large volume infusions and/or increased intravascular pressure (e.g., greater than normal systolic pressure, e.g., an increase in intravascular pressure of less than or equal to 5% , 10%, 15%, 20%, 25% of normal systolic pressure). Such techniques may reduce or avoid side effects associated with hydrodynamic techniques, such as edema, nerve damage, and/or compartment syndrome.

[00434] Кроме того, композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, которую вводят в скелетную мышцу, может быть введена в скелетную мышцу в конечностях (например, в верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. Подходящие скелетные мышцы включают, без ограничений, отводящую мышцу мизинца (в кисти), отводящую мышцу мизинца (в стопе), отводящую мышцу большого пальца, отводящую мышцу пятой плюсневой кости, короткую мышцу, отводящую большой палец кисти, длинную мышцу, отводящую большой палец кисти, короткую приводящую мышцу, мышцу, приводящую большой палец стопы, длинную приводящую мышцу, большую приводящую мышцу, мышцу, приводящую большой палец кисти, локтевую мышцу, переднюю лестничную мышцу, суставную мышцу колена, двуглавую мышцу плеча, двуглавую мышцу бедра, плечевую мышцу, плечелучевую мышцу, щечную мышцу, клювовидно-плечевую мышцу, мышцу, сморщивающую бровь, дельтовидную мышцу, мышцу, опускающую угол рта, мышцу, опускающую нижнюю губу, двубрюшную мышцу, тыльные межкостные мышцы (кисти), тыльные межкостные мышцы (стопы), короткий лучевой разгибатель запястья, длинный лучевой разгибатель запястья, локтевой разгибатель запястья, разгибатель мизинца, разгибатель пальцев кисти, короткий разгибатель пальцев кисти, длинный разгибатель пальцев кисти, короткий разгибатель большого пальца стопы, длинный разгибатель большого пальца стопы, разгибатель указательного пальца, короткий разгибатель большого пальца, длинный разгибатель большого пальца, лучевой сгибатель запястья, локтевой сгибатель запястья, короткий сгибатель мизинца (кисти), короткий сгибатель мизинца (стопы), короткий сгибатель пальцев стопы, длинный сгибатель пальцев стопы, глубокий сгибатель пальцев кисти, поверхностный сгибатель пальцев кисти, короткий сгибатель большого пальца стопы, длинный сгибатель большого пальца стопы, короткий сгибатель большого пальца кисти, длинный сгибатель большого пальца кисти, лобную мышцу, икроножную мышцу, подбородочно-подъязычную мышцу, большую ягодичную мышцу, среднюю ягодичную мышцу, малую ягодичную мышцу, тонкую мышцу, подвздошно-реберную мышцу шеи, подвздошно-реберную мышцу поясницы, подвздошно-реберную мышцу груди, подвздошную мышцу, нижнюю близнецовую мышцу, нижнюю косую мышцу, нижнюю прямую мышцу, подостную мышцу, межостистые мышцы, межпоперечные мышцы, латеральную крыловидную мышцу, латеральную прямую мышцу, широчайшую мышцу спины, мышцу, поднимающую угол рта, мышцу, поднимающую верхнюю губу, мышцу, поднимающую верхнюю губу и крыло носа, мышцу, поднимающую верхнее веко, мышцу, поднимающую лопатку, длинные мышцы-вращатели, длиннейшую мышцу головы, длиннейшую мышцу шеи, длиннейшую мышцу груди, длинную мышцу головы, длинную мышцу шеи, червеобразные мышцы (кисти), червеобразные мышцы (стопы), жевательную мышцу, медиальную крыловидную мышцу, медиальную прямую мышцу, среднюю лестничную мышцу, многораздельные мышцы, челюстно-подъязычную мышцу, нижнюю косую мышцу головы, верхнюю косую мышцу головы, наружную запирательную мышцу, внутреннюю запирательную мышцу, затылочную мышцу, лопаточно-подъязычную мышцу, мышцу, противопоставляющую мизинец, мышцу, противопоставляющую большой палец кисти, круговую мышцу глаза, круговую мышцу рта, ладонную межкостную мышцу, короткую ладонную мышцу, длинную ладонную мышцу, гребенчатую мышцу, большую грудную мышцу, малую грудную мышцу, короткую малоберцовую мышцу, длинную малоберцовую мышцу, третью малоберцовую мышцу, грушевидную мышцу, подошвенные межкостные мышцы, подошвенную мышцу, подкожную мышцу шеи, подколенную мышцу, заднюю лестничную мышцу, квадратный пронатор, круглый пронатор, большую поясничную мышцу, квадратную мышцу бедра, квадратную мышцу подошвы, переднюю прямую мышцу головы, латеральную прямую мышцу головы, большую заднюю прямую мышцу головы, малую заднюю прямую мышцу головы, прямую мышцу бедра, большую ромбовидную мышцу, малую ромбовидную мышцу, мышцы смеха, портняжную мышцу, наименьшую лестничную мышцу, полуперепончатую мышцу, полуостистую мышцу головы, полуостистую мышцу шеи, полуостистую мышцу груди, полусухожильную мышцу, переднюю зубчатую мышцу, короткие мышцы-вращатели, камбаловидную мышцу, остистую мышцу головы, остистую мышцу шеи, остистую мышцу груди, ременную мышцу головы, ременную мышцу шеи, грудино-ключично-сосцевидную мышцу, грудино-подъязычную мышцу, грудино-щитовидную мышцу, шило-подъязычную мышцу, подключичную мышцу, подлопаточную мышцу, верхнюю близнецовую мышцу, верхнюю косую мышцу, верхнюю прямую мышцу, супинатор, надостную мышцу, височную мышцу, мышцу, напрягающую широкую фасцию, большую круглую мышцу, малую круглую мышцу, мышцы груди, щито-подъязычную мышцу, переднюю болыпеберцовую мышцу, заднюю болынеберцовую мышцу, трапециевидную мышцу, трехглавую мышцу плеча, промежуточную широкую мышцу бедра, латеральную широкую мышцу бедра, медиальную широкую мышцу бедра, большую скуловую мышцу и малую скуловую мышцу, и любые другие подходящие скелетные мышцы, известные в данной области.[00434] In addition, a composition containing the cDNA FVIII protein expression vector disclosed herein that is administered to skeletal muscle may be administered to skeletal muscle in the extremities (e.g., upper arm, lower arm, upper arm). legs and/or lower leg), back, neck, head (e.g. tongue), chest, abdomen, pelvis/perineum and/or fingers. Suitable skeletal muscles include, but are not limited to, abductor digiti minimi (hand), abductor pollicis (foot), abductor pollicis, abductor pollicis 5, abductor pollicis brevis, abductor pollicis longus , adductor brevis, adductor hallucis, adductor longus, adductor magnus, adductor pollicis, anconeus, anterior scalene, articular knee, biceps brachii, biceps femoris, brachialis, brachioradialis muscle, buccal muscle, coracobrachialis muscle, corrugator brow muscle, deltoid muscle, depressor anguli oris muscle, depressor labii inferioris muscle, digastric muscle, dorsal interosseous muscles (hands), dorsal interosseous muscles (feet), extensor radialis brevis wrist, extensor carpi radialis longus, extensor carpi ulnaris, extensor of the little finger, extensor digitorum, extensor digitorum brevis, extensor digitorum longus, extensor hallucis brevis, extensor hallucis longus, extensor index finger, extensor pollicis brevis, long extensor pollicis, flexor carpi radialis, flexor carpi ulnaris, flexor digitorum brevis, flexor digitorum brevis, flexor digitorum brevis, flexor digitorum longus, flexor digitorum profundus, flexor digitorum superficialis, flexor hallucis brevis foot, flexor hallucis longus, flexor hallucis brevis, flexor hallucis longus, frontalis, gastrocnemius, geniohyoid, gluteus maximus, gluteus medius, gluteus minimus, gracilis, iliocostalis neck, iliocostalis lumborum, iliocostalis pectoralis, iliacus, inferior gemellus, inferior oblique, inferior rectus, infraspinatus, interspinous muscles, intertransverse muscles, lateral pterygoid, lateral rectus, latissimus dorsi, levator anguli oris, levator labii superioris, levator labii superioris and alae nasi, levator superior pallidum, levator scapulae, long rotator cuff, longissimus capitis, longissimus colli, longissimus thoracis, longus capitis muscle, longus colli muscle, lumbrical muscles (hands), lumbrical muscles (feet), masseter muscle, medial pterygoid muscle, medial rectus muscle, middle scalenus muscle, multifidus muscles, mylohyoid muscle, inferior oblique muscle capitis, superior oblique muscle capitis, obturator externus, obturator internus, occipital muscle, omohyoid muscle, opponus little finger muscle, opponus pollicis muscle, orbicularis oculi muscle, orbicularis oris muscle, palmar interosseous muscle, palmaris brevis, palmaris longus muscle, pectineus muscle, pectoralis major muscle, pectoralis minor muscle, peroneus brevis, peroneus longus muscle, peroneus 3 muscle, piriformis muscle, plantar interosseous muscles, plantaris muscle, subcutaneous neck muscle, popliteus muscle, posterior scalenus muscle, pronator quadratus muscle, pronator teres muscle muscle, psoas major, quadratus femoris, quadratus plantaris, rectus capitis anterior, rectus capitis lateralis, rectus capitis posterior major, rectus capitis posterior minor, rectus femoris, rhomboid major, rhomboid minor, laughter muscles, sartorius muscle, scalenus minor, semimembranosus, semispinalis capitis, semispinalis cervicis, semispinalis pectoralis, semitendinosus, serratus anterior, rotator brevis, soleus, spinalis capitis, spinalis cervicis, spinalis pectoralis, splenius muscle head, splenius neck muscle, sternocleidomastoid muscle, sternohyoid muscle, sternothyroid muscle, stylohyoid muscle, subclavian muscle, subscapularis muscle, superior gemellus muscle, superior oblique muscle, superior rectus muscle, supinator muscle, supraspinatus muscle , temporalis, tensor fasciae lata, teres major, teres minor, chest muscles, thyrohyoid, tibialis anterior, tibialis posterior, trapezius, triceps brachii, vastus intermedius, vastus lateralis , vastus medialis, zygomaticus major and zygomaticus minor, and any other suitable skeletal muscles known in the art.

[00435] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в диафрагмальную мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно некоторым вариантам реализации доставка экспрессированного с зкДНК-вектора трансгена в ткань-мишень также может быть достигнута путем доставки синтетического депо, содержащего зкДНК-вектор, причем депо, содержащее зкДНК-вектор, имплантируют в скелетную, гладкомышечную, сердечную и/или диафрагмальную мышечную ткань или мышечная ткань может быть приведена в контакт с пленкой или другим матриксом, содержащим зкДНК-вектор, как описано в данном документе. Такие имплантируемые матриксы или субстраты описаны в патенте США №7201898.[00435] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into the diaphragm muscle can be accomplished by any suitable route, including intravenous administration, intra-arterial administration, and/or intraperitoneal administration. In some embodiments, delivery of a transgene expressed from a cccDNA vector to a target tissue can also be achieved by delivering a synthetic depot containing the cccDNA vector, wherein the depot containing the cccDNA vector is implanted into skeletal, smooth muscle, cardiac, and/or diaphragmatic muscle tissue or the muscle tissue may be contacted with a film or other matrix containing the cDNA vector, as described herein. Such implantable matrices or substrates are described in US Pat. No. 7,201,898.

[00436] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в сердечную мышцу включает введение в левое предсердие, правое предсердие, левый желудочек, правый желудочек и/или перегородку. ЗкДНК-вектор, описанный в данном документе, может быть доставлен в сердечную мышцу путем внутривенного введения, внутриартериального введения, такого как внутриаортальное введение, прямой сердечной инъекции (например, в левое предсердие, правое предсердие, левый желудочек, правый желудочек), и/или перфузии коронарной артерии.[00436] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into cardiac muscle includes administration into the left atrium, right atrium, left ventricle, right ventricle, and/or septum. The cccDNA vector described herein can be delivered to cardiac muscle by intravenous injection, intra-arterial injection such as intra-aortic injection, direct cardiac injection (eg, left atrium, right atrium, left ventricle, right ventricle), and/or coronary artery perfusion.

[00437] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в гладкую мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно одному варианту реализации введение можно осуществлять в эндотелиальные клетки, присутствующие в гладких мышцах, рядом с ними и/или на них. Неограничивающие примеры гладких мышц включают радужную оболочку глаза, бронхиолы легкого, мышцы гортани (голосовые связки), мышечные слои желудка, пищевода, тонкого и толстого кишечника желудочно-кишечного тракта, мочеточника, детрузора мочевого пузыря, миометрия матки, полового члена или простаты.[00437] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into smooth muscle can be accomplished by any suitable route, including intravenous administration, intra-arterial administration, and/or intraperitoneal administration. In one embodiment, administration can be performed into, adjacent to, and/or on endothelial cells present in smooth muscle. Non-limiting examples of smooth muscle include the iris, bronchioles of the lung, muscles of the larynx (vocal cords), muscle layers of the stomach, esophagus, small and large intestines of the gastrointestinal tract, ureter, detrusor bladder, myometrium of the uterus, penis or prostate.

[00438] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в скелетную мышцу, диафрагмальную мышцу и/или сердечную мышцу. В типичных вариантах реализации зкДНК-вектор в соответствии с настоящим изобретением применяют для лечения и/или предотвращения нарушений скелетной, сердечной и/или диафрагмальной мышцы.[00438] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is introduced into skeletal muscle, diaphragmatic muscle, and/or cardiac muscle. In exemplary embodiments, the cccDNA vector of the present invention is used to treat and/or prevent skeletal, cardiac, and/or diaphragmatic muscle disorders.

[00439] В частности, предусмотрено, что композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть доставлена в одну или более мышц глаза (например, боковую прямую мышцу, медиальную прямую мышцу, верхнюю прямую мышцу, нижнюю прямую мышцу, верхнюю косую мышцу, нижнюю косую мышцу), мимические мышцы (такие как затылочно-лобная мышца, височно-теменная мышца, мышца гордецов, носовая мышца, мышца, опускающая перегородку носа, круговая мышца глаза, мышца, сморщивающая бровь, мышца, опускающая бровь, ушные мышцы, круговая мышца рта, опускающая угол рта мышца, мышца смеха, большая скуловая мышца, малая скуловая мышца, поднимающая верхнюю губу мышца, поднимающая верхнюю губу и крыло носа мышца, опускающая нижнюю губу мышца, поднимающая угол рта мышца, щечная мышца, подбородочная мышца) или мышцы языка (например, подбородочно-язычную мышцу, подъязычно-язычную мышцу, хрящеязычную мышцу, шилоязычную мышцу, небно-язычную мышцу, верхнюю продольную мышцу, нижнюю продольную мышцу, вертикальную мышцу и поперечную мышцу).[00439] In particular, it is contemplated that a composition comprising the cDNA FVIII protein expression vector disclosed herein can be delivered to one or more muscles of the eye (e.g., lateral rectus, medial rectus, superior rectus, inferior rectus muscle, superior oblique muscle, inferior oblique muscle), facial muscles (such as the occipitofrontal muscle, temporo-parietal muscle, prouder muscle, nasal muscle, depressor septum nasal muscle, orbicularis oculi muscle, corrugator muscle, muscle, depressor brow, auricular muscles, orbicularis oris muscle, depressor anguli oris muscle, laughter muscle, zygomatic major muscle, zygomatic minor muscle, levator labii superioris muscle, levator superior lip and ala nasi muscle, depressor inferior lip muscle, levator anguli oris muscle, buccal muscle, mentalis muscle) or muscles of the tongue (eg, genioglossus muscle, hyoglossus muscle, cartilaginous muscle, styloglossus muscle, palatoglossus muscle, superior longitudinal muscle, inferior longitudinal muscle, vertical muscle and transverse muscle).

(i) Внутримышечная инъекция: Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введена путем инъекции в одно или более мест конкретной мышцы, например, скелетной мышцы (например, дельтовидной, латеральной широкой мышцы бедра, вентро-ягодичной мышцы тыльной ягодичной мышцы или переднебоковой мышцы бедра для младенцев), у субъекта с помощью иглы. Композиция, содержащая зкДНК, может быть введена в другие подтипы мышечных клеток. Неограничивающие примеры подтипов мышечных клеток включают клетки скелетных мышц, клетки сердечной мышцы, клетки гладких мышц и/или клетки диафрагмальной мышцы.(i) Intramuscular injection: In some embodiments, a composition comprising the cDNA FVIII protein expression vector disclosed herein can be administered by injection into one or more sites of a specific muscle, e.g., skeletal muscle (e.g., deltoid, vastus lateralis thigh muscle, ventrogluteal muscle, dorsal gluteus muscle, or anterolateral thigh muscle for infants), in the subject using a needle. The composition containing cccDNA can be introduced into other muscle cell subtypes. Non-limiting examples of muscle cell subtypes include skeletal muscle cells, cardiac muscle cells, smooth muscle cells and/or diaphragmatic muscle cells.

[00440] Способы внутримышечной инъекции известны специалистам в данной области техники и поэтому в данном документе подробно не описываются. Однако при выполнении внутримышечной инъекции соответствующий размер иглы следует определять на основании возраста и комплекции пациента, вязкости композиции, а также места инъекции. В Таблице 8 приведены рекомендации по примерным местам инъекции и соответствующему размеру иглы:[00440] Methods for intramuscular injection are known to those skilled in the art and therefore are not described in detail herein. However, when performing an intramuscular injection, the appropriate needle size should be determined based on the age and size of the patient, the viscosity of the composition, and the injection site. Table 8 provides guidelines for approximate injection sites and appropriate needle size:

[00441] Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в небольшом объеме, например, примерном объеме, представленном в Таблице 8, для конкретного субъекта. Согласно некоторым вариантам реализации перед инъекцией субъекту может быть введен общий или местный анестетик, при необходимости. Это особенно желательно, если требуется несколько инъекций или если инъекцию вводят в более глубокую мышцу, а не в обычные места инъекций, указанные выше.[00441] In certain embodiments, the cDNA FVIII protein expression vector disclosed herein is manufactured in a small volume, such as the approximate volume shown in Table 8, for a particular subject. In some embodiments, a general or local anesthetic may be administered to the subject prior to injection, as appropriate. This is especially desirable if multiple injections are required or if the injection is being given into a deeper muscle rather than the usual injection sites listed above.

[00442] Согласно некоторым вариантам реализации внутримышечную инъекцию можно комбинировать с электропорацией, давлением доставки или использованием реагентов для трансфекции для усиления клеточного поглощения зкДНК-вектора.[00442] In some embodiments, intramuscular injection can be combined with electroporation, pressure delivery, or the use of transfection reagents to enhance cellular uptake of the cccDNA vector.

(ii) Реагенты для трансфекции: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в виде композиций, содержащих один или более реагентов для трансфекции, чтобы облегчить поглощение векторов в мышечные трубочки или мышечную ткань. Таким образом, в одном варианте реализации, нуклеиновые кислоты, описанные в данном документе, вводят в мышечную клетку, мышечную трубочку или мышечную ткань путем трансфекции с использованием способов, описанных в другом месте в данном документе.(ii) Transfection Reagents: In some embodiments, the cDNA FVIII protein expression vector disclosed herein is formulated into compositions containing one or more transfection reagents to facilitate uptake of the vectors into myotubes or muscle tissue. Thus, in one embodiment, the nucleic acids described herein are introduced into a muscle cell, myotube, or muscle tissue by transfection using methods described elsewhere herein.

(iii) Электропорация: Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят без носителя для облегчения проникновения зкДНК в клетки или в физиологически инертном фармацевтически приемлемом носителе (т.е. в любом носителе, который не улучшает или не усиливает поглощение бескапсидных невирусных векторов в мышечные трубочки). Согласно таким вариантам реализации поглощение бескапсидного невирусного вектора может быть облегчено путем электропорации клетки или ткани.(iii) Electroporation: In certain embodiments, the cDNA FVIII protein expression vector disclosed herein is administered without a vehicle to facilitate entry of the ccDNA into cells or in a physiologically inert pharmaceutically acceptable vehicle (i.e., any vehicle that does not enhance or does not enhance the uptake of capsid-free nonviral vectors into myotubes). In such embodiments, uptake of the capsidless nonviral vector can be facilitated by electroporation of the cell or tissue.

[00443] Клеточные мембраны естественным образом устойчивы к проникновению внеклеточных объектов в цитоплазму клетки. Одним из методов временного уменьшения этой устойчивости является «электропорация», когда электрические поля используют для создания пор в клетках, не вызывая необратимого повреждения клеток. Эти поры достаточно велики, чтобы позволить ДНК-векторам, фармацевтическим препаратам, ДНК и другим полярным соединениям проникать внутрь клетки. Со временем поры в клеточной мембране закрываются, и клетка снова становится непроницаемой.[00443] Cell membranes are naturally resistant to the penetration of extracellular objects into the cell cytoplasm. One method of temporarily reducing this resistance is “electroporation,” where electric fields are used to create pores in cells without causing permanent cell damage. These pores are large enough to allow DNA vectors, pharmaceuticals, DNA and other polar compounds to enter the cell. Over time, the pores in the cell membrane close and the cell becomes impenetrable again.

[00444] Электропорацию можно использовать в приложениях как in vitro, так и in vivo для введения, например, экзогенной ДНК в живые клетки. Для приложений in vitro, как правило, смешивают образец живых клеток с композицией, содержащей, например, ДНК. Затем клетки помещают между электродами, такими как параллельные пластины, и к смеси клетка/композиция прикладывают электрическое поле.[00444] Electroporation can be used in both in vitro and in vivo applications to introduce, for example, exogenous DNA into living cells. For in vitro applications, a sample of living cells is typically mixed with a composition containing, for example, DNA. The cells are then placed between electrodes, such as parallel plates, and an electric field is applied to the cell/composition mixture.

[00445] Существует ряд методов электропорации in vivo; электроды могут быть обеспечены в различных конфигурациях, таких как, например, штангенциркуль, который захватывает эпидермис, лежащий над областью клеток, подлежащих обработке. В качестве альтернативы, в ткань могут быть введены игольчатые электроды для доступа к клеткам, расположенным глубже. В любом случае, после инъекционного введения композиции, содержащей, например, нуклеиновые кислоты, в область обработки,[00445] There are a number of in vivo electroporation methods; the electrodes may be provided in various configurations, such as, for example, a caliper that engages the epidermis overlying the area of cells to be treated. Alternatively, needle electrodes can be inserted into the tissue to access cells located deeper. In any case, after injecting a composition containing, for example, nucleic acids into the treatment area,

электроды прикладывают к области электрическое поле. В некоторых приложениях электропорации электрическое поле представляет собой одиночный прямоугольный импульс порядка 100-500 В/см с длительностью от 10 до 60 мс. Такой импульс может генерироваться, например, в известных приложениях Electro Square Porator Т820, производимых ВТХ Division Genetronics, Inc.The electrodes apply an electric field to the area. In some electroporation applications, the electric field is a single rectangular pulse of the order of 100-500 V/cm with a duration of 10 to 60 ms. Such a pulse can be generated, for example, in the well-known Electro Square Porator T820 applications manufactured by BTX Division Genetronics, Inc.

[00446] Как правило, успешное поглощение, например, нуклеиновых кислот происходит только в том случае, если мышцу электрически стимулировать сразу или вскоре после введения композиции, например, путем инъекции в мышцу.[00446] Typically, successful uptake of, for example, nucleic acids occurs only if the muscle is electrically stimulated immediately or shortly after administration of the composition, for example, by injection into the muscle.

[00447] Согласно определенным вариантам реализации электропорация достигается с использованием импульсов электрических полей или с использованием схем обработки с низким напряжением/длинными импульсами (например, с использованием системы электропорации с прямоугольными импульсами). Примерные генераторы импульсов, способные генерировать импульсное электрическое поле, включают, например, ЕСМ600, который может генерировать экспоненциальную форму волны, и ElectroSquarePorator (Т820), который может генерировать прямоугольную форму волны, оба из которых доступны от ВТХ, подразделения Genetronics, Inc. (Сан-Диего, Калифорния). Системы электропорации с прямоугольной волной доставляют контролируемые электрические импульсы, которые быстро повышаются до заданного напряжения, остаются на этом уровне в течение заданного периода времени (длительность импульса), а затем быстро падают до нуля.[00447] In certain embodiments, electroporation is achieved using pulsed electric fields or using low voltage/long pulse processing schemes (eg, using a square pulse electroporation system). Exemplary pulse generators capable of generating a pulsed electric field include, for example, the ECM600, which can generate an exponential waveform, and the ElectroSquarePorator (T820), which can generate a square waveform, both of which are available from BTX, a division of Genetronics, Inc. (San Diego, California). Square wave electroporation systems deliver controlled electrical pulses that rise rapidly to a set voltage, remain at that level for a set period of time (pulse duration), and then quickly fall to zero.

[00448] Согласно некоторым вариантам реализации местный анестетик вводят, например, путем инъекции в место обработки, чтобы уменьшить боль, которая может быть ассоциирована с электропорацией ткани в присутствии композиции, содержащей бескапсидный невирусный вектор, как описано в данном документе. Кроме того, специалист в данной области техники поймет, что следует выбирать дозу композиции, которая сводит к минимуму и/или предотвращает чрезмерное повреждение ткани, приводящее к фиброзу, некрозу или воспалению мышцы.[00448] In some embodiments, a local anesthetic is administered, for example, by injection into a treatment site to reduce pain that may be associated with electroporation of tissue in the presence of a composition comprising a capsidless non-viral vector, as described herein. In addition, one skilled in the art will appreciate that a dose of the composition should be selected that minimizes and/or prevents excessive tissue damage leading to fibrosis, necrosis, or inflammation of the muscle.

(iv) Давление доставки: Согласно некоторым вариантам реализации доставку зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечную ткань облегчают с помощью давления доставки, при котором используется комбинация больших объемов и быстрой инъекции в артерию, снабжающую конечность (например, подвздошную артерию). Этот способ введения может быть достигнут с помощью множества способов, которые включают вливание в сосудистую сеть конечности композиции, содержащей зкДНК-вектор, как правило, при изоляции мышцы от большого круга кровообращения с помощью жгута сосудистого зажима. В одном методе композиция циркулирует через сосудистую сеть конечности, чтобы обеспечить возможность экстравазации в клетки. В другом методе внугрисосудистое гидродинамическое давление увеличивается для расширения сосудистых лож и увеличения поглощения зкДНК-вектора в мышечные клетки или ткань. Согласно одному варианту реализации композицию зкДНК вводят в артерию.(iv) Delivery Pressure: In some embodiments, delivery of the cDNA FVIII protein expression vector disclosed herein to muscle tissue is facilitated by delivery pressure that uses a combination of high volumes and rapid injection into an artery supplying a limb (e.g., iliac artery). This route of administration can be achieved by a variety of methods that involve infusing the vasculature of the limb with a composition containing the cccDNA vector, typically while isolating the muscle from the systemic circulation using a vascular clamp tourniquet. In one method, the composition is circulated through the vasculature of the limb to allow extravasation into cells. In another method, intravascular hydrodynamic pressure is increased to dilate vascular beds and increase uptake of the cccDNA vector into muscle cells or tissue. In one embodiment, the cccDNA composition is administered into an artery.

(v) Композиции липидпых напочастиц: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, для внутримышечной доставки изготавливают в виде композиции, содержащей липосому, как описано в другом месте в данном документе(v) Lipid Particulate Compositions: In some embodiments, the cDNA FVIII protein expression vector disclosed herein for intramuscular delivery is formulated as a composition containing a liposome, as described elsewhere herein.

(vi) Системное введение зкДНК-вектора, нацеленного на мышечную ткань: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготовлен для нацеливания на мышцу за счет введения путем непрямой доставки, при котором зкДНК транспортируется в мышцу, а не в печень. Соответственно, технология, описанная в данном документе, включает непрямое введение композиций, содержащих зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, в мышечную ткань, например, путем системного введения. Такие композиции можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, подкожно, внутрь полости, и их можно доставлять с помощью перистальтических средств, при необходимости, или с помощью других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно, например, путем внутривенной инфузии.(vi) Systemic administration of a cccDNA vector targeting muscle tissue: In some embodiments, the cccDNA vector for FVIII protein expression disclosed herein is formulated to target muscle through administration by indirect delivery, in which the cccDNA is transported into the muscle, and not to the liver. Accordingly, the technology described herein involves indirectly introducing compositions containing the cDNA FVIII protein expression vector disclosed herein into muscle tissue, for example, by systemic administration. Such compositions can be administered topically, intravenously (by bolus or continuous infusion), by intracellular injection, interstitial injection, orally, by inhalation, intraperitoneally, subcutaneously, intracavity, and they can be delivered by peristaltic means, if necessary, or with by other means known to those skilled in the art. If necessary, the agent can be administered systemically, for example, by intravenous infusion.

[00449] Согласно некоторым вариантам реализации поглощение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечные клетки/ткань увеличивается за счет использования нацеливающего агента или фрагмента, который преимущественно направляет вектор в мышечную ткань. Таким образом, в некоторых вариантах реализации бескапсидный зкДНК-вектор может быть сконцентрирован в мышечной ткани по сравнению с количеством бескапсидных зкДНК-векторов, присутствующих в других клетках или тканях организма.[00449] In some embodiments, uptake of a cccDNA FVIII protein expression vector disclosed herein into muscle cells/tissue is increased by the use of a targeting agent or moiety that preferentially targets the vector into muscle tissue. Thus, in some embodiments, the capsidless cccDNA vector may be concentrated in muscle tissue relative to the amount of capsidless cccDNA vectors present in other cells or tissues of the body.

[00450] Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, дополнительно содержит фрагмент, нацеливающий на мышечные клетки. Согласно другим вариантам реализации экспрессированный генный продукт содержит нацеливающий фрагмент, специфический для ткани, в котором его действие является желательным. Нацеливающий фрагмент может включать любую молекулу или комплекс молекул, которые способны нацеливаться, взаимодействовать, соединяться и/или связываться с внутриклеточным, поверхностным или внеклеточным биомаркером клетки или ткани. Биомаркер может включать, например, клеточную протеазу, киназу, белок, рецептор клеточной поверхности, липид и/или алифатическую кислоту. Другие примеры биомаркеров, на которые могут быть нацелены, с которыми могут взаимодействовать, соединяться и/или связываться нацеливающие фрагменты, включают молекулы, ассоциированные с конкретным заболеванием. Например, биомаркеры могут включать рецепторы клеточной поверхности, участвующие в развитии рака, такие как рецептор эпидермального фактора роста и рецептор трансферрина. Нацеливающие фрагменты могут включать, но не ограничиваются перечисленными, синтетические соединения, природные соединения или продукты, макромолекулярные объекты, биосконструированные молекулы (например, полипептиды, липиды, полинуклеотиды, антитела, фрагменты антител) и малые объекты (например, малые молекулы, нейротрансмиттеры, субстраты, лиганды, гормоны и соединения элементов), которые связываются с молекулами, экспрессируемыми в целевой мышечной ткани.[00450] In some embodiments, a composition comprising a cDNA FVIII protein expression vector disclosed herein further comprises a muscle cell targeting moiety. In other embodiments, the expressed gene product contains a targeting moiety specific to the tissue in which its action is desired. A targeting moiety may include any molecule or complex of molecules that is capable of targeting, interacting, connecting and/or binding to an intracellular, surface or extracellular biomarker of a cell or tissue. The biomarker may include, for example, a cellular protease, kinase, protein, cell surface receptor, lipid and/or aliphatic acid. Other examples of biomarkers that can be targeted, interacted with, coupled to and/or bind to targeting moieties include molecules associated with a particular disease. For example, biomarkers may include cell surface receptors involved in cancer development, such as epidermal growth factor receptor and transferrin receptor. Targeting moieties may include, but are not limited to, synthetic compounds, natural compounds or products, macromolecular entities, bioengineered molecules (e.g., polypeptides, lipids, polynucleotides, antibodies, antibody fragments), and small entities (e.g., small molecules, neurotransmitters, substrates, ligands, hormones and elemental compounds) that bind to molecules expressed in the target muscle tissue.

[00451] Согласно определенным вариантам реализации нацеливающий фрагмент может дополнительно содержать рецепторную молекулу, включая, например, рецепторы, которые естественным образом распознают конкретную целевую молекулу клетки-мишени. Такие рецепторные молекулы включают рецепторы, которые были модифицированы для повышения их специфичности взаимодействия с молекулой-мишенью, рецепторы, которые были модифицированы для взаимодействия с целевой молекулой-мишенью, не распознаваемой рецептором в естественных условиях, и фрагменты таких рецепторов (см., например, Skerra, 2000, J. Molecular Recognition, 13:167-187). Предпочтительный рецептор представляет собой рецептор хемокина. Примерные рецепторы хемокинов описаны, например, в Lapidot et al, 2002, Exp Hematol, 30:973-81 и Onuffer et al., 2002, Trends Pharmacol Sci, 23:459-67.[00451] In certain embodiments, the targeting moiety may further comprise a receptor molecule, including, for example, receptors that naturally recognize a particular target cell molecule. Such receptor molecules include receptors that have been modified to increase their specificity of interaction with a target molecule, receptors that have been modified to interact with a target molecule not recognized by the receptor in vivo, and fragments of such receptors (see, for example, Skerra , 2000, J. Molecular Recognition, 13:167-187). A preferred receptor is a chemokine receptor. Exemplary chemokine receptors are described, for example, in Lapidot et al, 2002, Exp Hematol, 30:973-81 and Onuffer et al., 2002, Trends Pharmacol Sci, 23:459-67.

[00452] Согласно другим вариантам реализации дополнительный нацеливающий фрагмент может содержать молекулу лиганда, включая, например, лиганды, которые естественным образом распознают конкретный целевой рецептор клетки-мишени, такой как лиганд трансферрина (Tf). Такие молекулы лигандов включают лиганды, которые были модифицированы для повышения их специфичности взаимодействия с рецептором-мишенью, лиганды, которые были модифицированы для взаимодействия с целевым рецептором, который не распознается лигандом в естественных условиях, и фрагменты таких лигандов.[00452] In other embodiments, the additional targeting moiety may comprise a ligand molecule, including, for example, ligands that naturally recognize a particular target cell receptor, such as a transferrin (Tf) ligand. Such ligand molecules include ligands that have been modified to increase their specificity for interaction with a target receptor, ligands that have been modified to interact with a target receptor that is not recognized by the ligand in natural conditions, and fragments of such ligands.

[00453] Согласно другим вариантам реализации нацеливающий фрагмент может содержать аптамер. Аптамеры представляют собой олигонуклеотиды, выбранные для специфичного связывания с целевой молекулярной структурой клетки-мишени. Аптамеры, как правило, представляют собой продукты способа селекции по аффинности, сходного с селекцией по аффинности при фаговом дисплее (также известной как молекулярная эволюция in vitro). Способ включает выполнение нескольких тандемных итераций разделения по аффинности, например, с использованием твердой подложки, с которой связан патологический иммуноген, с последующей полимеразной цепной реакцией (ПЦР) для амплификации нуклеиновых кислот, которые связались с иммуногенами. Таким образом, каждый раунд аффинного разделения обогащает популяцию нуклеиновых кислот молекулами, которые успешно связывают целевой иммуноген. Таким путем случайный пул нуклеиновых кислот может быть «обучен» с получением аптамеров, которые специфично связывают молекулы-мишени. Аптамеры, как правило, представляют собой РНК, но могут представлять собой ДНК или ее аналоги или производные, такие как, без ограничения, пептидные нуклеиновые кислоты (ПНК) и фосфотиоатные нуклеиновые кислоты.[00453] In other embodiments, the targeting moiety may comprise an aptamer. Aptamers are oligonucleotides selected to specifically bind to the target molecular structure of the target cell. Aptamers are typically the products of an affinity selection process similar to affinity selection in phage display (also known as in vitro molecular evolution). The method involves performing multiple tandem iterations of affinity separation, for example using a solid support to which the pathological immunogen is bound, followed by polymerase chain reaction (PCR) to amplify nucleic acids that have bound to the immunogens. Thus, each round of affinity separation enriches the nucleic acid population with molecules that successfully bind the target immunogen. In this way, a random pool of nucleic acids can be “trained” to produce aptamers that specifically bind target molecules. Aptamers are typically RNA, but may be DNA or analogs or derivatives thereof, such as, but not limited to, peptide nucleic acids (PNAs) and phosphorothioate nucleic acids.

[00454] Согласно некоторым вариантам реализации нацеливающий фрагмент может содержать фоторазлагаемый лиганд (т.е. «запертый» лиганд), который высвобождается, например, под действием сфокусированного луча света так, что бескапсидные невирусные векторы или генный продукт нацеливаются на конкретную ткань.[00454] In some embodiments, the targeting moiety may comprise a photodegradable ligand (i.e., a “locked” ligand) that is released, for example, by exposure to a focused beam of light such that the capsidless nonviral vectors or gene product are targeted to a specific tissue.

[00455] В данном документе также предусмотрено, что композиции доставляют в несколько мест в одной или более мышцах субъекта. Таким образом, инъекции могут быть сделаны в по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 35, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50, по меньшей мере 55, по меньшей мере 60, по меньшей мере 65, по меньшей мере 70, по меньшей мере 75, по меньшей мере 80, по меньшей мере 85, по меньшей мере 90, по меньшей мере 95, по меньшей мере 100 местах инъекций. Такие места могут быть распределены по площади одной мышцы или могут быть распределены между несколькими мышцами.[00455] It is also provided herein that the compositions are delivered to multiple sites in one or more muscles of a subject. Thus, injections can be made in at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least at least 10, at least 15, at least 20, at least 25, at least 30, at least 35, at least 40, at least 45, at least 50, at least 55, at least at least 60, at least 65, at least 70, at least 75, at least 80, at least 85, at least 90, at least 95, at least 100 injection sites. Such sites may be distributed over the area of one muscle or may be distributed among several muscles.

В. Введение зкДНК-вектора для экспрессии белка FVIII в немышечные местаB. Introduction of cccDNA vector for expression of FVIII protein in non-muscle sites

[00456] Согласно другому варианту реализации зкДНК-вектор для экспрессии белка FVIII вводят в печень. ЗкДНК-вектор также можно вводить в различные области глаза, такие как роговица и/или зрительный нерв. ЗкДНК-вектор также можно вводить в спинной мозг, ствол мозга (продолговатый мозг, мост), средний мозг (гипоталамус, таламус, эпиталамус, гипофиз, черную субстанцию, эпифиз), мозжечок, конечный мозг (полосатое тело, полушария головного мозга, включая затылочную, височную, теменную и лобную доли, кору, базальные ганглии, гиппокамп и амигдалу), лимбическую систему, неокортекс, полосатое тело, полушария головного мозга и нижний холмик четверохолмия. ЗкДНК-вектор может быть доставлен в спинномозговую жидкость (например, с помощью люмбальной пункции). ЗкДНК-вектор для экспрессии белка FVIII можно дополнительно Glu G1 внутрисосудисто в ЦНС в ситуациях, когда нарушен гематоэнцефалический барьер (например, опухоль головного мозга или церебральный инфаркт).[00456] In another embodiment, a cccDNA vector for expressing FVIII protein is administered to the liver. The cDNA vector can also be injected into various areas of the eye, such as the cornea and/or optic nerve. The cDNA vector can also be injected into the spinal cord, brainstem (medulla oblongata, pons), midbrain (hypothalamus, thalamus, epithalamus, pituitary gland, substantia nigra, pineal gland), cerebellum, telencephalon (striatum, cerebral hemispheres, including the occipital , temporal, parietal and frontal lobes, cortex, basal ganglia, hippocampus and amygdala), limbic system, neocortex, striatum, cerebral hemispheres and inferior colliculus. The cctDNA vector can be delivered into the cerebrospinal fluid (eg, via lumbar puncture). A cccDNA vector for FVIII protein expression can be additionally Glu G1 intravascularly into the CNS in situations where the blood-brain barrier is disrupted (eg, brain tumor or cerebral infarction).

[00457] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII можно вводить в целевую область (области) глаза любым путем, известным в данной области техники, включая, но не ограничиваясь перечисленными, интратекальную, внутриглазную, интрацеребральную, в нутриже луд очковую, внутривенную (например, в присутствии сахара, такого как маннит), интраназальную, внутриушную, внутриглазную (например, интравитреальную, субретинальную, в переднюю камеру) и периокулярную (например, в субтенонову область) доставку, а также внутримышечную доставку с ретроградной доставкой к двигательным нейронам.[00457] In some embodiments, the cDNA vector for expressing the FVIII protein can be administered to the target area(s) of the eye by any route known in the art, including, but not limited to, intrathecal, intraocular, intracerebral, intraocular, ophthalmic, intravenous (eg, in the presence of a sugar such as mannitol), intranasal, intraaural, intraocular (eg, intravitreal, subretinal, anterior chamber) and periocular (eg, sub-Tenon's region) delivery, and intramuscular delivery with retrograde delivery to motor neurons .

[00458] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в жидком составе путем прямой инъекции (например, стереотаксической инъекции) в целевую область или компартмент в ЦНС. Согласно другим вариантам реализации зкДНК-вектор может быть обеспечен путем местного нанесения на целевую область или путем интраназального введения аэрозольного состава. Введение в глаз можно осуществлять путем местного нанесения жидких капель. В качестве дополнительной альтернативы зкДНК-вектор можно вводить в виде твердого состава с медленным высвобождением (см., например, патент США №7201898). Согласно другим дополнительным вариантам реализации зкДНК-вектор можно применять для ретроградного транспорта для лечения, облегчения и/или предотвращения заболеваний и нарушений, затрагивающих двигательные нейроны (например, бокового амиотрофического склероза (БАС); спинальной мышечной атрофии (СМА) и т.д.). Например, зкДНК-вектор может быть доставлен в мышечную ткань, из которой он может мигрировать в нейроны.[00458] In some embodiments, the cccDNA vector for expression of the FVIII protein is administered in a liquid formulation by direct injection (eg, stereotactic injection) into a target area or compartment in the CNS. In other embodiments, the cccDNA vector may be provided by topical application to the target area or by intranasal administration of an aerosol formulation. Administration to the eye can be accomplished by topical application of liquid drops. As a further alternative, the cDNA vector can be administered as a slow release solid formulation (see, for example, US Pat. No. 7,201,898). In other additional embodiments, the cccDNA vector can be used for retrograde transport to treat, alleviate, and/or prevent diseases and disorders affecting motor neurons (e.g., amyotrophic lateral sclerosis (ALS); spinal muscular atrophy (SMA), etc.) . For example, the cccDNA vector can be delivered to muscle tissue, from which it can migrate into neurons.

С. Лечение ex vivoC. Ex vivo treatment

[00459] Согласно некоторым вариантам реализации клетки извлекают из организма субъекта, вводят в них зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и затем клетки возвращают в организм субъекта. Способы извлечения клеток из организма субъекта для лечения ex vivo с последующим введением обратно в организм субъекта известны в данной области техники (см., например, патент США №5399346; содержание которого полностью включено в данный документ). В качестве альтернативы, зкДНК-вектор вводят в клетки, полученные от другого субъекта, в культивируемые клетки или в клетки из любого другого подходящего источника, и указанные клетки вводят нуждающемуся в этом субъекту.[00459] In some embodiments, the cells are removed from the subject, the cDNA FVIII protein expression vector disclosed herein is introduced into the cells, and the cells are then returned to the subject. Methods for extracting cells from a subject for treatment ex vivo and then reintroducing them back into the subject are known in the art (see, for example, US Pat. No. 5,399,346; the contents of which are incorporated herein in their entirety). Alternatively, the cccDNA vector is introduced into cells obtained from another subject, into cultured cells, or into cells from any other suitable source, and the cells are administered to a subject in need thereof.

[00460] Клетки, трансдуцированные зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе, предпочтительно вводят субъекту в «терапевтически эффективном количестве» в комбинации с фармацевтическим носителем. Специалисты в данной области техники поймут, что терапевтические эффекты не обязательно должны быть полными или обеспечивать исцеление, при условии, что для субъекта они в какой-то мере благоприятны.[00460] Cells transduced with the cDNA FVIII protein expression vector disclosed herein are preferably administered to a subject in a "therapeutically effective amount" in combination with a pharmaceutical carrier. Those skilled in the art will appreciate that therapeutic effects need not be complete or provide a cure, as long as they are beneficial to the subject in some way.

[00461] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, описанный в данном документе (иногда называемый трансгеном или гетерологичной нуклеотидной последовательностью), который должен продуцироваться в клетке in vitro, ex vivo или in vivo. Например, в отличие от применения зкДНК-векторов, описанных в данном документе, в способе лечения, который обсуждается в данном документе, в некоторых вариантах реализации зкДНК-вектор для экспрессии белка FVIII может быть введен в культивируемые клетки, и экспрессированный белок FVIII может быть выделен из клеток, например, для получения антител и слитых белков. Согласно некоторым вариантам реализации культивируемые клетки, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для коммерческого получения антител или слитых белков, например, в качестве источника клеток для мелкомасштабного или крупномасштабного биоизготовления антител или слитых белков. В альтернативных вариантах реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в клетки у субъекта-хозяина, не являющегося человеком, для продуцирования антител или слитых белков in vivo, включая мелкомасштабное получение, а также коммерческое крупномасштабное получение белка FVIII.[00461] In some embodiments, the cccDNA FVIII protein expression vector disclosed herein may encode the FVIII protein described herein (sometimes referred to as a transgene or heterologous nucleotide sequence) that is to be produced in a cell in vitro, ex vivo, or in vivo. For example, in contrast to the use of cccDNA vectors described herein in a method of treatment discussed herein, in some embodiments, a cccDNA vector for expression of FVIII protein can be introduced into cultured cells and the expressed FVIII protein can be isolated from cells, for example to produce antibodies and fusion proteins. In some embodiments, cultured cells containing the cDNA FVIII protein expression vector disclosed herein can be used to commercially produce antibodies or fusion proteins, for example, as a source of cells for small-scale or large-scale biomanufacturing of antibodies or fusion proteins. In alternative embodiments, the cDNA FVIII protein expression vector disclosed herein is introduced into cells in a non-human host for the production of antibodies or fusion proteins in vivo, including small-scale production as well as commercial large-scale production of FVIII protein.

[00462] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять как в ветеринарных, так и в медицинских приложениях. Подходящие субъекты для способов доставки генов ex vivo, описанных выше, включают как птиц (например, кур, уток, гусей, перепелов, индеек и фазанов), так и млекопитающих (например, человека, бычьих, овечьих, козьих, лошадиных, кошачьих, собачьих и зайцеобразных), при этом предпочтительными являются млекопитающие. Субъекты-люди являются наиболее предпочтительными. Субъекты-люди включают новорожденных, младенцев, детей и подростков, и взрослых людей.[00462] The cDNA FVIII protein expression vectors disclosed herein can be used in both veterinary and medical applications. Suitable subjects for the ex vivo gene delivery methods described above include both birds (e.g., chickens, ducks, geese, quail, turkeys, and pheasants) and mammals (e.g., human, bovine, ovine, goat, equine, feline, canine) and lagomorphs), with mammals being preferred. Human subjects are most preferred. Human subjects include newborns, infants, children and adolescents, and adults.

D. Диапазоны дозD. Dose Ranges

[00463] В данном документе предложены способы лечения, включающие введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий белок FVIII, как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к введенному количеству композиции зкДНК, которое приводит к экспрессии белка FVIII в «терапевтически эффективном количестве» для лечения гемофилии А.[00463] Provided herein are methods of treatment comprising administering to a subject an effective amount of a composition comprising a cccDNA vector encoding an FVIII protein as described herein. As will be appreciated by a skilled practitioner, the term "effective amount" refers to an administered amount of a cccDNA composition that results in the expression of FVIII protein in a "therapeutically effective amount" for the treatment of hemophilia A.

[00464] Анализы in vivo и/или in vitro необязательно можно использовать, чтобы облегчить определение оптимальных диапазонов дозировок для применения. Точная доза, которая должна быть использована в составе, также будет зависеть от пути введения и серьезности состояния и должна определяться в соответствии с суждением обычного специалиста в данной области техники и обстоятельствами каждого субъекта. Эффективные дозы можно экстраполировать из кривых доза-ответ, полученных из тест-систем in vitro или в моделях на животных.[00464] In vivo and/or in vitro assays may optionally be used to facilitate the determination of optimal dosage ranges for use. The exact dosage to be used in the formulation will also depend on the route of administration and the severity of the condition and should be determined in accordance with the judgment of one of ordinary skill in the art and the circumstances of each subject. Effective doses can be extrapolated from dose-response curves obtained from in vitro test systems or animal models.

[00465] для экс пр есс ии белка FVIII, раскрытые в данном документе, вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса и экспрессии генов без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются ими, те, которые описаны выше в разделе «Введение», такие как прямая доставка в выбранный орган (например, внутрипортальная доставка в печень), пероральный, ингаляционный (включая интраназальную и внутритрахеальную доставку), 1035 внутриопухолевый и другие исходные пути введения. Пути введения могут быть скомбинированы, если требуется.[00465] for protein expression, the FVIIIs disclosed herein are administered in quantities sufficient to transfect cells of the target tissue and ensure sufficient levels of gene transfer and expression without undue adverse effects. Conventional and pharmaceutically acceptable routes of administration include, but are not limited to, those described above in the Introduction section, such as direct delivery to the target organ (eg, intraportal delivery to the liver), oral, inhalation (including intranasal and intratracheal delivery) , 1035 intratumoral and other initial routes of administration. Routes of administration can be combined if required.

[00466] Доза количества зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, необходимая для достижения определенного «терапевтического эффекта», будет варьироваться в зависимости от нескольких факторов, включая, но не ограничиваясь перечисленными: путь введения нуклеиновой кислоты, уровень экспрессии гена или РНК, необходимый для достижения терапевтического эффекта, конкретное заболевание или нарушение, которое лечат, и стабильность гена (ов), продукта (ов) РНК или полученного экспрессированного белка (ов). Специалист в данной области техники может легко определить диапазон доз зкДНК-вектора для лечения пациента, страдающего конкретным заболеванием или нарушением, на основании вышеупомянутых факторов, а также других факторов, которые хорошо известны в данной области техники.[00466] The amount of cccDNA FVIII protein expression vectors disclosed herein required to achieve a given “therapeutic effect” will vary depending on several factors, including, but not limited to: route of nucleic acid administration, level of gene expression or RNA required to achieve a therapeutic effect, the particular disease or disorder being treated, and the stability of the gene(s), RNA product(s), or resulting expressed protein(s). One skilled in the art can readily determine a dosage range of a cccDNA vector for treating a patient suffering from a particular disease or disorder based on the above factors as well as other factors that are well known in the art.

[00467] Схему дозирования можно корректировать для обеспечения оптимального терапевтического ответа. Например, олигонуклеотид может быть введен повторно, например, несколько доз могут быть введены ежедневно или дозу можно пропорционально уменьшать в соответствии с требованиями терапевтической ситуации. Обычный специалист в данной области техники легко сможет определить подходящие дозы и схемы введения рассматриваемых олигонуклеотидов, независимо от того, должны быть введены олигонуклеотиды в клетки или субъектам.[00467] The dosage schedule can be adjusted to ensure optimal therapeutic response. For example, the oligonucleotide can be administered repeatedly, for example, several doses can be administered daily or the dose can be proportionally reduced according to the requirements of the therapeutic situation. One of ordinary skill in the art will readily be able to determine appropriate dosages and administration schedules for the oligonucleotides in question, regardless of whether the oligonucleotides are to be administered to cells or subjects.

[00468] «Терапевтически эффективная доза» будет находиться в относительно широком диапазоне, который может быть определен посредством клинических исследований, и будет зависеть от конкретного применения (нервным клеткам потребуются очень небольшие количества, в то время как системная инъекция потребует больших количеств). Например, для прямой инъекции in vivo в скелетную или сердечную мышцу субъекта-человека терапевтически эффективная доза будет порядка от примерно 1 мкг до 100 г зкДНК-вектора. Если для доставки зкДНК-вектора используются экзосомы или микрочастицы, то терапевтически эффективная доза может быть определена экспериментально, но ожидается, что она доставит от 1 мкг до примерно 100 г вектора. Более того, терапевтически эффективная доза представляет собой количество зкДНК-вектора, которое экспрессирует достаточное количество трансгена, чтобы оказывать влияние на субъекта, которое приводит к уменьшению одного или более симптомов заболевания, но не приводит к значительным нецелевым эффектам или значительным нежелательным побочным эффектам. Согласно одному варианту реализации «терапевтически эффективное количество» представляет собой количество экспрессированного белка FVIII, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера гемофилии А или уменьшения симптома конкретного заболевания. Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК-вектора.[00468] A "therapeutically effective dose" will be within a relatively wide range, which can be determined through clinical studies, and will depend on the specific application (nerve cells will require very small amounts, while systemic injection will require large amounts). For example, for direct in vivo injection into skeletal or cardiac muscle of a human subject, a therapeutically effective dose would be on the order of about 1 μg to 100 g of cccDNA vector. If exosomes or microparticles are used to deliver the cccDNA vector, the therapeutically effective dose can be determined experimentally but is expected to deliver between 1 μg and approximately 100 g of vector. Moreover, a therapeutically effective dose is an amount of cccDNA vector that expresses a sufficient amount of the transgene to produce an effect in a subject that results in a reduction in one or more symptoms of the disease, but does not result in significant off-target effects or significant unwanted side effects. In one embodiment, a “therapeutically effective amount” is an amount of expressed FVIII protein that is sufficient to produce a statistically significant, measurable change in the expression of a hemophilia A biomarker or reduction in a symptom of a particular disease. Such effective amounts can be calibrated in clinical studies as well as in animal studies for a particular cDNA vector composition.

[00469] Изготовление растворов фармацевтически приемлемых вспомогательных веществ и носителей хорошо известно специалистам в данной области техники, как и разработка подходящих схем дозирования и лечения для использования конкретных композиций, описанных в данном документе, в различных схемах лечения.[00469] The preparation of solutions of pharmaceutically acceptable excipients and carriers is well known to those skilled in the art, as is the development of suitable dosage and treatment regimens for use of the specific compositions described herein in various treatment regimens.

[00470] Для трансфекции in vitro эффективное количество зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, для доставки в клетки (1×106 клеток) будет порядка от 0,1 до 100 мкг зкДНК-вектора, предпочтительно от 1 до 20 мкг и более предпочтительно от 1 до 15 мкг или от 8 до 10 мкг. Для более крупных зкДНК-векторов потребуются более высокие дозы. При использовании экзосом или микрочастиц, эффективная доза in vitro может быть определена экспериментально, но она будет предназначена для доставки в целом того же количества зкДНК-вектора.[00470] For in vitro transfection, an effective amount of cccDNA FVIII protein expression vectors disclosed herein for delivery into cells (1×10 6 cells) will be on the order of 0.1 to 100 μg of ccDNA vector, preferably 1 to 20 µg and more preferably 1 to 15 µg or 8 to 10 µg. Larger cccDNA vectors will require higher doses. When using exosomes or microparticles, the effective in vitro dose can be determined experimentally, but will be designed to deliver essentially the same amount of cccDNA vector.

[00471] Для лечения гемофилии А подходящая дозировка зкДНК-вектора, который экспрессирует белок FVIII, раскрытого в данном документе, будет зависеть от конкретного типа заболевания, подлежащего лечению, типа белка FVIII, степени тяжести и течения заболевания гемофилией А, предыдущей терапии, истории болезни пациента и реакции на антитело, а также от решения лечащего врача. ЗкДНК-вектор, кодирующий белок FVIII, подходящим образом вводят пациенту за один раз или в течение ряда обработок. В данном документе предусмотрены различные схемы дозирования, включая, но не ограничиваясь перечисленными, однократное или многократное введение в различные моменты времени, болюсное введение и импульсную инфузию.[00471] For the treatment of hemophilia A, the appropriate dosage of a cccDNA vector that expresses the FVIII protein disclosed herein will depend on the specific type of disease being treated, the type of FVIII protein, the severity and course of the hemophilia A disease, previous therapy, medical history patient and response to the antibody, as well as the decision of the attending physician. The cDNA vector encoding the FVIII protein is suitably administered to the patient at one time or over a series of treatments. Various dosing regimens are provided herein, including, but not limited to, single or multiple dosing at different times, bolus dosing, and pulse infusion.

[00472] В зависимости от типа и степени тяжести заболевания зкДНК-вектор вводят в количестве, при котором кодируемый белок FVIII экспрессируется в диапазоне от примерно 0,3 мг/кг до 100 мг/кг (например, от 15 мг/кг до 100 мг/кг или любой дозировке в пределах этого диапазона), с помощью одного или более отдельных введений или непрерывной инфузии. Одной типичной суточной дозы зкДНК-вектора достаточно, чтобы привести к экспрессии кодируемого белка FVIII в диапазоне от примерно 15 мг/кг до 100 мг/кг или более, в зависимости от факторов, упомянутых выше. Одна примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII, как раскрыто в данном документе, в диапазоне от примерно 10 мг/кг до примерно 50 мг/кг. Таким образом, пациенту может быть введена одна или более доз зкДНК-вектора в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII при примерно 0,5 мг/кг, 1 мг/кг, 1,5 мг/кг, 2,0 мг/кг, 3 мг/кг, 4,0 мг/кг, 5 мг/кг, 10 мг/кг, 15 мг/кг, 20 мг/кг, 25 мг/кг, 30 мг/кг, 35 мг/кг, 40 мг/кг, 50 мг/кг, 60 мг/кг, 70 мг/кг, 80 мг/кг, 90 мг/кг или 100 мг/кг (или любой их комбинации). Согласно некоторым вариантам реализации зкДНК-вектор представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII для общей дозы в диапазоне от 50 мг до 2500 мг. Примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к общей экспрессии кодируемого белка FVIII примерно 50 мг, примерно 100 мг, 200 мг, 300 мг, 400 мг, примерно 500 мг, примерно 600 мг, примерно 700 мг, примерно 720 мг, примерно 1000 мг, примерно 1050 мг, примерно 1100 мг, примерно 1200 мг, примерно 1300 мг, примерно 1400 мг, примерно 1500 мг, примерно 1600 мг, примерно 1700 мг, примерно 1800 мг, примерно 1900 мг, примерно 2000 мг, примерно 2050 мг, примерно 2100 мг, примерно 2200 мг, примерно 2300 мг, примерно 2400 мг или примерно 2500 мг (или любой их комбинации). Поскольку экспрессию белка FVIII с зкДНК-вектора можно тщательно контролировать с помощью регуляторных переключателей в данном документе или, альтернативно, многократной дозы зкДНК-вектора, вводимой субъекту, экспрессию белка FVIII с зкДНК-вектора можно контролировать так, что дозы экспрессированного белка FVIII можно вводить с перерывами, например, каждую неделю, каждые две недели, каждые три недели, каждые четыре недели, каждый месяц, каждые два месяца, каждые три месяца или каждые шесть месяцев с зкДНК-вектора. Ход этой терапии можно контролировать с помощью обычных методик и анализов.[00472] Depending on the type and severity of the disease, the cccDNA vector is administered in an amount such that the encoded FVIII protein is expressed in the range of about 0.3 mg/kg to 100 mg/kg (e.g., 15 mg/kg to 100 mg /kg or any dosage within this range), by one or more separate administrations or continuous infusion. One typical daily dose of cccDNA vector is sufficient to result in expression of the encoded FVIII protein ranging from about 15 mg/kg to 100 mg/kg or more, depending on the factors mentioned above. One exemplary dose of cccDNA vector is an amount sufficient to result in expression of the encoded FVIII protein as disclosed herein, ranging from about 10 mg/kg to about 50 mg/kg. Thus, the patient may be administered one or more doses of the cccDNA vector in an amount sufficient to result in expression of the encoded FVIII protein at about 0.5 mg/kg, 1 mg/kg, 1.5 mg/kg, 2. 0 mg/kg, 3 mg/kg, 4.0 mg/kg, 5 mg/kg, 10 mg/kg, 15 mg/kg, 20 mg/kg, 25 mg/kg, 30 mg/kg, 35 mg/ kg, 40 mg/kg, 50 mg/kg, 60 mg/kg, 70 mg/kg, 80 mg/kg, 90 mg/kg or 100 mg/kg (or any combination thereof). In some embodiments, the cccDNA vector is in an amount sufficient to result in expression of the encoded FVIII protein for a total dose ranging from 50 mg to 2500 mg. An exemplary cDNA vector dose is an amount sufficient to result in total expression of the encoded FVIII protein of about 50 mg, about 100 mg, 200 mg, 300 mg, 400 mg, about 500 mg, about 600 mg, about 700 mg, about 720 mg, approximately 1000 mg, approximately 1050 mg, approximately 1100 mg, approximately 1200 mg, approximately 1300 mg, approximately 1400 mg, approximately 1500 mg, approximately 1600 mg, approximately 1700 mg, approximately 1800 mg, approximately 1900 mg, approximately 2000 mg , about 2050 mg, about 2100 mg, about 2200 mg, about 2300 mg, about 2400 mg, or about 2500 mg (or any combination thereof). Since the expression of the FVIII protein from the cccDNA vector can be carefully controlled using regulatory switches herein or, alternatively, multiple doses of the cccDNA vector administered to the subject, the expression of the FVIII protein from the cccDNA vector can be controlled such that doses of the expressed FVIII protein can be administered with intermittently, for example every week, every two weeks, every three weeks, every four weeks, every month, every two months, every three months or every six months with the cccDNA vector. The progress of this therapy can be monitored using routine techniques and tests.

[00473] Согласно определенным вариантам реализации зкДНК-вектор вводят в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII в дозе 15 мг/кг, 30 мг/кг, 40 мг/кг, 45 мг/кг, 50 мг/кг, 60 мг/кг или в фиксированной дозе, например, 300 мг, 500 мг, 700 мг, 800 мг или выше. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждый день, через день, каждую неделю, каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно определенным вариантам реализации период времени составляет 6 месяцев, один год, восемнадцать месяцев, два года, пять лет, десять лет, 15 лет, 20 лет или продолжительность жизни пациента.[00473] In certain embodiments, the cccDNA vector is administered in an amount sufficient to result in expression of the encoded FVIII protein at a dose of 15 mg/kg, 30 mg/kg, 40 mg/kg, 45 mg/kg, 50 mg/kg , 60 mg/kg or at a fixed dose, for example, 300 mg, 500 mg, 700 mg, 800 mg or higher. In some embodiments, expression of the FVIII protein from the cccDNA vector is controlled such that the FVIII protein is expressed every day, every other day, every week, every 2 weeks, or every 4 weeks for a period of time. In some embodiments, the expression of the FVIII protein from the cccDNA vector is controlled such that the FVIII protein is expressed every 2 weeks or every 4 weeks for a period of time. In certain embodiments, the time period is 6 months, one year, eighteen months, two years, five years, ten years, 15 years, 20 years, or the lifespan of the patient.

[00474] Лечение может включать введение однократной дозы или многократных доз. Согласно некоторым вариантам реализации субъекту можно вводить более одной дозы; фактически, при необходимости можно вводить многократные дозы, поскольку зкДНК-вектор не вызывает иммунного ответа хозяина против капсида ввиду отсутствия вирусного капсида. Таким образом, специалист в данной области техники может легко определить подходящее количество доз. Количество вводимых доз может составлять, например, порядка 1-100, предпочтительно 2-20 доз.[00474] Treatment may include administration of a single dose or multiple doses. In some embodiments, more than one dose may be administered to a subject; in fact, multiple doses can be administered if necessary, since the cDNA vector does not induce a host immune response against the capsid due to the absence of a viral capsid. Thus, a person skilled in the art can easily determine the appropriate number of doses. The number of doses administered may be, for example, on the order of 1-100, preferably 2-20 doses.

[00475] Не ограничиваясь какой-либо конкретной теорией, отсутствие типичного противовирусного иммунного ответа, вызванного введением зкДНК-вектора, как описано в настоящем раскрытии (т.е. отсутствие компонентов капсида), позволяет вводить хозяину зкДНК-вектор для экспрессии белка FVIII несколько раз. Согласно некоторым вариантам реализации количество раз доставки гетерологичной нуклеиновой кислоты субъекту находится в диапазоне от 2 до 10 раз (например, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз). Согласно некоторым вариантам реализации зкДНК-вектор доставляют субъекту более 10 раз.[00475] Without being limited to any particular theory, the absence of the typical antiviral immune response caused by the administration of a cccDNA vector as described in the present disclosure (i.e., the absence of capsid components) allows the ccDNA vector to be administered to the host to express the FVIII protein multiple times. . In some embodiments, the number of times the heterologous nucleic acid is delivered to a subject ranges from 2 to 10 times (eg, 2, 3, 4, 5, 6, 7, 8, 9, or 10 times). In some embodiments, the cDNA vector is delivered to a subject more than 10 times.

[00476] Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарный день (например, в течение 24-часового периода). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в 2, 3, 4, 5, 6 или 7 календарных дней. Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарную неделю (например, 7 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще, чем один раз в две недели (например, один раз в период в две календарные недели). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный месяц (например, один раз в 30 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в шесть календарных месяцев. Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный год (например, 365 дней или 366 дней в високосный год).[00476] In some embodiments, a dose of the cDNA FVIII protein expression vector disclosed herein is administered to a subject no more than once per calendar day (eg, over a 24-hour period). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once every 2, 3, 4, 5, 6, or 7 calendar days. In some embodiments, a dose of the cDNA FVIII protein expression vector disclosed herein is administered to a subject no more than once per calendar week (eg, 7 calendar days). In some embodiments, a dose of the cccDNA vector is administered to a subject no more frequently than once every two weeks (eg, once every two calendar weeks). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar month (eg, once every 30 calendar days). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once every six calendar months. In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar year (eg, 365 days or 366 days in a leap year).

[00477] В конкретных вариантах реализации для достижения целевого уровня экспрессии гена на протяжении различных периодов времени, например, ежедневно, еженедельно, ежемесячно, ежегодно и т.д., можно использовать более одного введения (например, два, три, четыре или более введений) зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе.[00477] In particular embodiments, more than one administration (e.g., two, three, four or more administrations) may be used to achieve a target level of gene expression over various periods of time, e.g., daily, weekly, monthly, annually, etc. ) cDNA vector for expression of the FVIII protein disclosed herein.

[00478] Согласно некоторым вариантам реализации терапевтический белок FVIII, кодируемый зкДНК-вектором, раскрытым в данном документе, можно регулировать с помощью регуляторного переключателя, индуцируемого или репрессируемого промотора так, что он экспрессируется у субъекта в течение по меньшей мере 1 часа, по меньшей мере 2 часов, по меньшей мере 5 часов, по меньшей мере 10 часов, по меньшей мере 12 часов, по меньшей мере 18 часов, по меньшей мере 24 часов, по меньшей мере 36 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Согласно одному варианту реализации экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы. В качестве альтернативы, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может дополнительно содержать компоненты системы редактирования генов (например, CRISPR/Cas, TALEN, эндонуклеазы цинковых пальцев и т.д.), что позволяет вставлять одну или более последовательностей нуклеиновых кислот, кодирующих белок FVIII, для по существу постоянного лечения или «излечения» заболевания. Такие зкДНК-векторы, содержащие компоненты редактирования генов, раскрыты в международной заявке PCT/US18/64242 и могут включать 5' и 3' плечи гомологии (например, SEQ ID NO: 151-154, или последовательности, имеющие по меньшей мере 40%, 50%, 60%, 70% или 80% гомологии с ними) для вставки нуклеиновой кислоты, кодирующей белок FVIII, в области «безопасной гавани», такие как, но не включая их, ген альбумина или ген CCR5. В качестве примера, зкДНК-вектор, экспрессирующий белок FVIII, может содержать по меньшей мере одно плечо гомологии, специфичное в отношении геномной «безопасной гавани» (GSH), для встраивания трансгена FVIII в геномную «безопасную гавань», как раскрыто в международной заявке на патент PCT/US2019/020225, поданной 1 марта 2019 г., которая полностью включена в данный документ посредством ссылки.[00478] In some embodiments, a therapeutic FVIII protein encoded by a cccDNA vector disclosed herein can be regulated by a regulatory switch, an inducible or a repressible promoter such that it is expressed in a subject for at least 1 hour, for at least 1 hour 2 hours, at least 5 hours, at least 10 hours, at least 12 hours, at least 18 hours, at least 24 hours, at least 36 hours, at least 48 hours, at least 72 hours , at least 1 week, at least 2 weeks, at least 1 month, at least 2 months, at least 6 months, at least 12 months/one year, at least 2 years, at least 5 years, at least 10 years, at least 15 years, at least 20 years, at least 30 years, at least 40 years, at least 50 years or more. In one embodiment, expression can be achieved by reintroducing the cccDNA vectors described herein at predetermined or desired intervals. Alternatively, the cDNA FVIII protein expression vector disclosed herein may further contain gene editing system components (e.g., CRISPR/Cas, TALEN, zinc finger endonucleases, etc.) that allow the insertion of one or more sequences nucleic acids encoding the FVIII protein for a substantially permanent treatment or “cure” of a disease. Such cccDNA vectors containing gene editing components are disclosed in international application PCT/US18/64242 and may include 5' and 3' homology arms (for example, SEQ ID NO: 151-154, or sequences having at least 40% 50%, 60%, 70%, or 80% homology thereto) to insert a nucleic acid encoding the FVIII protein into a safe harbor region such as, but not including, the albumin gene or the CCR5 gene. As an example, a cccDNA vector expressing an FVIII protein may contain at least one genomic safe harbor (GSH)-specific homology arm for inserting an FVIII transgene into a genomic safe harbor, as disclosed in the international application patent PCT/US2019/020225, filed March 1, 2019, which is incorporated herein by reference in its entirety.

[00479] Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Предусмотрено непрерывное введение относительно низких поддерживающих доз после начальной более высокой терапевтической дозы.[00479] The duration of treatment depends on clinical progress and the patient's response to therapy. Continuous administration of relatively low maintenance doses after an initial higher therapeutic dose is provided.

Е. Единичные лекарственные формыE. Unit dosage forms

[00480] Согласно некоторым вариантам реализации фармацевтические композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут быть удобно представлены в виде единичной лекарственной формы. Единичная лекарственная форма, как правило, адаптирована для одного или более конкретных путей введения фармацевтической композиции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для капель, которые будут введены непосредственно в глаз. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения путем ингаляции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью испарителя. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью небулайзера. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью генератора аэрозоля. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для перорального введения, для буккального введения или для сублингвального введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для внутривенного, внутримышечного или подкожного введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для субретинальной инъекции, супрахориоидальной инъекции или интравитреальной инъекции.[00480] In some embodiments, pharmaceutical compositions containing the cDNA FVIII protein expression vector disclosed herein may be conveniently presented in a unit dosage form. The unit dosage form is typically adapted for one or more specific routes of administration of the pharmaceutical composition. In some embodiments, the unit dosage form is adapted for drops that will be administered directly into the eye. In some embodiments, the unit dosage form is adapted for administration by inhalation. In some embodiments, the unit dosage form is adapted for administration via a vaporizer. In some embodiments, the unit dosage form is adapted for administration via a nebulizer. In some embodiments, the unit dosage form is adapted for administration using an aerosol generator. In some embodiments, the unit dosage form is adapted for oral administration, for buccal administration, or for sublingual administration. In some embodiments, the unit dosage form is adapted for intravenous, intramuscular, or subcutaneous administration. In some embodiments, the unit dosage form is adapted for subretinal injection, suprachoroidal injection, or intravitreal injection.

[00481] Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для интратекального или интрацеребровентрикулярного введения. Согласно некоторым вариантам реализации фармацевтическая композиция изготовлена для местного введения. Количество активного ингредиента, которое можно комбинировать с материалом носителя для получения единичной лекарственной формы, обычно будет представлять собой количество соединения, которое вызывает терапевтический эффект.[00481] In some embodiments, the unit dosage form is adapted for intrathecal or intracerebroventricular administration. In some embodiments, the pharmaceutical composition is formulated for topical administration. The amount of active ingredient that can be combined with the carrier material to form a unit dosage form will generally be the amount of compound that produces a therapeutic effect.

X. Способы леченияX. Treatment methods

[00482] Технология, описанная в данном документе, также демонстрирует способы получения, а также способы применения раскрытых зкДНК-векторов для экспрессии белка FVIII различными путями, включая, например, ex vivo, ex situ, in vitro и in vivo приложения, методологии, диагностические процедуры и/или схемы генной терапии.[00482] The technology described herein also demonstrates methods for preparing, as well as methods for using, the disclosed cccDNA vectors for expression of FVIII protein in various ways, including, for example, ex vivo, ex situ, in vitro and in vivo applications, methodologies, diagnostic gene therapy procedures and/or regimens.

[00483] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII, экспрессируемый с зкДНК-вектора, раскрытого в данном документе, является функциональным для лечения заболевания. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.[00483] In one embodiment, the expressed therapeutic FVIII protein expressed from a cccDNA vector disclosed herein is functional for treating a disease. In a preferred embodiment, the FVIII therapeutic protein does not cause an immune system response unless required.

[00484] В данном документе предложен способ лечения гемофилии А у субъекта, включающий введение в клетку-мишень, которая нуждается в этом (например, мышечную клетку или ткань, или другой тип пораженных клеток), указанного субъекта терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, как описано в данном документе, которую можно применять для лечения заболевания. В частности, зкДНК-вектор для экспрессии белка FVIII может содержать целевую последовательность ДНК белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении в организм субъекта. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен любым подходящим путем, как описано выше и в других разделах настоящего документа.[00484] Provided herein is a method of treating hemophilia A in a subject, comprising administering to a target cell in need thereof (e.g., a muscle cell or tissue, or other type of affected cell) a therapeutically effective amount of a cccDNA expression vector of the subject. the FVIII protein disclosed herein, optionally with a pharmaceutically acceptable carrier. Although the cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The implemented cccDNA vector contains a nucleotide sequence encoding the FVIII protein as described herein, which can be used to treat a disease. In particular, a cccDNA vector for FVIII protein expression may comprise a target FVIII protein DNA sequence operably linked to control elements capable of directing transcription of the target FVIII protein encoded by the exogenous DNA sequence when introduced into a subject. The cDNA FVIII protein expression vector disclosed herein can be administered by any suitable route as described above and elsewhere herein.

[00485] В данном документе раскрыты композиции и составы зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, которые включают один или более зкДНК-векторов согласно настоящему изобретению вместе с одним или более фармацевтически приемлемыми буферами, разбавителями или вспомогательными веществами. Такие композиции могут быть включены в один или более диагностических или терапевтических наборов для диагностики, предотвращения, лечения или облегчения одного или более симптомов гемофилии А. В одном аспекте заболевание, поражение, нарушение, травма или дисфункция представляет собой заболевание, поражение, нарушение, травму или дисфункцию человека.[00485] Disclosed herein are compositions and formulations of cccDNA vectors for expression of FVIII protein as disclosed herein, which include one or more ccDNA vectors of the present invention along with one or more pharmaceutically acceptable buffers, diluents or excipients. Such compositions may be included in one or more diagnostic or therapeutic kits for diagnosing, preventing, treating, or alleviating one or more symptoms of hemophilia A. In one aspect, the disease, lesion, disorder, injury, or dysfunction is a disease, lesion, disorder, injury, or human dysfunction.

[00486] Другой аспект технологии, описанной в данном документе, обеспечивает способ обеспечения субъекту, нуждающемуся в этом, диагностически или терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, причем указанный способ включает обеспечение в клетке, ткани или органе субъекта, нуждающегося в этом, количества зкДНК-вектора, раскрытого в данном документе; и в течение времени, эффективного для обеспечения экспрессии белка FVIII с зкДНК-вектора, что обеспечивает субъекту диагностически или терапевтически эффективное количество белка FVIII, экспрессируемого зкДНК-вектором. Согласно дополнительному аспекту субъект представляет собой человека.[00486] Another aspect of the technology described herein provides a method of providing to a subject in need thereof a diagnostically or therapeutically effective amount of a cDNA vector for expressing the FVIII protein disclosed herein, the method comprising providing in a cell, tissue or organ the subject in need thereof, the amount of cccDNA vector disclosed herein; and for a time effective to cause FVIII protein to be expressed from the cccDNA vector, thereby providing the subject with a diagnostically or therapeutically effective amount of FVIII protein expressed by the cccDNA vector. According to a further aspect, the subject is a human being.

[00487] Другой аспект технологии, описанной в данном документе, обеспечивает способ диагностики, предотвращения, лечения или облегчения по меньшей мере одного или более симптомов гемофилии А, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В целом и в общем смысле, способ включает по меньшей мере этап введения субъекту, нуждающемуся в этом, одного или более из раскрытых зкДНК-векторов для продукции белка FVIII в количестве и в течение времени, достаточных для диагностики, предотвращения, лечения или облегчения одного или более симптомов заболевания, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В таком варианте реализации у субъекта может быть оценена эффективность белка FVIII или, альтернативно, проведено детектирование белка FVIII или тканевого расположения белка FVIII (включая клеточное и субклеточное расположение) у субъекта. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять в качестве диагностического инструмента in vivo, например, для детектирования рака или других показаний. Согласно дополнительному аспекту субъект представляет собой человека.[00487] Another aspect of the technology described herein provides a method for diagnosing, preventing, treating, or alleviating at least one or more hemophilia A symptoms, disorder, dysfunction, lesion, abnormal condition, or injury in a subject. Generally and generally, the method includes at least the step of administering to a subject in need thereof one or more of the disclosed cccDNA vectors for producing FVIII protein in an amount and for a time sufficient to diagnose, prevent, treat, or alleviate one or more more symptoms of disease, disorder, dysfunction, lesion, abnormal condition, or injury in the subject. In such an embodiment, the potency of the FVIII protein may be assessed in the subject, or alternatively, the FVIII protein or tissue location of the FVIII protein (including cellular and subcellular location) in the subject may be detected. Thus, the cDNA FVIII protein expression vector disclosed herein can be used as an in vivo diagnostic tool, for example, for detecting cancer or other indications. According to a further aspect, the subject is a human being.

[00488] Другим аспектом является применение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в качестве инструмента для лечения или уменьшения одного или более симптомов гемофилии А или патологических состояний. Существует ряд наследственных заболеваний, при которых известны дефектные гены, и, как правило, они делятся на два класса: дефицитные состояния, обычно ферментов, которые обычно наследуются рецессивным образом, и несбалансированные состояния, которые могут включать регуляторные или структурные белки и которые, как правило, но не всегда, наследуются доминантным образом. Для несбалансированных патологических состояний зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для создания состояния гемофилии А в модельной системе, которую затем можно использовать в мероприятиях по противодействию патологическому состоянию. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, позволяет лечить генетические заболевания. В данном документе состояние гемофилии А лечат путем частичного или полного излечения дефицита или дисбаланса, который вызывает заболевание или делает его более тяжелым.[00488] Another aspect is the use of a cccDNA vector for expressing the FVIII protein disclosed herein as a tool for treating or reducing one or more hemophilia A symptoms or conditions. There are a number of inherited diseases in which defective genes are known, and they generally fall into two classes: deficiency conditions, usually of enzymes, which are usually inherited in a recessive manner, and imbalanced conditions, which may involve regulatory or structural proteins and which are typically , but not always, are inherited in a dominant manner. For unbalanced disease conditions, the cDNA FVIII protein expression vector disclosed herein can be used to create the hemophilia A condition in a model system, which can then be used in interventions to counteract the disease condition. Thus, the cccDNA vector for expression of FVIII protein disclosed herein allows the treatment of genetic diseases. Herein, the condition of hemophilia A is treated by partially or completely correcting the deficiency or imbalance that causes the disease or makes it more severe.

А. Клетки-хозяеваA. Host cells

[00489] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляет трансген белка FVIII в рассматриваемую клетку-хозяина. Согласно некоторым вариантам реализации клетки представляют собой фоторецепторные клетки. Согласно некоторым вариантам реализации клетки представляют собой клетки RPE. Согласно некоторым вариантам реализации рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека, включая, например, клетки крови, стволовые клетки, гемопоэтические клетки, CD34+ клетки, клетки печени, раковые клетки, сосудистые клетки, мышечные клетки, клетки поджелудочной железы, нервные клетки, клетки глаза или клетки сетчатки, эпителиальные или эндотелиальные клетки, дендритные клетки, фибробласты или любые другие клетки, происходящие от млекопитающего, включая, без ограничения, клетки печени (т.е. печеночные), клетки легких, сердечные клетки, клетки поджелудочной железы, клетки кишечника, диафрагмальные клетки, почечные клетки (т.е. почки), нервные клетки, клетки крови, клетки костного мозга или любой одной или более выбранных тканей субъекта, для которых предусмотрена генная терапия. В одном аспекте рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека.[00489] In some embodiments, the cDNA FVIII protein expression vector disclosed herein delivers a FVIII protein transgene into a host cell of interest. In some embodiments, the cells are photoreceptor cells. In some embodiments, the cells are RPE cells. In some embodiments, the host cell in question is a human host cell, including, for example, blood cells, stem cells, hematopoietic cells, CD34 + cells, liver cells, cancer cells, vascular cells, muscle cells, pancreatic cells, nerve cells , eye cells or retinal cells, epithelial or endothelial cells, dendritic cells, fibroblasts or any other cells derived from a mammal, including, without limitation, liver cells (i.e. liver cells), lung cells, cardiac cells, pancreatic cells, intestinal cells, diaphragmatic cells, renal cells (ie, kidneys), nerve cells, blood cells, bone marrow cells, or any one or more selected tissues of the subject for which gene therapy is provided. In one aspect, the host cell in question is a human host cell.

[00490] Настоящее раскрытие также относится к рекомбинантным клеткам-хозяевам, как упомянуто выше, включая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе. Таким образом, можно использовать несколько клеток-хозяев в зависимости от цели, что очевидно для квалифицированного специалиста. Конструкцию или зкДНК-вектор для экспрессии белка FVIII, раскрытые в данном документе, включая донорную последовательность, вводят в клетку-хозяина так, что донорная последовательность поддерживается в интегрированном в хромосому виде, как описано ранее. Термин «клетка-хозяин» включает любое потомство родительской клетки, которое не идентично родительской клетке из-за мутаций, происходящих во время репликации. Выбор клетки-хозяина будет в значительной степени зависеть от донорной последовательности и ее источника.[00490] The present disclosure also relates to recombinant host cells as mentioned above, including the cDNA FVIII protein expression vector disclosed herein. Thus, multiple host cells can be used depending on the purpose, as will be apparent to those skilled in the art. The FVIII protein expression construct or cDNA vector disclosed herein, including the donor sequence, is introduced into a host cell such that the donor sequence is maintained integrated into the chromosome as previously described. The term "host cell" includes any progeny of a parent cell that is not identical to the parent cell due to mutations occurring during replication. The choice of host cell will largely depend on the donor sequence and its source.

[00491] Клетка-хозяин также может представлять собой эукариота, например, клетку млекопитающего, насекомого, растения или гриба. Согласно одному варианту реализации клетка-хозяин представляет собой клетку человека (например, первичную клетку, стволовую клетку или иммортализо ванную линию клеток). Согласно некоторым вариантам реализации в клетку-хозяина можно вводить зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, ex vivo, а затем доставлять субъекту после события генной терапии. Клетка-хозяин может представлять собой любой тип клеток, например, соматическую клетку или стволовую клетку, индуцированную плюрипотентную стволовую клетку или клетку крови, например, Т-клетку или В-клетку, или клетку костного мозга. Согласно определенным вариантам реализации клетка-хозяин представляет собой аллогенную клетку. Например, конструирование Т-клеточного генома можно применять для разных видов иммунотерапии рака, модуляции заболевания, такой как терапия ВИЧ (например, нокаут рецептора, такого как CXCR4 и CCR5), и разных видов терапии иммунодефицита. Мишенями для иммунотерапии могут быть рецепторы ГКГС на В-клетках. Согласно некоторым вариантам реализации клетки-хозяева с модифицированным геномом, например, стволовые клетки костного мозга, например, CD34+ клетки, или индуцированные плюрипотентные стволовые клетки могут быть трансплантированы обратно пациенту для экспрессии терапевтического белка. В. Дополнительные заболевания для генной терапии:[00491] The host cell may also be a eukaryote, such as a mammalian, insect, plant or fungal cell. In one embodiment, the host cell is a human cell (eg, a primary cell, stem cell, or immortalized cell line). In some embodiments, a cDNA FVIII protein expression vector disclosed herein can be introduced into a host cell ex vivo and then delivered to the subject following a gene therapy event. The host cell may be any type of cell, such as a somatic cell or stem cell, an induced pluripotent stem cell, or a blood cell, such as a T cell or B cell, or a bone marrow cell. In certain embodiments, the host cell is an allogeneic cell. For example, T cell genome engineering can be used for various cancer immunotherapies, disease modulation such as HIV therapy (eg, receptor knockout such as CXCR4 and CCR5), and various immunodeficiency therapies. MHC receptors on B cells may be targets for immunotherapy. In some embodiments, genome-edited host cells, such as bone marrow stem cells, such as CD34 + cells, or induced pluripotent stem cells, can be transplanted back into the patient to express the therapeutic protein. B. Additional diseases for gene therapy:

[00492] В целом зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки любого белка FVIII в соответствии с приведенным выше описанием для лечения, предотвращения или облегчения симптомов, ассоциированных с гемофилией А, связанной с нарушенной экспрессией белка или экспрессией гена у субъекта.[00492] In general, the cDNA FVIII protein expression vector disclosed herein can be used to deliver any FVIII protein as described above to treat, prevent, or alleviate symptoms associated with hemophilia A associated with impaired protein expression or gene expression in the subject.

[00493] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки белка FVIII в скелетную, сердечную или диафрагмальную мышцу, для продукции белка FVIII для секреции и циркуляции в крови или для системной доставки в другие ткани для лечения, облегчения и/или предотвращения гемофилии А.[00493] In some embodiments, the cDNA FVIII protein expression vector disclosed herein can be used to deliver FVIII protein to skeletal, cardiac, or diaphragmatic muscle, to produce FVIII protein for secretion and circulation in the blood, or for systemic delivery to other tissues for the treatment, relief and/or prevention of hemophilia A.

[00494] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в легкие субъекта с помощью любых подходящих средств, необязательно путем введения аэрозольной суспензии пригодных для вдыхания частиц, содержащих зкДНК-векторы, которые субъект вдыхает. Пригодные для вдыхания частицы могут быть жидкими или твердыми. Аэрозоли жидких частиц, содержащих зкДНК-векторы, могут быть получены с помощью любых подходящих средств, таких как аэрозольный небулайзер под давлением или ультразвуковой небулайзер, как известно специалистам в данной области техники. См., например, патент США №4501729. Аэрозоли твердых частиц, содержащих зкДНК-векторы, могут быть получены сходным образом с помощью любого генератора аэрозолей лекарственного средства в виде твердых частиц с помощью методик, известных в фармацевтике.[00494] The cDNA FVIII protein expression vector disclosed herein can be administered to the lungs of a subject by any suitable means, optionally by administering an aerosol suspension of respirable particles containing the cDNA vectors, which the subject inhales. Respirable particles can be liquid or solid. Aerosols of liquid particles containing cccDNA vectors can be produced using any suitable means, such as a pressurized aerosol nebulizer or an ultrasonic nebulizer, as known to those skilled in the art. See, for example, US Pat. No. 4,501,729. Particulate aerosols containing cccDNA vectors can be similarly generated using any particulate drug aerosol generator using techniques known in the pharmaceutical art.

[00495] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в ткани ЦНС (например, головной мозг, глаз).[00495] In some embodiments, the cDNA FVIII protein expression vector disclosed herein can be administered to CNS tissues (eg, brain, eye).

[00496] Глазные нарушения, которые можно лечить, облегчать или предотвращать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают офтальмологические расстройства, затрагивающие сетчатку, задний тракт и зрительный нерв (например, пигментный ретинит, диабетическую ретинопатию и другие дегенеративные заболевания сетчатки, увеит, возрастную дегенерацию макулы, глаукому). Многие офтальмологические заболевания и нарушения ассоциированы с одним или более из трех типов показаний: (1) ангиогенезом, (2) воспалением и (3) дегенерацией. Согласно некоторым вариантам реализации зкДНК-вектор, раскрытый в данном документе, можно применять для доставки антиангиогенных факторов; противовоспалительных факторов; факторов, которые замедляют дегенерацию клеток, способствуют сохранению клеток или способствуют росту клеток, и комбинаций перечисленных выше. Например, диабетическая ретинопатия характеризуется ангиогенезом. Диабетическую ретинопатию можно лечить путем доставки одного или более антиангиогенных антител или слитых белков интраокулярно (например, в стекловидное тело) или периокулярно (например, в субтеноновую область). Дополнительные глазные заболевания, которые можно лечить, облегчать или предотвращать с помощью зкДНК-векторов согласно настоящему изобретению, включают географическую атрофию, сосудистую или «влажную» дегенерацию макулы, ФКУ, врожденный амавроз Лебера (LCA), синдром Ушера, эластическую псевдоксантому (РХЕ), х-связанный пигментный ретинит (XLRP), х-связанное расслоение сетчатки (XLRS), хороидеремию, наследственную оптическую нейропатию Лебера (LHON), архоматопсию, палочко-колбочковую дистрофию, эндотелиальную дистрофию роговицы Фукса, диабетический макулярный отек и глазной рак или опухоли.[00496] Ocular disorders that may be treated, ameliorated, or prevented by the cccDNA FVIII protein expression vector disclosed herein include ophthalmic disorders affecting the retina, posterior tract, and optic nerve (e.g., retinitis pigmentosa, diabetic retinopathy, and others degenerative retinal diseases, uveitis, age-related macular degeneration, glaucoma). Many ophthalmic diseases and disorders are associated with one or more of three types of indications: (1) angiogenesis, (2) inflammation, and (3) degeneration. In some embodiments, the cccDNA vector disclosed herein can be used to deliver antiangiogenic factors; anti-inflammatory factors; factors that slow cell degeneration, promote cell preservation or promote cell growth, and combinations of the above. For example, diabetic retinopathy is characterized by angiogenesis. Diabetic retinopathy can be treated by delivering one or more antiangiogenic antibodies or fusion proteins intraocularly (eg, into the vitreous) or periocularly (eg, into the sub-Tenon's region). Additional ocular diseases that may be treated, ameliorated, or prevented by the cccDNA vectors of the present invention include geographic atrophy, vascular or wet macular degeneration, PKU, Leber congenital amaurosis (LCA), Usher syndrome, pseudoxanthoma elasticum (PXE), X-linked retinitis pigmentosa (XLRP), X-linked retinal separation (XLRS), choroideremia, Leber hereditary optic neuropathy (LHON), archomatopsia, rod-cone dystrophy, Fuchs' corneal endothelial dystrophy, diabetic macular edema, and ocular cancers or tumors.

[00497] Согласно некоторым вариантам реализации воспалительные глазные заболевания или нарушения (например, увеит) можно лечить, облегчать или предупреждать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Одно или более противовоспалительных антител или слитых белков могут быть экспрессированы путем внутриглазного (например, стекловидное тело или передняя камера) введения зкДНК-вектора, раскрытого в данном документе.[00497] In some embodiments, inflammatory ocular diseases or disorders (eg, uveitis) can be treated, ameliorated, or prevented using a cccDNA FVIII protein expression vector disclosed herein. One or more anti-inflammatory antibodies or fusion proteins can be expressed by intraocular (eg, vitreous or anterior chamber) administration of a cccDNA vector disclosed herein.

Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, который ассоциирован с трансгеном, кодирующим репортерный полипептид (например, фермент, такой как зеленый флуоресцентный белок или щелочная фосфатаза). Согласно некоторым вариантам реализации трансген, который кодирует репортерный белок, подходящий для экспериментальных или диагностических целей, выбирают из любого из: р-лактамазы, р-галактозидазы (LacZ), щелочной фосфатазы, тимидинкиназы, зеленого флуоресцентного белка (GFP), хлорамфениколацетилтрансферазы (CAT), люциферазы и других, хорошо известных в данной области техники. В некоторых аспектах зкДНК-векторы, экспрессирующие белок FVIII, связанный с репортерный полипептидом, можно применять для диагностических целей, а также для определения эффективности или в качестве маркеров активности зкДНК-вектора у субъекта, которому их вводят.In some embodiments, the cDNA FVIII protein expression vector disclosed herein may encode an FVIII protein that is associated with a transgene encoding a reporter polypeptide (e.g., an enzyme such as green fluorescent protein or alkaline phosphatase). In some embodiments, the transgene that encodes a reporter protein suitable for experimental or diagnostic purposes is selected from any of: p-lactamase, p-galactosidase (LacZ), alkaline phosphatase, thymidine kinase, green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT) , luciferase and others well known in the art. In some aspects, cccDNA vectors expressing FVIII protein coupled to a reporter polypeptide can be used for diagnostic purposes, as well as to determine the efficacy of, or as markers of, the activity of the cccDNA vector in the subject to which they are administered.

С. Тестирование успешной экспрессии гена с использованием зкДНК-вектораC. Testing for successful gene expression using a cccDNA vector

[00498] Для тестирования эффективности доставки гена белка FVIII с помощью зкДНК-вектора можно использовать анализы, хорошо известные в данной области техники, которые можно выполнять как на моделях in vitro, так и на моделях in vivo. Уровни экспрессии белка FVIII с помощью зкДНК могут быть оценены специалистом в данной области техники путем измерения уровней мРНК и белка FVIII (например, ГЩР с обратной транскрипцией, анализ методом Вестерн-блоттинга и иммуноферментный анализ (ИФА)). Согласно одному варианту реализации зкДНК содержит репортерный белок, который можно использовать для оценки экспрессии белка FVIII, например, путем исследования экспрессии репортерного белка с помощью флуоресцентной микроскопии или устройства для считывания люминесценции планшетов. В случае приложений in vivo для тестирования функциональности данного белка FVIII можно использовать анализы функции белков, чтобы определить успешность экспрессии гена. Специалист сможет определить лучший тест для измерения функциональности белка FVIII, экспрессируемого вектором зкДНК, in vitro или in vivo.[00498] To test the efficiency of delivery of the FVIII protein gene using a cccDNA vector, assays well known in the art can be used, which can be performed in both in vitro and in vivo models. Levels of FVIII protein expression by cccDNA can be assessed by one skilled in the art by measuring FVIII mRNA and protein levels (eg, reverse transcription HAZM, Western blot analysis, and enzyme-linked immunosorbent assay (ELISA)). In one embodiment, the cccDNA contains a reporter protein that can be used to assess FVIII protein expression, for example, by examining reporter protein expression using fluorescence microscopy or a luminescence plate reader. For in vivo applications, protein function assays can be used to test the functionality of a given FVIII protein to determine the success of gene expression. One skilled in the art will be able to determine the best test to measure the functionality of the FVIII protein expressed by the cccDNA vector, in vitro or in vivo.

[00499] В данном документе предусмотрено, что эффекты экспрессии гена белка FVIII с зкДНК-вектора в клетке или у субъекта могут длиться по меньшей мере 1 месяц, по меньшей мере 2 месяца, по меньшей мере 3 месяца, по меньшей мере четыре месяца, по меньшей мере 5 месяцев, по меньшей мере шесть месяцев, по меньшей мере 10 месяцев, по меньшей мере 12 месяцев, по меньшей мере 18 месяцев, по меньшей мере 2 года, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 20 лет или они могут быть постоянными.[00499] It is provided herein that the effects of expression of the FVIII protein gene from a cccDNA vector in a cell or subject may last for at least 1 month, at least 2 months, at least 3 months, at least four months, at least 5 months, at least six months, at least 10 months, at least 12 months, at least 18 months, at least 2 years, at least 5 years, at least 10 years, at least 20 years or they can be permanent.

[00500] Согласно некоторым вариантам реализации белок FVIII в экспрессионной кассете, экспрессионной конструкции или зкДНК-векторе, описанных в данном документе, может быть оптимизирован по кодонам для клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека (например, гуманизация), путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc.) или другой общедоступной базы данных.[00500] In some embodiments, the FVIII protein in an expression cassette, expression construct, or cccDNA vector described herein can be codon optimized for a host cell. As used herein, the term “codon optimized” or “codon optimization” refers to the process of modifying a nucleic acid sequence to enhance expression in vertebrate cells of interest, such as mouse or human (eg, humanization), by replacing at least one or more than one or a significant number of codons of a native sequence (eg, a prokaryotic sequence) by codons that are more frequently or most frequently used in the genes of that vertebrate. Different species exhibit specific preferences for certain codons of a particular amino acid. Typically, codon optimization does not change the amino acid sequence of the original translated protein. Optimized codons can be determined using, for example, the Gene Forge® platform for codon optimization and custom gene synthesis from Aptagen (Aptagen, Inc.) or other publicly available database.

D. Определение эффективности путем оценки экспрессии белка FVIII с зкДНК-вектораD. Determination of Efficacy by Assessing FVIII Protein Expression from a cccDNA Vector

[00501] По существу любой метод, известный в данной области техники для определения экспрессии белка, может быть использован для анализа экспрессии белка FVIII с зкДНК-вектора. Неограничивающие примеры таких методов/анализов включают иммуноферментный анализ (ИФА), аффинный ИФА, ELISPOT, последовательное разведение, проточную цитометрию, анализ методом поверхностного плазмонного резонанса, анализ кинетического исключения, масс-спектрометрию, Вестерн-блоттинг, иммунопреципитацию и ПЦР.[00501] Essentially any method known in the art for determining protein expression can be used to analyze FVIII protein expression from a cccDNA vector. Non-limiting examples of such methods/assays include enzyme-linked immunosorbent assay (ELISA), affinity ELISA, ELISPOT, serial dilution, flow cytometry, surface plasmon resonance assay, kinetic exclusion assay, mass spectrometry, Western blotting, immunoprecipitation and PCR.

[00502] Для оценки экспрессии белка FVIII in vivo биологический образец может быть получен от субъекта для анализа. Примеры биологических образцов включают образец биожидкости, образец физиологической жидкости, кровь (включая цельную кровь), сыворотку, плазму, мочу, слюну, биопсию и/или образец ткани и т.д. Биологический образец или образец ткани также может относиться к образцу ткани или жидкости, выделенному у индивидуума, включая, но не ограничиваясь перечисленными, биопсию опухоли, стул, спинномозговую жидкость, плевральную жидкость, аспираты сосков, лимфатическую жидкость, внешние срезы кожи, дыхательного, кишечного и мочеполового путей, слезы, слюну, грудное молоко, клетки (включая, но не ограничиваясь перечисленными, клетки крови), опухоли, органы, а также образцы компонентов культуры клеток in vitro. Термин также включает смесь упомянутых выше образцов. Термин «образец» также включает необработанные или предварительно обработанные (или подвергнутые предварительному процессингу) биологические образцы. Согласно некоторым вариантам реализации образец, используемый для анализов и способов, описанных в данном документе, включает образец сыворотки, собранный у субъекта, подлежащего тестированию.[00502] To assess FVIII protein expression in vivo, a biological sample may be obtained from a subject for analysis. Examples of biological samples include a biofluid sample, a physiological fluid sample, blood (including whole blood), serum, plasma, urine, saliva, biopsy and/or tissue sample, etc. A biological or tissue sample may also refer to a sample of tissue or fluid isolated from an individual, including, but not limited to, tumor biopsy, stool, cerebrospinal fluid, pleural fluid, nipple aspirates, lymph fluid, external sections of skin, respiratory, intestinal and genitourinary tract, tears, saliva, breast milk, cells (including, but not limited to, blood cells), tumors, organs, and samples of in vitro cell culture components. The term also includes a mixture of the samples mentioned above. The term "sample" also includes unprocessed or preprocessed (or preprocessed) biological samples. In some embodiments, the sample used for the assays and methods described herein includes a serum sample collected from the subject to be tested.

Е. Определение эффективности экспрессированного белка FVIII по клиническим параметрамE. Determination of the effectiveness of expressed FVIII protein by clinical parameters

[00503] Эффективность данного белка FVIII, экспрессированного зкДНК-вектором, для лечения гемофилии А (т.е. функциональная экспрессия) может быть определена квалифицированным клиницистом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы гемофилии А изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим терапевтический белок FVIII, как описано в данном документе. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации гемофилии А или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование гемофилии А, например, прекращение или замедление прогрессирования гемофилии А; или (2) облегчение гемофилии А, например, вызывающее регресс симптома гемофилии А; и (3) предотвращение или снижение вероятности развития заболевания гемофилией А, или предотвращение вторичных заболеваний/нарушений, ассоциированных с гемофилией А.[00503] The effectiveness of a given FVIII protein expressed by a cccDNA vector for the treatment of hemophilia A (ie, functional expression) can be determined by a qualified clinician. However, treatment is considered “effective treatment,” as that term is used herein, if any or all of the signs or symptoms of hemophilia A are modified in a favorable manner, or if other clinically accepted symptoms or markers of the disease are improved or alleviated, for example by at least 10% after treatment with a cccDNA vector encoding the therapeutic FVIII protein as described herein. Effectiveness can also be measured by the individual's lack of deterioration, as measured by stabilization of hemophilia A or the need for medical intervention (ie, progression of the disease stops or at least slows). Methods for measuring these indicators are known to those skilled in the art and/or are described herein. Treatment includes any treatment of a disease in an individual or animal (some non-limiting examples include a human or mammal) and includes: (1) inhibiting hemophilia A, eg, stopping or slowing the progression of hemophilia A; or (2) alleviation of hemophilia A, such as causing regression of hemophilia A symptoms; and (3) preventing or reducing the likelihood of developing hemophilia A disease, or preventing secondary diseases/disorders associated with hemophilia A.

Эффективное количество для лечения заболевания означает такое количество, которое при введении млекопитающему, нуждающемуся в этом, является достаточным, чтобы привести к эффективному лечению этого заболевания, в соответствии с определением этого термина в данном документе. Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для заболевания гемофилией А. Врач может оценить любой один или более клинических симптомов гемофилии А, которые включают: необъяснимое и чрезмерное кровотечение из порезов или повреждений, или после хирургического или стоматологического вмешательства; много больших или глубоких синяков; необычное кровотечение после вакцинаций; боль, отек или стеснение в суставах; кровь в моче или стуле; кровотечение из носа без известной причины; у младенцев - необъяснимую раздражительность.An effective amount for treating a disease means an amount that, when administered to a mammal in need thereof, is sufficient to result in effective treatment of that disease, as that term is defined herein. The effectiveness of an agent can be determined by assessing physical indicators that are specific to the disease hemophilia A. A physician may evaluate any one or more clinical symptoms of hemophilia A, which include: unexplained and excessive bleeding from cuts or injuries, or after surgery or dental procedures; many large or deep bruises; unusual bleeding after vaccinations; pain, swelling, or tightness in the joints; blood in urine or stool; nosebleeds without a known cause; in infants - inexplicable irritability.

XI. Различные приложения зкДНК-векторов, экспрессирующих антитела или слитые белкиXI. Various applications of cccDNA vectors expressing antibodies or fusion proteins

[00504] Как раскрыто в данном документе, композиции и зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, можно применять для экспрессии белка FVIII для ряда целей. Согласно одному варианту реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции или прогрессирования заболевания гемофилией А. Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для лечения, предотвращения или облегчения состояний гемофилии А или нарушений у субъекта-млекопитающего.[00504] As disclosed herein, the FVIII protein expression compositions and cDNA vectors described herein can be used to express FVIII protein for a variety of purposes. In one embodiment, the cDNA vector expressing the FVIII protein can be used to create a somatic transgenic animal model carrying the transgene, for example, to study the function or progression of hemophilia A. In some embodiments, the cDNA vector expressing the FVIII protein can be used for the treatment, prevention or amelioration of hemophilia A conditions or disorders in a mammalian subject.

[00505] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения заболевания, ассоциированного с повышенной экспрессией, повышенной активностью продукта гена или нефизиологической положительной регуляцией гена.[00505] In some embodiments, the FVIII protein can be expressed from a cccDNA vector in a subject in an amount sufficient to treat a disease associated with increased expression, increased activity of the gene product, or nonphysiological upregulation of the gene.

[00506] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения гемофилии А со сниженной экспрессией, отсутствием экспрессии или дисфункцией белка.[00506] In some embodiments, the FVIII protein can be expressed from a cccDNA vector in a subject in an amount sufficient to treat hemophilia A with reduced expression, no expression, or dysfunction of the protein.

[00507] Обычный специалист в данной области техники поймет, что трансген может не представлять собой открытую рамку считывания гена, который сам транскрибируется; вместо этого он может представлять собой промоторную область или репрессорную область гена-мишени, и зкДНК-вектор может модифицировать такую область, что в результате модулирует экспрессию гена FVIII.[00507] One of ordinary skill in the art will understand that the transgene may not be the open reading frame of the gene that is itself transcribed; instead, it may be a promoter region or a repressor region of a target gene, and the cDNA vector may modify such a region, thereby modulating FVIII gene expression.

[00508] Композиции и зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять для доставки белка FVIII для различных целей, как описано выше.[00508] The FVIII protein expression compositions and cccDNA vectors disclosed herein can be used to deliver FVIII protein for various purposes, as described above.

[00509] Согласно некоторым вариантам реализации трансген кодирует один или более белков FVIII, которые можно применять для лечения, облегчения или предотвращения состояний гемофилии А у субъекта-млекопитающего. Белок FVIII, экспрессируемый зкДНК-вектором, вводят пациенту в количестве, достаточном для лечения гемофилии А, ассоциированной с аномальной последовательностью гена, что может привести к любому одному или более из следующего: повышенной экспрессии белка, сверхактивности белка, сниженной экспрессии, отсутствию экспрессии или дисфункции целевого гена или белка.[00509] In some embodiments, the transgene encodes one or more FVIII proteins that can be used to treat, alleviate, or prevent hemophilia A conditions in a mammalian subject. The FVIII protein expressed by the cccDNA vector is administered to a patient in an amount sufficient to treat hemophilia A associated with an abnormal gene sequence that can result in any one or more of the following: increased protein expression, overactive protein, decreased expression, no expression or dysfunction target gene or protein.

[00510] 1010 некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, предназначены для применения в методах диагностики и скрининга, посредством которых белок FVIII временно или стабильно экспрессируется в системе на основе культуры клеток или, альтернативно, в модели на трансгенном животном.[00510] 1010 In some embodiments, the cDNA FVIII protein expression vectors disclosed herein are intended for use in diagnostic and screening methods whereby FVIII protein is transiently or stably expressed in a cell culture-based system or, alternatively, in a cell culture model. transgenic animal.

[00511] Другой аспект технологии, описанной в данном документе, обеспечивает способ трансдукции популяции клеток млекопитающего зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе. В целом и в общем смысле, способ включает по меньшей мере этап введения в одну или более клеток популяции композиции, которая содержит эффективное количество одного или более из зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.[00511] Another aspect of the technology described herein provides a method for transducing a population of mammalian cells with the cDNA FVIII protein expression vector disclosed herein. Generally and generally, the method includes at least the step of introducing into one or more cells of a population a composition that contains an effective amount of one or more of the cDNA FVIII protein expression vectors disclosed herein.

[00512] Кроме того, согласно настоящему изобретению предложены композиции, а также терапевтические и/или диагностические наборы, которые включают один или более из раскрытых зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, или композиций зкДНК, изготовленных с одним или более дополнительными ингредиентами или приготовленных в соответствии с одной или более инструкциями по их применению.[00512] In addition, the present invention provides compositions, as well as therapeutic and/or diagnostic kits, that include one or more of the disclosed cccDNA vectors for expression of the FVIII protein as disclosed herein, or cccDNA compositions made with one or more additional ingredients or prepared in accordance with one or more instructions for use.

[00513] Клетка, в которую должен быть введен зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть любого типа, включая, но не ограничиваясь перечисленными, нервные клетки (включая клетки периферической и центральной нервной системы, в частности, клетки головного мозга), клетки легких, клетки сетчатки, эпителиальные клетки (например, кишечные и респираторные эпителиальные клетки), мышечные клетки, дендритные клетки, клетки поджелудочной железы (включая островковые клетки), печеночные клетки, клетки миокарда, костные клетки (например, стволовые клетки костного мозга), гемопоэтические стволовые клетки, клетки селезенки, кератиноциты, фибробласты, эндотелиальные клетки, клетки простаты, половые клетки и т.п. В качестве альтернативы, клетка может представлять собой любую клетку-предшественника. В качестве дополнительной альтернативы, клетка может представлять собой стволовую клетку (например, нервную стволовую клетку, стволовую клетку печени). В качестве еще одной альтернативы, клетка может представлять собой раковую или опухолевую клетку. Более того, клетки могут быть любого видового происхождения, как указано выше.[00513] The cell into which the cccDNA vector for expression of the FVIII protein disclosed herein is to be introduced can be of any type, including, but not limited to, nerve cells (including cells of the peripheral and central nervous system, in particular cells brain), lung cells, retinal cells, epithelial cells (eg, intestinal and respiratory epithelial cells), muscle cells, dendritic cells, pancreatic cells (including islet cells), liver cells, myocardial cells, bone cells (eg, stem cells bone marrow), hematopoietic stem cells, spleen cells, keratinocytes, fibroblasts, endothelial cells, prostate cells, germ cells, etc. Alternatively, the cell may be any progenitor cell. As a further alternative, the cell may be a stem cell (eg, neural stem cell, liver stem cell). As yet another alternative, the cell may be a cancer or tumor cell. Moreover, the cells can be of any species origin, as indicated above.

А. Получение и очистка зкДНК-векторов, экспрессирующих FVIIIA. Preparation and purification of cDNA vectors expressing FVIII

[00514] ЗкДНК-векторы, раскрытые в данном документе, должны применяться для получения белка FVIII как in vitro, так и in vivo. Белки FVIII, полученные таким образом, могут быть выделены, протестированы в отношении целевой функции и очищены для дальнейшего использования в исследованиях или в качестве терапевтического лечения. Каждая система получения белка имеет свои преимущества/недостатки. В то время как белки, полученные in vitro, можно легко очистить и получить белки за короткое время, белки, полученные in vivo, могут иметь посттрансляционные модификации, такие как гликозилирование.[00514] The cccDNA vectors disclosed herein should be used to produce FVIII protein both in vitro and in vivo. FVIII proteins produced in this manner can be isolated, tested for target function, and purified for further use in research or as therapeutic treatments. Each protein production system has its own advantages/disadvantages. While proteins produced in vitro can be easily purified and proteins produced in a short time, proteins produced in vivo may have post-translational modifications such as glycosylation.

[00515] Терапевтический белок FVIII, полученный с использованием зкДНК-векторов, может быть очищен с помощью любого метода, известного специалистам в данной области техники, например, ионообменной хроматографии, аффинной хроматографии, осаждения или электрофореза.[00515] Therapeutic FVIII protein produced using cDNA vectors can be purified using any method known to those skilled in the art, such as ion exchange chromatography, affinity chromatography, precipitation, or electrophoresis.

[00516] Терапевтический белок FVIII, полученный с помощью способов и композиций, описанных в данном документе, может быть протестирован для оценки связывания с целевым белком-мишенью.[00516] Therapeutic FVIII protein produced using the methods and compositions described herein can be tested to assess binding to the target protein.

ПРИМЕРЫEXAMPLES

[00517] Примеры ниже представлены в качестве иллюстрации, а не ограничения. Обычные специалисты в данной области техники поймут, что зкДНК-векторы могут быть сконструированы из любых ITR дикого типа или модифицированных ITR, описанных в данном документе, и что примерные методы ниже могут быть использованы для конструирования и оценки активности таких зкДНК-векторов. Несмотря на то, что способы приведены в качестве примера для определенных зкДНК-векторов, они применимы к любому зкДНК-вектору в соответствии с описанием.[00517] The examples below are provided by way of illustration and not limitation. Those of ordinary skill in the art will appreciate that cccDNA vectors can be constructed from any of the wild-type ITRs or modified ITRs described herein, and that the exemplary methods below can be used to construct and evaluate the activity of such cccDNA vectors. Although the methods are exemplary for certain cDNA vectors, they are applicable to any cDNA vector as described.

ПРИМЕР 1: Конструирование зкДНК-векторов с использованием метода на основе клеток насекомыхEXAMPLE 1: Construction of cDNA vectors using an insect cell-based method

[00518] Получение зкДНК-векторов с использованием полинуклеотидной матрицы конструкции описано в Примере 1 заявки PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.[00518] The preparation of cccDNA vectors using a polynucleotide template construct is described in Example 1 of PCT/US18/49996, which is incorporated herein by reference in its entirety. For example, the polynucleotide template construct used to produce the ccDNA vectors of the present invention may be a ccDNA plasmid, a ccDNA bacmid, and/or a ccDNA baculovirus. Without being limited to any theory, in a permissive host cell in the presence of, for example, Rep, a polynucleotide template construct containing two symmetrical ITRs and an expression construct where at least one of the ITRs is modified relative to the wild-type ITR sequence, is replicated to produce cccDNA vectors. Obtaining a cDNA vector takes place in two stages: first, cutting (“extracting”) the template from the template backbone (for example, the genome of a cDNA plasmid, ccDNA bacmid, ccDNA baculovirus, etc.) using Rep proteins, and , secondly, Rep-mediated replication of the excised cccDNA vector.

[00519] Примерный способ получения зкДНК-векторов представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от ThermoFisher Scientific.[00519] An exemplary method for producing cDNA vectors is from a cDNA plasmid, as described herein. In FIG. 1A and 1B, the polynucleotide template of each cDNA plasmid construct includes both a left modified ITR and a right modified ITR, with the following elements located between said ITRs: (i) an enhancer/promoter; (ii) cloning site for the transgene; (iii) a post-transcriptional response element (eg, woodchuck hepatitis virus post-transcriptional regulatory element (WPRE)); and (iv) a polyadenylation signal (eg, from the bovine growth hormone gene (BGHpA)). Unique restriction endonuclease recognition sites (R1-R6) (shown in FIG. 1A and FIG. 1B) were also introduced between each component to facilitate the introduction of new genetic components at specific sites in the constructs. R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) and R4 (PacI) TTAATTAA (SEQ ID NO: 124) enzyme sites were engineered into the cloning site to introduce the open reading frame of the transgene. These sequences were cloned into the pFastBac HT B plasmid obtained from ThermoFisher Scientific.

[00520] Получение зкДНК-бакмид:[00520] Preparation of cccDNA-bacmid:

[00521] Компетентные клетки DHlOBac (компетентные клетки MAX EFFICIENCY® DH10Bac™, Thermo Fisher) трансформировали либо тестируемой, либо контрольной плазмидами, следуя протоколу в соответствии с инструкциями производителя. Чтобы получить рекомбинантные зкДНК-бакмиды, в клетках DHlOBac индуцировали рекомбинацию между плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного скринингового отбора на основании скрининга по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG с антибиотиками для отбора трансформантов и поддержания бакмиды и плазмид на основе транспозаз. Белые колонии, образующиеся в результате транспозиции, которая разрушает индикаторный ген β-галактозидазы, собирали и культивировали в 10 мл сред.[00521] DHlOBac competent cells (MAX EFFICIENCY® DH10Bac™ competent cells, Thermo Fisher) were transformed with either test or control plasmids following the protocol according to the manufacturer's instructions. To obtain recombinant cccDNA bacmids, recombination between the plasmid and the baculovirus shuttle vector was induced in DHlOBac cells. Recombinant bacmids were selected by positive screening based on screening for blue-white staining of E. coli (marker Ф80dlacZΔM15 provides α-complementation of the β-galactosidase gene from the bacmid vector) on a bacterial agar plate containing X-gal and IPTG with antibiotics for selection of transformants and maintenance of bacmids and transposase-based plasmids. White colonies resulting from transposition that disrupts the β-galactosidase indicator gene were collected and cultured in 10 ml media.

[00522] Рекомбинантные зкДНК-бакмиды выделяли из E.coli и трансфицировали ими клетки насекомых Sf9 или Sf21 с использованием FugeneHD для получения инфекционного бакуловируса. Адгезивные клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в колбах Т25 при 25°С. Через 4 дня культуральную среду (содержащую вирус Р0) отделяли от клеток, фильтровали через фильтр с размером пор 0,45 мкм, отделяя инфекционные бакуловирусные частицы от клеток или клеточного дебриса.[00522] Recombinant cccDNA bacmids were isolated from E. coli and transfected into Sf9 or Sf21 insect cells using FugeneHD to produce infectious baculovirus. Adherent Sf9 or Sf21 insect cells were cultured in 50 ml of media in T25 flasks at 25°C. After 4 days, the culture medium (containing P0 virus) was separated from the cells and filtered through a 0.45-μm filter to separate infectious baculovirus particles from cells or cellular debris.

[00523] Необязательно первое поколение бакуловируса (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 в 50-500 мл сред. Клетки поддерживали в суспензионных культурах в инкубаторе с орбитальным шейкером при 130 об./мин при 25°С, отслеживая диаметр и жизнеспособность клеток до тех пор, пока клетки не достигнут диаметра 18-19 нм (от диаметра наивных клеток, равного 14-15 нм) и плотности ~4,0×106 клеток/мл. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали после центрифугирования для удаления клеток и дебриса с последующей фильтрацией через фильтр с размером пор 0,45 мкм.[00523] Optionally, the first generation of baculovirus (P0) was amplified by infecting naïve Sf9 or Sf21 insect cells in 50-500 ml media. Cells were maintained in suspension cultures in an orbital shaker incubator at 130 rpm at 25°C, monitoring cell diameter and cell viability until cells reached a diameter of 18-19 nm (from a naïve cell diameter of 14-15 nm ) and density ~4.0×10 6 cells/ml. At 3 to 8 days postinfection, baculovirus P1 particles in the medium were collected after centrifugation to remove cells and debris, followed by filtration through a 0.45-μm pore size filter.

[00524] ЗкДНК-бакуловирус, содержащий тестируемые конструкции, собирали и определяли инфекционную активность или титр бакуловируса. В частности, четыре х20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях: 1/1000, 1/10000, 1/50000, 1/100000 и инкубировали при 25-27°С. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.[00524] The cDNA baculovirus containing the test constructs was collected and the infectivity or titer of the baculovirus was determined. In particular, four x20 ml cultures of Sf9 cells at 2.5 x 10 6 cells/ml were treated with baculovirus P1 in the following dilutions: 1/1000, 1/10000, 1/50000, 1/100000 and incubated at 25-27°C. Infectivity was determined daily for 4-5 days by the increase in cell diameter and cell cycle arrest, as well as changes in cell viability.

[00525] «Rep-плазмиду», раскрытую на ФИГ. 8А из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки, получали в экспрессионном векторе pFASTBAC™-Dual (ThermoFisher), содержащем как Rep78 (SEQ ID NO: 131 или 133), так и Rep52 (SEQ ID NO: 132) или Rep68 (SEQ ID NO: 130) и Rep40 (SEQ ID NO: 129). Rep-плазмиду трансформировали в компетентные клетки DH10Bac (компетентные клетки MAX EFFICIENCY® DH10Bac™ (Thermo Fisher)), следуя предоставленному производителем протоколу. Для получения рекомбинантных бакмид («Rep-бакмид») в клетках DH10Bac индуцировали рекомбинацию между Rep-плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного отбора, который включал скрининг по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG. Одиночные белые колонии собирали и инокулировали в 10 мл селективных сред (канамицин, гентамицин, тетрациклин в бульоне LB). Рекомбинантные бакмиды (Rep-бакмиды) выделяли из E.coli, и трансфицировали клетки насекомых Sf9 или Sf21 указанными Rep-бакмидами, чтобы получить инфекционный бакуловирус.[00525] The "Rep plasmid" disclosed in FIG. 8A from PCT/US18/49996, which is incorporated herein by reference in its entirety, was produced in the expression vector pFASTBAC™-Dual (ThermoFisher) containing both Rep78 (SEQ ID NO: 131 or 133) and Rep52 (SEQ ID NO: 132) or Rep68 (SEQ ID NO: 130) and Rep40 (SEQ ID NO: 129). The Rep plasmid was transformed into DH10Bac competent cells (MAX EFFICIENCY® DH10Bac™ competent cells (Thermo Fisher)) following the protocol provided by the manufacturer. To produce recombinant bacmids (“Rep bacmid”), recombination between the Rep plasmid and the baculovirus shuttle vector was induced in DH10Bac cells. Recombinant bacmids were selected by positive selection, which included screening for blue-white staining of E. coli (marker Ф80dlacZΔM15 provides α-complementation of the β-galactosidase gene from the bacmid vector) on a bacterial agar plate containing X-gal and IPTG. Single white colonies were collected and inoculated into 10 ml of selective media (kanamycin, gentamicin, tetracycline in LB broth). Recombinant bacmids (Rep bacmids) were isolated from E. coli, and Sf9 or Sf21 insect cells were transfected with the indicated Rep bacmids to produce infectious baculovirus.

[00526] Клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в течение 4 дней и выделяли из культуры инфекционный рекомбинантный бакуловирус («Rep-бакуловирус»). Необязательно Rep-бакуловирус первого поколения (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 и культивировали в 50-500 мл сред. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали, отделяя клетки путем центрифугирования или фильтрации, или используя другой способ фракционирования. Собирали Rep-бакуловирус и определяли инфекционную активность бакуловируса. В частности, четыре x20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях, 1/1000, 1/10000, 1/50000, 1/100000, и инкубировали. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.[00526] Sf9 or Sf21 insect cells were cultured in 50 ml media for 4 days and infectious recombinant baculovirus (“Rep-baculovirus”) was isolated from the culture. Optionally, the first generation Rep baculovirus (P0) was amplified by infecting naïve insect cells with Sf9 or Sf21 and cultured in 50-500 ml media. 3-8 days after infection, baculovirus P1 particles in the medium were collected by separating the cells by centrifugation or filtration, or using another fractionation method. Rep-baculovirus was collected and the infectivity of the baculovirus was determined. Specifically, four x20 ml cultures of Sf9 cells at 2.5 x 10 6 cells/ml were treated with baculovirus P1 at the following dilutions, 1/1000, 1/10000, 1/50000, 1/100000, and incubated. Infectivity was determined daily for 4-5 days by the increase in cell diameter and cell cycle arrest, as well as changes in cell viability.

[00527] Получение и характеристика зкДНК-вектора[00527] Preparation and characterization of cccDNA vector

[00528] На ФИГ. 4В среду для культивирования клеток насекомых Sf9, содержащую (1) образец, содержащий зкДНК-бакмиду или зкДНК-бакуловирус, и (2) Rep-бакуловирус, описанный выше, затем добавляли к свежей культуре клеток Sf9 (2,5×106 клеток/мл, 20 мл) при соотношении 1:1000 и 1:10000, соответственно. Затем клетки культивировали при 130 об./мин при 25°С. Через 4-5 дней после ко инфицирования детектировали диаметр и жизнеспособность клеток. Когда диаметр клеток достигал 18-20 нм при жизнеспособности -70-80%, клеточные культуры центрифугировали, среду удаляли и собирали клеточные осадки. Клеточные осадки сначала ресуспендировали в достаточном объеме водной среды, либо воды, либо буфера. ЗкДНК-вектор выделяли и очищали из клеток с использованием протокола очистки Qiagen MIDI PLUS™ (Qiagen, 0,2 мг массы осадка клеток, обработанной на колонку).[00528] In FIG. 4The Sf9 insect cell culture medium containing (1) a sample containing cccDNA bacmid or cccDNA baculovirus and (2) Rep baculovirus described above was then added to a fresh Sf9 cell culture (2.5 x 10 6 cells/ ml, 20 ml) at a ratio of 1:1000 and 1:10000, respectively. Cells were then cultured at 130 rpm at 25°C. Cell diameter and viability were detected 4-5 days after co-infection. When the cell diameter reached 18-20 nm with a viability of -70-80%, cell cultures were centrifuged, the medium was removed and cell pellets were collected. Cell pellets were first resuspended in a sufficient volume of aqueous medium, either water or buffer. The cccDNA vector was isolated and purified from cells using the Qiagen MIDI PLUS™ purification protocol (Qiagen, 0.2 mg cell pellet processed per column).

[00529] Значения выхода зкДНК-векторов, полученных и очищенных из клеток насекомых Sf9, первоначально определяли на основании поглощения в УФ-диапазоне при 260 нм.[00529] Yields of cccDNA vectors derived and purified from Sf9 insect cells were initially determined based on UV absorbance at 260 nm.

[00530] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.[00530] DNA vectors can be identified by agarose gel electrophoresis under native or denaturing conditions, as illustrated in FIG. 4D, where (a) the presence of characteristic bands migrating at twice the size on denaturing gels compared to native gels after restriction endonuclease digestion and analysis by gel electrophoresis, and (b) the presence of monomer and dimer bands (2x) on denaturing gels for undigested material is characterized by the presence of a cDNA vector.

[00531] Структуры выделенных зкДНК-векторов анализировали далее путем расщепления ДНК, полученной из коинфицированных клеток Sf9 (как описано в данном документе), рестрикционными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4D и 4Е, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как бескапсидный вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс.п.о.[00531] The structures of the isolated cccDNA vectors were further analyzed by digesting DNA obtained from coinfected Sf9 cells (as described herein) with restriction endonucleases selected based on a) the presence of only one cut site in the ccDNA vectors, and b) obtaining fragments large enough to be clearly visible when fractionated on a 0.8% denaturing agarose gel (>800 bp). As illustrated in FIG. 4D and 4E, linear discontinuous DNA vectors and linear and continuous cccDNA vectors can be distinguished by the size of their reaction products—for example, a discontinuous DNA vector is expected to produce 1 kb fragments. and 2 kb, while a capsidless vector with a continuous structure is expected to produce fragments of 2 kb. and 4 thousand bp.

[00532] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4D).[00532] Thus, to qualitatively demonstrate that the isolated cccDNA vectors have covalently closed ends as required by their definition, samples were digested with a restriction endonuclease identified based on the specific sequence of the DNA vector as a single site restriction endonuclease, preferably resulting in two cleavage products of unequal size (for example, 1000 bp and 2000 bp). After digestion and electrophoresis on a denaturing gel (which separates two complementary DNA strands), linear, non-covalently closed DNA will be separated into 1000 bp fragments. and 2000 bp, while covalently closed DNA (i.e. cDNA vector) will be divided into fragments 2 times larger (2000 bp and 4000 bp), since two chains The DNA is linked, already unfolded, and twice as long (but single-stranded). In addition, when the monomeric, dimeric, and n-mer forms of DNA vectors are digested, they will all separate into fragments of equal sizes due to the interconnected ends of the multimeric DNA vectors (see FIG. 4D).

[00533] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с 1x SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм).[00533] As used herein, the expression “assay for identifying DNA vectors by agarose gel electrophoresis on a native gel and under denaturing conditions” refers to an assay for assessing the presence of closed ends of cccDNA by performing restriction endonuclease digestion followed by electrophoretic assessment of the digestion products. The following is one such exemplary analysis, although one of ordinary skill in the art will appreciate that many variations of this example known in the art are possible. The restriction endonuclease is selected to be the enzyme that makes a single cut of the cDNA vector of interest to produce products that are approximately 1/3× and 2/3× the length of the DNA vector. This ensures band separation on both native and denaturing gels. It is important to remove the buffer from the sample before denaturation. Qiagen's PCR Product Purification Kit or desalting "spun columns", such as the GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 columns, are some of the endonuclease digestion tools known in the art. The analysis involves, for example, i) digestion of DNA with appropriate restriction endonuclease(s), 2) addition, for example, to a Qiagen PCR purification kit, eluting with distilled water, iii) addition of a 10x denaturing solution (10x=0.5 M NaOH, 10 mM EDTA), adding 10x unbuffered dye, and performing analysis using DNA molecular weight markers prepared by adding a 10x denaturing solution to a 4x, 0.8-1.0% gel, preincubated with 1 mM EDTA and 200 mM NaOH to ensure the same concentration of NaOH in the gel and in the gel box, and analyze the gel in the presence of 1x denaturing solution (50 mM NaOH, 1 mM EDTA). One of ordinary skill in the art will understand what voltage to use for electrophoresis based on size and desired time to obtain results. After electrophoresis, the gels are drained, neutralized in 1x TBE or TAE and transferred to distilled water or 1x TBE/TAE with 1x SYBR Gold. The bands can then be visualized, for example, using Thermo Fisher's SYBR® Gold Nucleic Acid Gel Stain (10,000x concentrate in DMSO) and epifluorescent light (blue) or UV (312 nm).

[00534] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.[00534] The purity of the resulting cccDNA vector can be assessed using any method known in the art. As one exemplary and non-limiting method, the contribution of the cDNA plasmid to the total UV absorbance of the sample can be assessed by comparing the fluorescence intensity of the cDNA vector with a standard. For example, if based on UV absorbance it is determined that 4 μg of ccDNA vector is loaded on the gel, and the fluorescence intensity of the ccDNA vector is equivalent to a 2 kb band. with a known mass of 1 μg, then the mass of the ccDNA vector is 1 μg, and the ccDNA vector constitutes 25% of the total amount of UV absorbing material. Then plot the intensity of the band on the gel as a function of the calculated input amount to which the band corresponds. For example, if the total quantity of the cDNA vector corresponds to 8 kb, and the excised comparative band corresponds to 2 kb, then the intensity of the indicated band on the graph will correspond to 25% of the total amount administered, which in this case will be 0.25 mcg when 1.0 mcg is administered. Using titration of the cccDNA vector plasmid to construct a standard curve, the quantity for the cccDNA vector band is then calculated using the regression line equation, which can then be used to determine the percentage of the total input amount represented by the cccDNA vector, or the percentage purity.

[00535] Для сравнительных целей в Примере 1 описано получение зкДНК-векторов с использованием метода на основе клеток насекомых и полинуклеотидной матрицы конструкции, а также описано в Примере 1 из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению в соответствии с Примером 1, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.[00535] For comparative purposes, Example 1 describes the preparation of cccDNA vectors using an insect cell-based method and polynucleotide template construct, and is also described in Example 1 of PCT/US18/49996, which is incorporated herein by reference in its entirety. For example, the polynucleotide template construct used to produce the ccDNA vectors of the present invention in accordance with Example 1 may be a ccDNA plasmid, a ccDNA bacmid, and/or a ccDNA baculovirus. Without being limited to any theory, in a permissive host cell in the presence of, for example, Rep, a polynucleotide template construct containing two symmetrical ITRs and an expression construct where at least one of the ITRs is modified relative to the wild-type ITR sequence is replicated to produce cccDNA vectors. Obtaining a cDNA vector takes place in two stages: first, cutting (“extracting”) the template from the template backbone (for example, the genome of a cDNA plasmid, ccDNA bacmid, ccDNA baculovirus, etc.) using Rep proteins, and , secondly, Rep-mediated replication of the excised cccDNA vector.

[00536] Примерный способ получения зкДНК-векторов в способе с использованием клетки насекомого представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от Thermo Fisher Scientific.[00536] An exemplary method for producing cccDNA vectors in an insect cell method is preparation from a cccDNA plasmid as described herein. In FIG. 1A and 1B, the polynucleotide template construct of each cccDNA plasmid includes both a left modified ITR and a right modified ITR, with the following elements located between said ITRs: (i) an enhancer/promoter; (ii) cloning site for the transgene; (iii) a post-transcriptional response element (eg, woodchuck hepatitis virus post-transcriptional regulatory element (WPRE)); and (iv) a polyadenylation signal (eg, from the bovine growth hormone gene (BGHpA)). Unique restriction endonuclease recognition sites (R1-R6) (shown in FIG. 1A and FIG. 1B) were also introduced between each component to facilitate the introduction of new genetic components at specific sites in the constructs. R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) and R4 (PacI) TTAATTAA (SEQ ID NO: 124) enzyme sites were engineered into the cloning site to introduce the open reading frame of the transgene. These sequences were cloned into the pFastBac HT B plasmid obtained from Thermo Fisher Scientific.

ПРИМЕР 2: Синтетическое получение зкДНК путем вырезания из двухцепочечной молекулы ДНКEXAMPLE 2: Synthetic production of cDNA by excision from a double-stranded DNA molecule

[00537] Синтетическое получение зкДНК-векторов описано в Примерах 2-6 международной заявки PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки. Один примерный способ получения зкДНК-вектора с применением синтетического способа включает вырезание двухцепочечной молекулы ДНК. В общих чертах, зкДНК-вектор может быть получен с применением конструкции двухцепочечной ДНК, например, см. ФИГ. 7А-8Е из PCT/US19/14122. Согласно некоторым вариантам реализации конструкция двухцепочечной ДНК представляет собой зкДНК-плазмиду, например, см. ФИГ. 6 в международной заявке на патент PCT/US2018/064242, поданной 6 декабря 2018 г.[00537] The synthetic production of cccDNA vectors is described in Examples 2-6 of International Application PCT/US19/14122, filed January 18, 2019, which is incorporated herein by reference in its entirety. One exemplary method of producing a cDNA vector using a synthetic method involves cutting out a double-stranded DNA molecule. In general, a cccDNA vector can be produced using a double-stranded DNA construct, for example, see FIG. 7A-8E from PCT/US19/14122. In some embodiments, the dsDNA construct is a cDNA plasmid, for example, see FIG. 6 in international patent application PCT/US2018/064242, filed December 6, 2018.

[00538] Согласно некоторым вариантам реализации конструкция для получения зкДНК-вектора содержит регуляторный переключатель, описанный в данном документе.[00538] In some embodiments, the design for producing a cccDNA vector includes a regulatory switch described herein.

[00539] В иллюстративных целях в Примере 2 описано получение зкДНК-векторов в качестве примерных ДНК-векторов с замкнутыми концами, полученных с использованием этого метода. Однако, хотя в этом Примере зкДНК-векторы приведены в качестве примеров для иллюстрации синтетических способов получения in vitro для получения ДНК-вектора с замкнутыми концами путем вырезания двухцепочечного полинуклеотида, содержащего ITR и экспрессионную кассету (например, гетерологичную последовательность нуклеиновой кислоты), с последующим лигированием свободных 3' и 5' концов, как описано в данном документе, обычному специалисту в данной области техники известно, что, как проиллюстрировано выше, полинуклеотидную молекулу двухцепочечной ДНК можно модифицировать так, чтобы получить любой целевой ДНК-вектор с замкнутыми концами, включая, но не ограничиваясь этим, doggybone ДНК, гантелеобразную ДНК и т.п. Примерные зкДНК-векторы для получения антител или слитых белков, которые могут быть получены с помощью синтетического метода получения, описанного в Примере 2, обсуждаются в разделах, озаглавленных «III зкДНК-векторы в целом». Примерные антитела и слитые белки, экспрессируемые зкДНК векторами, описаны в разделе, озаглавленном «ПС Примерные антитела и слитые белки, экспрессируемые зкДНК-векторами».[00539] For illustrative purposes, Example 2 describes the preparation of cccDNA vectors as exemplary closed-end DNA vectors prepared using this method. However, although in this Example, cccDNA vectors are exemplified to illustrate synthetic in vitro production methods for producing a closed-end DNA vector by excision of a double-stranded polynucleotide containing an ITR and an expression cassette (e.g., a heterologous nucleic acid sequence), followed by ligation free 3' and 5' ends as described herein, one of ordinary skill in the art will know that, as illustrated above, a double-stranded DNA polynucleotide molecule can be modified to produce any target DNA vector with closed ends, including but not limited to but not limited to, doggybone DNA, dumbbell DNA, etc. Exemplary cccDNA vectors for the production of antibodies or fusion proteins that can be produced using the synthetic production method described in Example 2 are discussed in the sections entitled “III ccDNA Vectors in General.” Exemplary antibodies and fusion proteins expressed by cccDNA vectors are described in the section entitled “Exemplary Antibodies and Fusion Proteins Expressed by cccDNA Vectors.”

[00540] Способ включает (i) вырезание последовательности, кодирующей экспрессионную кассету, из конструкции двухцепочечной ДНК, и (ii) образование шпилечных структур на одном или более ITR, и (iii) соединение свободных 5'- и 3'-концов путем лигирования, например, с помощью ДНК-лигазы Т4.[00540] The method includes (i) excision of a sequence encoding an expression cassette from a double-stranded DNA construct, and (ii) formation of hairpin structures at one or more ITRs, and (iii) joining the free 5' and 3' ends by ligation, for example, using T4 DNA ligase.

[00541] Конструкция двухцепочечной ДНК содержит, в порядке от 5' к 3': первый сайт рестрикционной эндонуклеазы; левый ITR; экспрессионную кассету; правый ITR; и второй сайт рестрикционной эндонуклеазы. Конструкцию двухцепочечной ДНК затем приводят в контакт с одной или более рестрикционными эндонуклеазами для образования двухцепочечных разрывов в обоих сайтах рестрикционных эндонуклеаз. Одна эндонуклеаза может нацелено действовать на оба сайта, или каждый сайт может быть мишенью разной эндонуклеазы, при условии, что сайты рестрикции не присутствуют в матрице зкДНК-вектора. Это позволяет вырезать последовательность между сайтами рестрикционной эндонуклеазы из остальной части конструкции двухцепочечной ДНК (см. Фиг. 9 PCT/US19/14122). После лигирования образуется ДНК-вектор с замкнутыми концами.[00541] The double-stranded DNA construct contains, in order from 5' to 3': a first restriction endonuclease site; left ITR; expression cassette; right ITR; and a second restriction endonuclease site. The double-stranded DNA construct is then contacted with one or more restriction endonucleases to create double-strand breaks at both restriction endonuclease sites. A single endonuclease may target both sites, or each site may be targeted by a different endonuclease, provided that restriction sites are not present in the cccDNA vector template. This allows the sequence between the restriction endonuclease sites to be excised from the rest of the double-stranded DNA construct (see FIG. 9 PCT/US19/14122). After ligation, a DNA vector with closed ends is formed.

[00542] Один или оба ITR, используемые в способе, могут представлять собой ITR дикого типа. Также могут быть использованы модифицированные ITR, причем указанная модификация может включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С' (см., например, Фиг. 6-8 и 10, ФИГ. 11В из PCT/US19/14122), и может иметь две или более шпилечных петель (см., например, ФИГ. 6-8, ФИГ. 11В из PCT/US 19/14122) или одну шпилечную петлю (см., например, ФИГ. 10А-10В, ФИГ. 11В из PCT/US19/14122). ITR, модифицированный шпилечной петлей, может быть получен путем генетической модификации существующего олиго или путем биологического и/или химического синтеза de novo.[00542] One or both ITRs used in the method may be wild-type ITRs. Modified ITRs may also be used, which modification may include the deletion, insertion or substitution of one or more nucleotides from the wild-type ITR in the sequences forming arms B and B' and/or arms C and C' (see, for example, FIG. 6-8 and 10, FIG. 11B from PCT/US19/14122), and may have two or more hairpin loops (see, for example, FIG. 6-8, FIG. 11B from PCT/US 19/14122) or one hairpin loop (see, for example, FIGS. 10A-10B, FIG. 11B from PCT/US19/14122). A hairpin loop-modified ITR can be generated by genetic modification of an existing oligo or by biological and/or chemical de novo synthesis.

[00543] В неограничивающем примере ITR-6 слева и справа (SEQ ID NO: 111 и 112) включают 40 делеций нуклеотидов в плечах В-В' и С-С' из ITR дикого типа ААВ2. Прогнозируется, что нуклеотиды, оставшиеся в модифицированном ITR, образуют одну шпилечную структуру. Свободная энергия Гиббса разворачивания структуры составляет примерно -54,4 ккал/моль. В ITR также могут быть внесены другие модификации, включая необязательную делецию функционального сайта связывания Rep или сайта TRS. ПРИМЕР 3: получение зкДНК за счет конструирования олигонуклеотидов[00543] In a non-limiting example, ITR-6 left and right (SEQ ID NOs: 111 and 112) include 40 nucleotide deletions in arms B-B' and C-C' from the wild-type AAB2 ITR. The nucleotides remaining in the modified ITR are predicted to form a single hairpin structure. The Gibbs free energy of unfolding of the structure is approximately -54.4 kcal/mol. Other modifications may also be made to the ITR, including optional deletion of a functional Rep binding site or TRS site. EXAMPLE 3: obtaining cccDNA by designing oligonucleotides

[00544] Другой примерный способ получения зкДНК-вектора с использованием синтетического способа, который включает сборку различных олигонуклеотидов, представлен в Примере 3 из PCT/US19/14122, в котором зкДНК-вектор получают путем синтеза 5'-олигонуклеотида и 3'-олигонуклеотида ITR и лигирования указанных олигонуклеотидов ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету. На ФИГ. 11В из PCT/US19/14122 представлен примерный способ лигирования 3'-олигонуклеотида ITR и 3'-олигонуклеотида ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету.[00544] Another exemplary method of producing a cccDNA vector using a synthetic method that involves the assembly of various oligonucleotides is presented in Example 3 of PCT/US19/14122, in which a ccDNA vector is prepared by synthesizing a 5' oligonucleotide and a 3' ITR oligonucleotide and ligating said ITR oligonucleotides into a double-stranded polynucleotide containing an expression cassette. In FIG. 11B of PCT/US19/14122 shows an exemplary method for ligating a 3' ITR oligonucleotide and a 3' ITR oligonucleotide into a double-stranded polynucleotide containing an expression cassette.

[00545] Как раскрыто в данном документе, олигонуклеотиды ITR могут содержать WT-ITR (например, см. ФИГ. 3А, ФИГ. 3С) или модифицированные ITR (например, см. ФИГ. 3В и ФИГ. 3D). (См. также, например, ФИГ. 6А, 6В, 7А и 7В из PCT/US 19/14122, которая полностью включена в данный документ). Примерные олигонуклеотиды ITR включают, но не ограничиваются перечисленными, SEQ ID NO: 134-145 (например, см. Таблицу 7 в PCT/US19/14122). Модифицированные ITR могут включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С'. Олигонуклеотиды ITR, содержащие WT-ITR или mod-ITR, описанные в данном документе, для использования в бесклеточном синтезе могут быть получены путем генетической модификации или биологического и/или химического синтеза. Как обсуждается в данном документе, олигонуклеотиды ITR в Примерах 2 и 3 могут содержать WT-ITR или модифицированные ITR (mod-ITR) в симметричных или асимметричных конфигурациях, как обсуждается в данном документе. ПРИМЕР 4: получение зкДНК за счет одноцепочечной молекулы ДНК[00545] As disclosed herein, ITR oligonucleotides may comprise WT-ITR (eg, see FIG. 3A, FIG. 3C) or modified ITRs (eg, see FIG. 3B and FIG. 3D). (See also, for example, FIGS. 6A, 6B, 7A and 7B from PCT/US 19/14122, which is incorporated herein in its entirety). Exemplary ITR oligonucleotides include, but are not limited to, SEQ ID NO: 134-145 (eg, see Table 7 in PCT/US19/14122). Modified ITRs may include the deletion, insertion, or substitution of one or more nucleotides from the wild-type ITR in the sequences forming arms B and B' and/or arms C and C'. ITR oligonucleotides containing WT-ITR or mod-ITR described herein for use in cell-free synthesis can be obtained by genetic modification or biological and/or chemical synthesis. As discussed herein, the ITR oligonucleotides in Examples 2 and 3 may contain WT-ITRs or modified ITRs (mod-ITRs) in symmetric or asymmetric configurations, as discussed herein. EXAMPLE 4: obtaining cccDNA from a single-stranded DNA molecule

[00546] В другом примерном способе получения зкДНК-вектора с использованием синтетического способа, представленном в Примере 4 из PCT/US19/14122, используют одноцепочечную линейную ДНК, содержащую два смысловых ITR, которые фланкируют смысловую последовательность экспрессионной кассеты и ковалентно присоединены к двум антисмысловым ITR, которые фланкируют антисмысловую последовательность экспрессионной кассеты, а концы указанной одноцепочечной линейной ДНК затем лигируют с образованием одноцепочечной молекулы с замкнутыми концами. Один неограничивающий пример включает синтез и/или продуцирование молекулы одноцепочечной ДНК, ренатурацию частей указанной молекулы с образованием одной линейной молекулы ДНК, которая содержит одну или более областей вторичной структуры со спаренными основаниями, с последующим лигированием свободных 5'- и 3'-концов между собой с образованием замкнутой одноцепочечной молекулы.[00546] Another exemplary method for producing a cccDNA vector using a synthetic method, presented in Example 4 of PCT/US19/14122, uses single-stranded linear DNA containing two sense ITRs that flank the sense sequence of the expression cassette and are covalently attached to two antisense ITRs , which flank the antisense sequence of the expression cassette, and the ends of the specified single-stranded linear DNA are then ligated to form a single-stranded molecule with closed ends. One non-limiting example involves synthesizing and/or producing a single-stranded DNA molecule, renaturing portions of said molecule to form a single linear DNA molecule that contains one or more base-paired secondary structure regions, then ligating the free 5' and 3' ends together with the formation of a closed single-chain molecule.

[00547] Примерная одноцепочечная молекула ДНК для получения зкДНК-вектора содержит, от 5' к 3': смысловой первый ITR; смысловую последовательность экспрессионной кассеты; смысловой второй ITR; антисмысловой второй ITR; антисмысловую последовательность экспрессионной кассеты; и антисмысловой первый ITR.[00547] An exemplary single-stranded DNA molecule for producing a cccDNA vector contains, from 5' to 3': a sense first ITR; semantic sequence of the expression cassette; semantic second ITR; antisense second ITR; antisense sequence of the expression cassette; and antisense first ITR.

[00548] Молекула одноцепочечной ДНК для использования в примерном способе Примера 4 может быть образована с помощью любой методологии синтеза ДНК, описанной в данном документе, например, путем синтеза ДНК in vitro, или обеспечена путем расщепления конструкции ДНК (например, плазмиды) нуклеазами и плавления полученных фрагментов дцДНК для получения фрагментов оцДНК.[00548] The single-stranded DNA molecule for use in the exemplary method of Example 4 can be formed using any DNA synthesis methodology described herein, for example, by in vitro DNA synthesis, or provided by digestion of a DNA construct (e.g., plasmid) with nucleases and melting obtained dsDNA fragments to obtain ssDNA fragments.

[00549] Ренатурацию можно осуществлять путем понижения температуры ниже расчетных температур плавления пар смысловой и антисмысловой последовательностей. Температура плавления зависит от содержания конкретных нуклеотидных оснований и характеристик используемого раствора, например, от концентрации соли. Температуры плавления для любой конкретной последовательности и комбинации растворов легко рассчитываются обычным специалистом в данной области техники.[00549] Renaturation can be accomplished by lowering the temperature below the calculated melting temperatures of sense and antisense sequence pairs. The melting point depends on the content of the specific nucleotide bases and the characteristics of the solution used, for example, on the salt concentration. Melting points for any particular sequence and combination of solutions are readily calculated by one of ordinary skill in the art.

[00550] Свободные 5' и 3' концы ренатурированной молекулы могут быть лигированы друг с другом или лигированы со шпилечной молекулой с образованием зкДНК-вектора. Подходящие примерные методологии лигирования и шпилечные молекулы описаны в Примерах 2 и 3.[00550] The free 5' and 3' ends of the renatured molecule can be ligated to each other or ligated to a hairpin molecule to form a cccDNA vector. Suitable exemplary ligation methodologies and hairpin molecules are described in Examples 2 and 3.

ПРИМЕР 5: Очистка и/или подтверждение получения зкДНКEXAMPLE 5: Purification and/or confirmation of ccDNA acquisition

[00551] Любой из продуктов ДНК-вектора, полученных с помощью способов, описанных в данном документе, например, включая способы получения на основе клеток насекомых, описанные в Примере 1, или синтетические способы получения, описанные в Примерах 2-4, может быть очищен, например, для удаления примесей, неиспользованных компонентов или побочных продуктов с использованием методов, обычно известных квалифицированному специалисту; и/или может быть проанализирован для подтверждения того, что полученный ДНК-вектор (в данном случае зкДНК-вектор) представляет собой целевую молекулу. Примерным методом очистки ДНК-вектора, например, зкДНК, является использование протокола очистки Qiagen Midi Plus (Qiagen) и/или очистки на геле.[00551] Any of the DNA vector products produced by the methods described herein, for example, including the insect cell-based production methods described in Example 1 or the synthetic production methods described in Examples 2-4, can be purified , for example, to remove impurities, unused components or by-products using methods generally known to a qualified specialist; and/or can be analyzed to confirm that the resulting DNA vector (in this case the cDNA vector) is the target molecule. An exemplary method for purifying a DNA vector, such as cccDNA, is to use the Qiagen Midi Plus purification protocol (Qiagen) and/or gel purification.

[00552] Ниже приведен примерный метод подтверждения идентичности зкДНК-векторов.[00552] The following is an exemplary method for confirming the identity of cccDNA vectors.

[00553] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.[00553] DNA vectors can be identified by agarose gel electrophoresis under native or denaturing conditions, as illustrated in FIG. 4D, where (a) the presence of characteristic bands migrating at twice the size on denaturing gels compared to native gels after restriction endonuclease digestion and analysis by gel electrophoresis, and (b) the presence of monomer and dimer bands (2x) on denaturing gels for undigested material is characterized by the presence of a cDNA vector.

[00554] Структуры выделенных зкДНК-векторов были дополнительно проанализированы путем расщепления очищенной ДНК рестрикциоиными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4С и 4D, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как зкДНК-вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс. п. о.[00554] The structures of the isolated cccDNA vectors were further analyzed by digesting the purified DNA with restriction endonucleases selected based on a) the presence of only one cutting site in the ccDNA vectors, and b) obtaining fragments large enough to be clearly visible when fractionated into 0.8% denaturing agarose gel (>800 bp). As illustrated in FIG. 4C and 4D, linear discontinuous DNA vectors and linear and continuous cccDNA vectors can be distinguished by the size of their reaction products—for example, a discontinuous DNA vector is expected to produce 1 kb fragments. and 2 kb, while a continuous cccDNA vector is expected to produce 2 kb fragments. and 4 thousand p.o.

[00555] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4Е).[00555] Thus, to qualitatively demonstrate that the isolated cccDNA vectors have covalently closed ends as required by their definition, samples were digested with a restriction endonuclease identified based on the specific sequence of the DNA vector as a single site restriction endonuclease, preferably resulting in two cleavage products of unequal size (for example, 1000 bp and 2000 bp). After digestion and electrophoresis on a denaturing gel (which separates two complementary DNA strands), linear, non-covalently closed DNA will be separated into 1000 bp fragments. and 2000 bp, while covalently closed DNA (i.e. cDNA vector) will be divided into fragments 2 times larger (2000 bp and 4000 bp), since two chains The DNA is linked, already unfolded, and twice as long (but single-stranded). In addition, when the monomeric, dimeric and n-mer forms of DNA vectors are digested, they will all be separated into fragments of the same size due to the interconnected ends of the multimeric DNA vectors (see FIG. 4E).

[00556] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с lx SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм). Вышеупомянутый метод на основе геля может быть адаптирован для целей очистки путем выделения зкДНК-вектора из полосы геля и обеспечения его ренатурации.[00556] As used herein, the expression “assay for identifying DNA vectors by agarose gel electrophoresis on a native gel and under denaturing conditions” refers to an assay for assessing the presence of closed ends of cccDNA by performing restriction endonuclease digestion followed by electrophoretic assessment of the digestion products. The following is one such exemplary analysis, although one of ordinary skill in the art will appreciate that many variations of this example known in the art are possible. The restriction endonuclease is selected to be the enzyme that makes a single cut of the cDNA vector of interest to produce products that are approximately 1/3× and 2/3× the length of the DNA vector. This ensures band separation on both native and denaturing gels. It is important to remove the buffer from the sample before denaturation. Qiagen's PCR Product Purification Kit or desalting "spun columns", such as the GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 columns, are some of the endonuclease digestion tools known in the art. The analysis involves, for example, i) digestion of DNA with appropriate restriction endonuclease(s), 2) addition, for example, to a Qiagen PCR purification kit, eluting with distilled water, iii) addition of a 10x denaturing solution (10x=0.5 M NaOH, 10 mM EDTA), adding 10x unbuffered dye, and performing analysis using DNA molecular weight markers prepared by adding a 10x denaturing solution to a 4x, 0.8-1.0% gel, preincubated with 1 mM EDTA and 200 mM NaOH to ensure the same concentration of NaOH in the gel and in the gel box, and analyze the gel in the presence of 1x denaturing solution (50 mM NaOH, 1 mM EDTA). One of ordinary skill in the art will understand what voltage to use for electrophoresis based on size and desired time to obtain results. After electrophoresis, the gels are drained, neutralized in 1x TBE or TAE and transferred to distilled water or 1x TBE/TAE with lx SYBR Gold. The bands can then be visualized, for example, using Thermo Fisher's SYBR® Gold Nucleic Acid Gel Stain (10,000x concentrate in DMSO) and epifluorescent light (blue) or UV (312 nm). The above gel-based method can be adapted for purification purposes by isolating the cDNA vector from the gel band and allowing it to renature.

[00557] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса - например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.[00557] The purity of the resulting cccDNA vector can be assessed using any method known in the art. As one exemplary and non-limiting method, the contribution of the cDNA plasmid to the total UV absorbance of the sample can be assessed by comparing the fluorescence intensity of the cDNA vector with a standard. For example, if based on UV absorbance it is determined that 4 μg of ccDNA vector is loaded on the gel, and the fluorescence intensity of the ccDNA vector is equivalent to a 2 kb band. with a known mass of 1 μg, then the mass of the ccDNA vector is 1 μg, and the ccDNA vector constitutes 25% of the total amount of UV absorbing material. The intensity of the band on the gel is then plotted against the calculated input amount to which the band corresponds - for example, if the total amount of cDNA vector corresponds to 8 kb, and the excised comparative band corresponds to 2 kb, then the intensity of the indicated the bars on the graph will correspond to 25% of the total amount administered, which in this case would be 0.25 mcg when 1.0 mcg was administered. Using titration of the cccDNA vector plasmid to construct a standard curve, the quantity for the cccDNA vector band is then calculated using the regression line equation, which can then be used to determine the percentage of the total input amount represented by the cccDNA vector, or the percentage purity.

ПРИМЕР 6: Контролируемая экспрессия трансгена с зкДНК: экспрессия трансгена с зкДНК-вектора in vivo может поддерживаться и/или повышаться путем повторного введения дозы.EXAMPLE 6: Controlled expression of a cccDNA transgene: Expression of a cccDNA vector transgene in vivo can be maintained and/or increased by repeated dosing.

[00558] ЗкДНК-вектор получали в соответствии со способами, описанными в Примере 1 выше, с использованием зкДНК-плазмиды, содержащей промотор CAG (SEQ ID NO: 72) и трансген люциферазы (SEQ ID NO: 56), в качестве примерного FVIII, фланкированный асимметричными ITR (например, 5'-WT-ITR (SEQ ID NO: 2) и 3' mod-ITR (SEQ ID NO: 3)), и оценивали в различных программах лечения in vivo. Этот зкДНК-вектор использовали во всех последующих экспериментах, описанных в Примерах 6-10. В Примере 6 зкДНК-вектор очищали, изготавливали в виде состава с липидной наночастицей (ЛНЧ-зкДНК) и вводили путем инъекции в хвостовую вену каждой мыши CD-I® IGS. Липосомы изготавливали с использованием подходящей смеси липидов, содержащей четыре компонента для образования липосом на основе липидных наночастиц (ЛНЧ), включая катионные липиды, вспомогательные липиды, холестерин и ПЭГ-липиды.[00558] The cccDNA vector was prepared in accordance with the methods described in Example 1 above, using a ccDNA plasmid containing the CAG promoter (SEQ ID NO: 72) and a luciferase transgene (SEQ ID NO: 56), as an example FVIII, flanked by asymmetric ITRs (eg, 5'-WT-ITR (SEQ ID NO: 2) and 3' mod-ITR (SEQ ID NO: 3)), and were evaluated in various in vivo treatment programs. This cDNA vector was used in all subsequent experiments described in Examples 6-10. In Example 6, the cccDNA vector was purified, formulated as a lipid nanoparticle (LNP-ccDNA) and administered by tail vein injection into each CD-I® IGS mouse. Liposomes were prepared using a suitable lipid mixture containing four components to form lipid nanoparticle (LNP) liposomes, including cationic lipids, auxiliary lipids, cholesterol, and PEG lipids.

[00559] Для оценки устойчивой экспрессии трансгена in vivo с зкДНК-вектора на протяжении длительного периода времени ЛНЧ-зкДНК вводили в стерильном ФСБ путем внутривенной инъекции в хвостовую вену мышам CD-I® IGS в возрасте приблизительно 5-7 недель. Была проведена оценка трех групп с разными дозировками: 0,1 мг/кг, 0,5 мг/кг и 1,0 мг/кг, по десять мышей на группу (за исключением группы 1,0 мг/кг, в которой было 15 мышей на группу). Инъекции вводили в день 0. Пять мышей из каждой группы получали инъекцию дополнительной идентичной дозы в день 28. Экспрессию люциферазы измеряли путем визуализации IVIS после внутривенного введения мышам CD-I® IGS (Charles River Laboratories; мыши дикого типа (WT)). Экспрессию люциферазы оценивали с помощью визуализации IVIS после введения путем внутрибрюшинной инъекции 150 мг/кг субстрата люциферина в дни 3, 4, 7, 14, 21, 28, 31, 35 и 42 и регулярно (например, еженедельно, два раза в неделю или через каждые 10 суток, или через каждые 2 недели) в период между днями 42-110. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 132 дней после 3 разных протоколов введения (данные не показаны).[00559] To evaluate sustained in vivo transgene expression from a cccDNA vector over an extended period of time, LNP-ccDNA was administered in sterile PBS by intravenous tail vein injection into CD-I® IGS mice at approximately 5-7 weeks of age. Three groups were evaluated at different dosages: 0.1 mg/kg, 0.5 mg/kg and 1.0 mg/kg, ten mice per group (except for the 1.0 mg/kg group, which had 15 mice per group). Injections were administered on day 0. Five mice from each group received an injection of an additional identical dose on day 28. Luciferase expression was measured by IVIS imaging following intravenous administration of CD-I® IGS mice (Charles River Laboratories; wild-type (WT) mice). Luciferase expression was assessed by IVIS imaging after administration by intraperitoneal injection of 150 mg/kg luciferin substrate on days 3, 4, 7, 14, 21, 28, 31, 35, and 42 and regularly (eg, weekly, twice weekly, or every other every 10 days, or every 2 weeks) between days 42-110. Luciferase transgene expression, exemplified by FVIII, measured by IVIS imaging for at least 132 days after 3 different administration protocols (data not shown).

[00560] Расширенное исследование выполняли для изучения эффекта повторной дозы, например, повторного введения ЛНЧ-зкДНК, экспрессирующей люциферазу, субъектам, получавшим ЛНЧ-зкДНК. В частности, оценивали возможность повышения уровней экспрессии путем одного или более дополнительных введений зкДНК-вектора.[00560] An extension study was performed to examine the effect of repeated dosing, eg, repeated administration of LNP-ccDNA expressing luciferase to subjects receiving LNP-ccDNA. In particular, the possibility of increasing expression levels by one or more additional injections of the cccDNA vector was assessed.

[00561] В этом исследовании биораспределение экспрессии люциферазы с зкДНК-вектора оценивали с помощью IVIS у мышей CD-1® IGS после первоначального внутривенного введения 1,0 мг/кг (т.е. праймирующей дозы) в дни 0 и 28 (Группа А). Второе введение зкДНК-вектора осуществляли путем инъекции в хвостовую вену 3 мг/кг (Группа В) или 10 мг/кг (Группа С) в 1,2 мл в хвостовую вену в день 84. В этом исследовании использовали по пять (5) мышей CD-1® в каждой из Групп А, В и С. Визуализацию IVIS экспрессии люциферазы у мышей выполняли перед введением дополнительных доз в дни 49, 56, 63 и 70, как описано выше, а также после введения повторных доз в день 84 и в дни 91, 98, 105, 112 и 132. Экспрессию люциферазы оценивали и детектировали во всех трех Группах А, В и С по меньшей мере до дня 110 (самый продолжительный оцененный период).[00561] In this study, the biodistribution of cccDNA vector luciferase expression was assessed by IVIS in CD-1® IGS mice after an initial intravenous administration of 1.0 mg/kg (i.e., priming dose) on days 0 and 28 (Group A ). The second administration of cccDNA vector was by tail vein injection of 3 mg/kg (Group B) or 10 mg/kg (Group C) in 1.2 ml tail vein injection on day 84. Five (5) mice were used in this study. CD-1® in each of Groups A, B and C. IVIS imaging of luciferase expression in mice was performed before additional doses on days 49, 56, 63 and 70 as described above, and after repeated doses on day 84 and days 91, 98, 105, 112 and 132. Luciferase expression was assessed and detected in all three Groups A, B and C until at least day 110 (the longest period assessed).

[00562] Было показано, что уровень экспрессии люциферазы повышается с помощью повторной дозы (т.е. повторного введения композиции зкДНК) ЛНЧ-зкДНК-Luc, согласно определению путем оценки активности люциферазы в присутствии люциферина. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 110 дней после 3 разных протоколов введения (Группы А, В и С). У мышей, не получавших никакой дополнительной повторной дозы (праймирующая доза 1 мг/кг (т.е. Группа А)), наблюдали стабильную экспрессию люциферазы на протяжении всего исследования. Мыши в группе В, которым вводили повторную дозу 3 мг/кг зкДНК-вектора, демонстрировали приблизительно семикратное увеличение наблюдаемой светимости по сравнению с мышами в Группе С. Неожиданно, мыши, получившие повторную дозу 10 мг/кг зкДНК-вектора, продемонстрировали 17-кратное увеличение наблюдаемой светимости люциферазы по сравнению с мышами, не получавшими никакой повторной дозы (Группа А).[00562] The level of luciferase expression has been shown to be increased by repeated dosing (ie, repeated administration of a cccDNA composition) of LNP-ccDNA-Luc, as determined by assessing luciferase activity in the presence of luciferin. Luciferase transgene expression, as an example of FVIII, measured by IVIS imaging for at least 110 days after 3 different administration protocols (Groups A, B and C). Mice that did not receive any additional boost dose (priming dose of 1 mg/kg (i.e., Group A)) exhibited stable luciferase expression throughout the study. Mice in Group B that received a repeat dose of 3 mg/kg cccDNA vector showed approximately a sevenfold increase in observed luminosity compared to mice in Group C. Surprisingly, mice that received a repeat dose of 10 mg/kg cccDNA vector showed a 17-fold increase in observed luminosity. increase in observed luciferase luminosity compared to mice that did not receive any repeat dose (Group A).

[00563] Группа А мышей CD-1® IGS демонстрирует экспрессию люциферазы после внутривенного введения 1 мг/кг зкДНК-вектора в хвостовую вену в дни 0 и 28. Группы В и С мышей CD-1® IGS демонстрируют экспрессию люциферазы после введения 1 мг/кг зкДНК-вектора в первый момент времени (день 0) и введения повторной дозы зкДНК-вектора во второй момент времени в день 84. Второе введение (т.е. повторная доза) зкДНК-вектора повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз.[00563] Group A CD-1® IGS mice demonstrate luciferase expression following intravenous tail vein administration of 1 mg/kg cccDNA vector on days 0 and 28. Groups B and C CD-1® IGS mice demonstrate luciferase expression following 1 mg administration /kg of cccDNA vector at the first time point (day 0) and a repeat dose of ccDNA vector at the second time point on day 84. A second dose (i.e., boost) of ccDNA vector increased expression by at least 7-fold, and even up to 17 times.

[00564] 3-кратное увеличение дозы (т.е. количества) зкДНК-вектора при повторном введении дозы в Группе В (т.е. при повторном введении дозы 3 мг/кг) привело к 7-кратному увеличению экспрессии люциферазы. Также неожиданно 10-кратное увеличение количества зкДНК-вектора при повторном введении дозы (т.е. при повторном введении дозы 10 мг/кг) в Группе С привело к 17-кратному увеличению экспрессии люциферазы. Таким образом, второе введение (т.е. повторная доза) зкДНК повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз. Это показывает, что повышение экспрессии трансгена в результате повторной дозы больше, чем ожидалось, и зависит от дозы или количества зкДНК-вектора при введении повторной дозы и, по-видимому, является синергическим по отношению к начальной экспрессии трансгена после первоначального праймирующего введения в день 0. Таким образом, дозозависимое повышение экспрессии трансгена не является аддитивным, скорее, уровень экспрессии трансгена является дозозависимым и сверхпропорционален суммарному количеству зкДНК-вектора, введенному в каждый момент времени.[00564] A 3-fold increase in dose (i.e., amount) of cccDNA vector upon repeated dosing in Group B (i.e., upon repeated dosing of 3 mg/kg) resulted in a 7-fold increase in luciferase expression. Also unexpectedly, a 10-fold increase in the amount of cccDNA vector upon repeated dosing (i.e., a repeat dose of 10 mg/kg) in Group C resulted in a 17-fold increase in luciferase expression. Thus, a second administration (i.e., repeat dose) of cccDNA increased expression by at least 7-fold, and even up to 17-fold. This shows that the increase in transgene expression resulting from repeat dosing is greater than expected and dependent on the dose or amount of cccDNA vector at repeat dosing and appears to be synergistic with the initial transgene expression after the initial priming on day 0 Thus, the dose-dependent increase in transgene expression is not additive, rather, the level of transgene expression is dose-dependent and super-proportional to the total amount of cccDNA vector introduced at each time point.

[00565] Обе группы В и С показали значительное дозозависимое повышение экспрессии люциферазы по сравнению с контрольными мышами (Группа А), которые не получали повторной дозы зкДНК-вектора во второй момент времени. В совокупности эти данные показывают, что экспрессия трансгена с зкДНК-вектора может быть повышена дозозависимым образом с помощью повторной дозы (т.е. повторного введения) зкДНК-вектора по меньшей мере во второй момент времени.[00565] Both Groups B and C showed a significant dose-dependent increase in luciferase expression compared to control mice (Group A) that did not receive a repeat dose of the cccDNA vector at the second time point. Taken together, these data indicate that expression of a cccDNA vector transgene can be increased in a dose-dependent manner by re-dosing (ie, reintroducing) the cccDNA vector at at least a second time point.

[00566] В совокупности эти данные демонстрируют, что уровень экспрессии трансгена, например, FVIII, с зкДНК-векторов может поддерживаться на устойчивом уровне на протяжении по меньшей мере 84 дней и может быть повышен in vivo после повторной дозы зкДНК-вектора, введенной по меньшей мере во второй момент времени. ПРИМЕР 7: Устойчивая экспрессия трансгена in vivo зкДНК-векторами, изготовленными в виде составов с ЛНЧ[00566] Taken together, these data demonstrate that the level of transgene expression, such as FVIII, from cccDNA vectors can be maintained at a steady state for at least 84 days and can be increased in vivo after a repeated dose of cccDNA vector administered at least at least at the second point in time. EXAMPLE 7: Stable expression of a transgene in vivo with cDNA vectors prepared as formulations with LNPs

[00567] Воспроизводимость результатов, полученных в Примере 6, с другой липидной наночастицей оценивали in vivo на мышах. В день 0 мышам вводили дозу либо зкДНК-вектора, содержащего трансген люциферазы, управляемый промотором CAG, который был инкапсулирован в ЛНЧ, отличную от использованной в Примере 6, либо тех же ЛНЧ, содержащих поли(С), но без зкДНК или гена люциферазы. В частности, самцам мышей CD-1® в возрасте приблизительно 4 недель вводили однократную инъекцию 0,5 мг/кг ЛНЧ-зкДНК-люциферазы или контрольных ЛНЧ-поли(С), вводимых внутривенно через латеральную хвостовую вену в день 0. В день 14 животным вводили системно люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг. Приблизительно через 15 минут после введения люциферина каждое животное визуализировали с использованием системы визуализации in vivo («IVIS»).[00567] The reproducibility of the results obtained in Example 6 with another lipid nanoparticle was assessed in vivo in mice. On day 0, mice were dosed with either a cccDNA vector containing a luciferase transgene driven by the CAG promoter that was encapsulated in an LNP different from that used in Example 6, or the same LNP containing poly(C) but without the ccDNA or luciferase gene. Specifically, male CD-1® mice, approximately 4 weeks old, were given a single injection of 0.5 mg/kg LNP-ccDNA-luciferase or control LNP-poly(C) administered intravenously via the lateral tail vein on day 0. On day 14 The animals were administered systemic luciferin at a dose of 150 mg/kg by intraperitoneal injection at 2.5 ml/kg. Approximately 15 minutes after luciferin administration, each animal was imaged using an in vivo imaging system (“IVIS”).

[00568] Как показано на ФИГ. 7, значительная флуоресценция в печени наблюдалась у всех четырех мышей, получивших зкДНК, при этом за исключением места инъекции у животных наблюдалась очень незначительная флуоресценция, это указывает на то, что ЛНЧ опосредовали специфичную для печени доставку конструкции зкДНК, и что доставленный зкДНК-вектор был способен к контролируемой устойчивой экспрессии своего трансгена в течение по меньшей мере двух недель после введения. ПРИМЕР 8: Устойчивая экспрессия трансгена в печени in vivo после введения зкД НК-вектора[00568] As shown in FIG. 7, significant fluorescence in the liver was observed in all four mice receiving cccDNA, with very little fluorescence observed in the animals except at the injection site, indicating that LNPs mediated liver-specific delivery of the cccDNA construct and that the delivered cccDNA vector was capable of controlled, sustained expression of its transgene for at least two weeks after administration. EXAMPLE 8: Sustained expression of a transgene in the liver in vivo after administration of a hCD NK vector

[00569] В отдельном эксперименте оценивали локализацию зкДНК, доставленной с помощью ЛНЧ, в печени экспериментальных животных. ЗкДНК-вектор, содержащий представляющий интерес функциональный трансген, инкапсулировали в те же ЛНЧ, что и использованные в Примере 7, и вводили мышам in vivo при уровне дозы 0,5 мг/кг путем внутривенной инъекции. Через 6 часов мышей умерщвляли и отбирали образцы печени, фиксировали формалином и заливали парафином с использованием стандартных протоколов. Анализы методом гибридизации in situ RNAscope® выполняли для визуализации зкДНК-векторов в ткани с использованием зонда, специфичного для трансгена зкДНК, и детектирования с использованием хромогенной реакции и окрашивания гематоксилином (Advanced Cell Diagnostics). ФИГ. 8 показывает результаты, которые указывают на наличие зкДНК в гепатоцитах. ПРИМЕР 9: Устойчивая экспрессия трансгена зкДНК в глазах in vivo[00569] In a separate experiment, the localization of cccDNA delivered by LNP in the liver of experimental animals was assessed. The gccDNA vector containing the functional transgene of interest was encapsulated in the same LNPs as used in Example 7 and administered to mice in vivo at a dose level of 0.5 mg/kg by intravenous injection. After 6 hours, mice were sacrificed and liver samples were collected, formalin fixed, and paraffin embedded using standard protocols. RNAscope® in situ hybridization assays were performed to visualize cccDNA vectors in tissue using a probe specific for the ccDNA transgene and detection using a chromogenic reaction and hematoxylin staining (Advanced Cell Diagnostics). FIG. 8 shows results that indicate the presence of cccDNA in hepatocytes. EXAMPLE 9: Sustained expression of a cDNA transgene in the eye in vivo

[00570] Устойчивость экспрессии трансгена зкДНК-вектора в тканях, отличных от печени, оценивали для определения переносимости и экспрессии зкДНК-вектора после введения в глаза in vivo. Несмотря на то, что люциферазу использовали в качестве примерного трансгена в Примере 9, обычный специалист может легко заменить трансген люциферазы последовательностью FVIII из любой из последовательностей, перечисленных в Таблице 1.[00570] The persistence of cccDNA vector transgene expression in tissues other than the liver was assessed to determine the tolerability and expression of the ccDNA vector following ocular administration in vivo. Although luciferase was used as an exemplary transgene in Example 9, one of ordinary skill in the art can readily replace the luciferase transgene with an FVIII sequence from any of the sequences listed in Table 1.

[00571] В день 0 самцам крыс Sprague Dawley в возрасте приблизительно 9 недель вводили путем субретинальной инъекции 5 мкл либо зкДНК-вектора, содержащего трансген люциферазы, в виде состава с реагентом для трансфекции jetPEI® (Polyplus), либо плазмидной ДНК, кодирующей люциферазу, в виде состава с jetPEI®, в обоих случаях в концентрации 0,25 мкг/мкл. В каждой группе тестировали по четыре крысы. Животным давали седативное средство и вводили исследуемый препарат в правый глаз путем субретинальной инъекции с помощью иглы калибра 33. Левый глаз каждого животного оставляли интактным. Сразу после инъекции глаза проверяли методом оптической когерентной томографии или визуализации глазного дна, чтобы подтвердить наличие субретинального пузырька. Крысы получали бупренорфин и местную мазь с антибиотиком в соответствии со стандартными процедурами.[00571] On day 0, male Sprague Dawley rats approximately 9 weeks old were treated by subretinal injection with 5 μl of either a cDNA vector containing a luciferase transgene formulated with jetPEI® transfection reagent (Polyplus) or plasmid DNA encoding luciferase, as a formulation with jetPEI®, in both cases at a concentration of 0.25 μg/μl. Four rats were tested in each group. Animals were sedated and study drug was administered to the right eye by subretinal injection using a 33-gauge needle. The left eye of each animal was left intact. Immediately after injection, eyes were examined by optical coherence tomography or fundus imaging to confirm the presence of a subretinal bleb. Rats received buprenorphine and topical antibiotic ointment according to standard procedures.

[00572] В дни 7, 14, 21, 28 и 35 животным в обеих группах вводили системно свежеприготовленный люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг.Через 5-15 минут после введения люциферина всех животных визуализировали с использованием IVIS под анестезией изофлураном. Полный поток [фотон/с] и средний поток (фотон/с/ср/см2) в представляющей интерес области, включающей глаз, получали при экспозиции 5 минут. Результаты представлены графически в виде средней светимости в обработанном глазу («инъецированный») для каждой группы лечения относительно средней светимости в необработанном глазу («неинъецированный») для каждой группы лечения (ФИГ. 9В). Значительная флуоресценция легко детектировалась в глазах, в которые был введен зкДНК-вектор, но была намного слабее в глазах, в которые была введена плазмида (ФИГ. 9А). Через 35 дней крыс, которым инъецировали плазмиду, умерщвляли, продолжая исследование для крыс, получивших зкДНК, с инъекцией люциферина и визуализацией IVIS в дни 42, 49, 56, 63, 70 и 99. Результаты демонстрируют, что зкДНК-вектор, введенный в глаз крысы путем однократной инъекции, опосредует экспрессию трансгена in vivo и что такая экспрессия поддерживалась на высоком уровне на протяжении по меньшей мере 99 дней после инъекции.[00572] On days 7, 14, 21, 28 and 35, animals in both groups were systemically administered freshly prepared luciferin at a dose of 150 mg/kg by intraperitoneal injection at 2.5 ml/kg. 5-15 minutes after luciferin administration, all animals were imaged using IVIS under isoflurane anesthesia. Total flux [photon/s] and average flux (photon/s/sr/cm 2 ) in the region of interest, including the eye, were obtained with an exposure of 5 minutes. The results are presented graphically as the average luminosity in the treated eye (“injected”) for each treatment group relative to the average luminosity in the untreated eye (“uninjected”) for each treatment group (FIG. 9B). Significant fluorescence was readily detected in eyes injected with the cDNA vector, but was much weaker in eyes injected with the plasmid (FIG. 9A). After 35 days, plasmid-injected rats were sacrificed, continuing the study for cccDNA-injected rats with luciferin injection and IVIS imaging on days 42, 49, 56, 63, 70, and 99. The results demonstrate that the cccDNA vector injected into the eye rats by a single injection, mediates transgene expression in vivo and that such expression was maintained at a high level for at least 99 days after injection.

ПРИМЕР 10: Длительное введение доз и введение повторных доз зкДНК-вектора у мышей Rag2.EXAMPLE 10: Chronic dosing and repeated dosing of cccDNA vector in Rag2 mice.

[00573] В ситуациях, когда один или более трансгенов, кодируемых в экспрессионной генной кассете зкДНК-вектора, экспрессируются в среде хозяина (например, в клетке или в организме субъекта), где экспрессированный белок распознается как чужеродный, существует вероятность того, что у хозяина выработается адаптивный иммунный ответ, который может привести к нежелательному истощению продукта экспрессии, которое может быть ошибочно принято за отсутствие экспрессии. В некоторых случаях это может происходить с репортерной молекулой, которая является гетерологичной для нормальной среды хозяина. Соответственно, экспрессию трансгена зкДНК-вектора оценивали in vivo в модели на мышах Rag2, в которой отсутствуют В- и Т-клетки и, следовательно, не вырабатывается адаптивный иммунный ответ на ненативные для мышей белки, такие как люцифераза. В общих чертах, в день 0 мышам линий c57b1/6 и Rag2 с подавленными генами вводили путем внутривенной инъекции в хвостовую вену 0,5 мг/кг инкапсулированного в ЛНЧ зкДНК-вектора, экспрессирующего люциферазу, или контроля поли(С), а в день 21 некоторым мышам вводили повторную дозу того же самого ЛНЧ-инкапсулированного зкДНК-вектора при том же уровне дозы. Все тестируемые группы состояли из 4 мышей в каждой. Визуализацию IVIS выполняли после инъекции люциферина, как описано в Примере 9, с недельными интервалами.[00573] In situations where one or more transgenes encoded in a cDNA vector gene expression cassette are expressed in a host environment (e.g., a cell or a subject) where the expressed protein is recognized as foreign, there is a possibility that the host an adaptive immune response will be generated that may lead to unwanted depletion of the expression product, which may be mistaken for lack of expression. In some cases, this may occur with a reporter molecule that is heterologous to the normal host environment. Accordingly, cccDNA vector transgene expression was assessed in vivo in the Rag2 mouse model, which lacks B and T cells and therefore does not mount an adaptive immune response to non-mouse-native proteins such as luciferase. In general, on day 0, gene-silenced c57b1/6 and Rag2 mice were treated by intravenous tail vein injection with 0.5 mg/kg LNP-encapsulated ccDNA vector expressing luciferase or poly(C) control, and on day 21 Some mice were given a repeat dose of the same LNP-encapsulated cccDNA vector at the same dose level. All tested groups consisted of 4 mice each. IVIS imaging was performed after luciferin injection as described in Example 9 at weekly intervals.

[00574] При сравнении полного потока, наблюдаемого в анализах IVIS, флуоресценция, наблюдаемая у мышей дикого типа (косвенная мера присутствия экспрессированной люциферазы), которым вводили ЛНЧ-зкДНК-вектор-Luc, постепенно снижалась после дня 21, в то время как мыши Rag2, которым вводили тот же самый препарат, проявили относительно постоянную устойчивую экспрессию люциферазы на протяжении 42 дней эксперимента (ФИГ. 10А). Временная точка приблизительно в день 21, в которой у мышей наблюдали снижение, соответствует временному интервалу, в котором можно ожидать появления адаптивного иммунного ответа. Повторное введение ЛНЧ с зкДНК-вектором мышам Rag2 приводило к заметному увеличению экспрессии, которая была устойчивой в течение по меньшей мере 21 дня, на протяжении которых проводили наблюдения в этом исследовании (ФИГ. 10В). Результаты позволяют предположить, что адаптивный иммунитет может играть определенную роль при экспрессии ненативного белка с зкДНК-вектора у хозяина, и что наблюдаемое снижение экспрессии в период времени 20+ дней с момента первоначального введения может указывать на мешающий адаптивный иммунный ответ на экспрессируемую молекулу, а не на снижение экспрессии (или в дополнение к ней). Следует отметить, что этот ответ, как ожидается, будет низким в случае экспрессии у хозяина нативных белков, когда, предположительно, хозяин будет правильно распознавать экспрессированные молекулы как собственные и не будет вырабатывать такой иммунный ответ.[00574] When comparing the total flux observed in IVIS assays, the fluorescence observed in wild-type mice (an indirect measure of the presence of expressed luciferase) injected with LNP-ccDNA-vector-Luc gradually decreased after day 21, while Rag2 mice , which were administered the same drug, exhibited relatively constant, robust luciferase expression throughout the 42 days of the experiment (FIG. 10A). The time point at approximately day 21 at which the mice showed a decline corresponds to the time window at which an adaptive immune response can be expected to emerge. Repeated administration of cccDNA vectored LNP to Rag2 mice resulted in a marked increase in expression that was sustained for at least the 21 days observed in this study (FIG. 10B). The results suggest that adaptive immunity may play a role in the expression of a non-native protein from a cccDNA vector in the host, and that the observed decrease in expression at a time period of 20+ days from initial administration may indicate an interfering adaptive immune response to the expressed molecule rather than to decrease expression (or in addition to it). It should be noted that this response is expected to be low when native proteins are expressed in the host, where presumably the host will correctly recognize the expressed molecules as self and will not mount such an immune response.

ПРИМЕР 11: Влияние специфической для печени экспрессии и модуляции CpG на устойчивую экспрессиюEXAMPLE 11: Effect of liver-specific expression and CpG modulation on sustained expression

[00575] Как описано в Примере 10, нежелательный иммунный ответ хозяина в некоторых случаях может искусственно ослаблять то, что иначе могло бы быть устойчивой экспрессией одного или более целевых трансгенов с введенного зкДНК-вектора. Использовали два подхода, чтобы оценить влияние избегания и/или ослабления потенциального иммунного ответа хозяина на устойчивую экспрессию с зкДНК-вектора.[00575] As described in Example 10, an undesirable host immune response in some cases can artificially dampen what would otherwise be robust expression of one or more targeted transgenes from the introduced cccDNA vector. Two approaches were used to evaluate the effect of avoidance and/or attenuation of potential host immune responses on sustained expression from a cccDNA vector.

Во-первых, поскольку вектор зкДНК-Luc, использованный в предшествующих примерах, находился под контролем конститутивного промотора CAG, была получена сходная конструкция с использованием специфического для печени промотора (hAAT) или другого конститутивного промотора (hEF-1), чтобы определить, будет ли избегание длительного воздействия миелоидных клеток или тканей, не относящихся к печени, снижать любые наблюдаемые иммунные эффекты. Во-вторых, некоторые конструкции зкДНК-люцифераза конструировали так, чтобы иметь пониженное содержание CpG, известного триггера иммунной реакции хозяина. Измеряли экспрессию гена люциферазы, кодируемой зкДНК, при введении мышам таких модифицированных зкДНК-векторов с замененным промотором.First, since the cDNA-Luc vector used in the previous examples was under the control of the constitutive CAG promoter, a similar construct was generated using the liver-specific promoter (hAAT) or another constitutive promoter (hEF-1) to determine whether Avoidance of prolonged exposure to myeloid cells or non-liver tissues will reduce any observed immune effects. Second, some cDNA-luciferase constructs have been engineered to have reduced CpG content, a known trigger of the host immune response. The expression of the luciferase gene encoded by cccDNA was measured when such modified cccDNA vectors with a replaced promoter were administered to mice.

[00576] Использовали три разных зкДНК-вектора, каждый из которых кодировал люциферазу в качестве трансгена. Первый зкДНК-вектор имел большое количество неметилированного CpG (~350) и содержал конститутивный промотор С AG («зкДНК CAG»); второй имел умеренное количество неметилированного CpG (~60) и содержал специфический для печени промотор hAAT («зкДНК hAAT с низким содержанием CpG»); и третий представлял собой метилированную форму второго, не содержащую неметилированного CpG, и также содержал промотор hAAT («зкДНК hAAT без CpG»). В остальном зкДНК-векторы были идентичны. Векторы готовили, как описано выше.[00576] Three different cDNA vectors were used, each encoding a luciferase transgene. The first ccDNA vector had a large number of unmethylated CpGs (~350) and contained a constitutive C AG promoter (“ccDNA CAG”); the second had a moderate amount of unmethylated CpG (~60) and contained the liver-specific hAAT promoter (“low-CpG hAAT ccDNA”); and the third was a methylated form of the second, lacking the unmethylated CpG, and also containing the hAAT promoter (“hAAT ccDNA without CpG”). Otherwise, the cccDNA vectors were identical. Vectors were prepared as described above.

[00577] Четыре группы по четыре самца мышей CD-1®, в возрасте приблизительно 4 недель, получали один из зкДНК-векторов, инкапсулированных в ЛНЧ, или контроль поли(С). В день 0 каждой мыши вводили путем однократной внутривенной инъекции в хвостовую вену 0,5 мг/кг зкДНК-вектора в объеме 5 мл/кг. Значения массы тела регистрировали в дни -1, -, 1, 2, 3, 7 и еженедельно после этого, до умерщвления мышей. Образцы цельной крови и сыворотки брали в дни 0, 1 и 35. Прижизненную визуализацию проводили в дни 7, 14, 21, 28 и 35, и затем еженедельно с использованием системы визуализации in vivo (IVIS). Для визуализации каждой мыши вводили люциферин при 150 мг/кг путем внугрибрюшинной инъекции при 2,5 мл/кг. Через 15 минут каждую мышь анестезировали и визуализировали. Мышей умерщвляли в день 93 и собирали терминальные ткани, включая печень и селезенку. Измерения цитокинов проводили через 6 часов после введения дозы в день 0.[00577] Four groups of four male CD-1® mice, approximately 4 weeks old, received one of the LNP-encapsulated cccDNA vectors or a poly(C) control. On day 0, each mouse was given a single intravenous tail vein injection of 0.5 mg/kg cccDNA vector in a volume of 5 ml/kg. Body weight values were recorded on days -1, -, 1, 2, 3, 7 and weekly thereafter until the mice were sacrificed. Whole blood and serum samples were collected on days 0, 1, and 35. Intravital imaging was performed on days 7, 14, 21, 28, and 35, and weekly thereafter using an in vivo imaging system (IVIS). For imaging, each mouse was administered luciferin at 150 mg/kg by intraperitoneal injection at 2.5 ml/kg. After 15 minutes, each mouse was anesthetized and imaged. Mice were sacrificed on day 93 and terminal tissues, including liver and spleen, were collected. Cytokine measurements were performed 6 hours post-dose on day 0.

[00578] Несмотря на то, что у всех получивших зкДНК мышей наблюдали значительную флуоресценцию в дни 7 и 14, у мышей, получивших зкДНК CAG, флуоресценция быстро снижалась после дня 14 и более постепенно уменьшалась на протяжении оставшейся части исследования. Напротив, у мышей, получивших зкДНК hAAT с низким содержанием CpG и без CpG, полный поток оставался на стабильно высоком уровне (Фиг. 11). Это позволяет предположить, что направление доставки зкДНК-вектора специфически в печень приводило к устойчивой и длительной экспрессии трансгена с вектора в течение по меньшей мере 77 дней после однократной инъекции. Конструкции с минимизированным содержанием CpG или с полным отсутствием CpG имели сходные профили длительной устойчивой экспрессии, в то время как конструкция с конститутивным промотором и высоким содержанием CpG проявила снижение экспрессии с течением времени, это позволяет предположить, что иммунная активация хозяина при введении зкДНК-вектора может играть определенную роль в любом снижении экспрессии, наблюдаемом при введении такого вектора субъекту. Эти результаты обеспечивают альтернативные методы адаптации продолжительности ответа к желаемому уровню путем выбора ограниченного конкретной тканью промотора и/или изменения содержания CpG в зкДНК-векторе в том случае, если наблюдается иммунный ответ хозяина потенциально, специфичный в отношении трансгена ответ.[00578] Although all cccDNA-treated mice showed significant fluorescence on days 7 and 14, in CAG cctDNA-treated mice, fluorescence decreased rapidly after day 14 and more gradually decreased throughout the remainder of the study. In contrast, in mice receiving low-CpG and no-CpG hAAT cccDNA, total flux remained at a consistently high level (Figure 11). This suggests that targeting the cccDNA vector specifically to the liver resulted in sustained and long-lasting transgene expression from the vector for at least 77 days after a single injection. Constructs with minimal or no CpG content had similar long-term sustained expression profiles, while the construct with a constitutive promoter and high CpG content showed decreased expression over time, suggesting that host immune activation upon introduction of the cccDNA vector may play a role in any decrease in expression observed when such a vector is administered to a subject. These results provide alternative methods for tailoring the duration of the response to the desired level by selecting a tissue-restricted promoter and/or changing the CpG content of the cccDNA vector when a potentially transgene-specific host immune response is observed.

ПРИМЕР 12: Гидродинамическая доставка зкДНК, экспрессирующей FVIIIEXAMPLE 12: Hydrodynamic delivery of cccDNA expressing FVIII

[00579] Гидродинамическая инъекция в хвостовую вену является хорошо известным методом введения нуклеиновой кислоты в печень у грызунов. В этой системе инъекция под давлением большого объема неинкапсулированной нуклеиновой кислоты приводит к кратковременному увеличению проницаемости клеток и доставке непосредственно в ткани и клетки. Это обеспечивает экспериментальный механизм обхода многих иммунных систем хозяина, таких как привлечение макрофагов, что обеспечивает возможность наблюдать доставку и экспрессию в отсутствие такой активности.[00579] Hydrodynamic tail vein injection is a well-known method for introducing nucleic acid into the liver in rodents. In this system, pressurized injection of a large volume of unencapsulated nucleic acid results in a transient increase in cell permeability and delivery directly into tissues and cells. This provides an experimental mechanism to bypass many host immune systems, such as macrophage recruitment, allowing delivery and expression to be observed in the absence of such activity.

[00580] Три разных зкДНК-вектора, каждый с левым ITR дикого типа и усеченным мутантным правым ITR и имеющие трансгенную область, кодирующую FVIII, получали и очищали, как описано выше в Примерах 1 и 5. ЗкДНК FVIII-векторы под контролем специфического для печени промотора или только ФСБ вводили самцам мышей C57bl/6J в возрасте приблизительно 6 недель. Незащищенные зкДНК-векторы вводили в дозе 0,005 мг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 1,2 мл, введенной в течение 5 секунд, или в дозе 100 мл/кг, введенной в течение 5-8 секунд. Массу тела измеряли в дни 0, 1, 2, 3 и 7, а затем еженедельно. Образцы крови собирали у каждого обработанного животного в дни 3, 7, 14, 21, а также в последний день 28. Наличие экспрессированного FVIII в образцах плазмы измеряли с помощью набора для ИФА общего фактора VIII человека (ELISA Human Total Factor VIII (Innovative Research)).[00580] Three different cccDNA vectors, each with a wild-type left ITR and a truncated mutant right ITR and having a transgenic FVIII coding region, were prepared and purified as described above in Examples 1 and 5. Liver-specific ccDNA FVIII vectors promoter or PBS alone were injected into male C57bl/6J mice at approximately 6 weeks of age. Unprotected cccDNA vectors were administered at a dose of 0.005 mg per animal (4 animals per group) by hydrodynamic intravenous injection through the lateral tail vein in a volume of 1.2 ml administered over 5 seconds, or at a dose of 100 ml/kg administered over 5 -8 seconds. Body weight was measured on days 0, 1, 2, 3 and 7 and then weekly thereafter. Blood samples were collected from each treated animal on days 3, 7, 14, 21, and the final day 28. The presence of expressed FVIII in plasma samples was measured using a Human Total Factor VIII ELISA kit (Innovative Research) ).

[00581] Как показано на ФИГ. 11А, FVIII легко детектировался в образцах плазмы, взятой в день 3 и 7 у мышей, обработанных двумя из трех зкДНК FVIII-векторов, но не наблюдался у мышей, получавших ФСБ. ФИГ. 11В показывает, что экспрессия FVIII зависела от объема дозы в случае двух векторов, для которых наблюдали экспрессию FVIII, и оставалась относительно постоянной на протяжении 28-дневного исследования, за исключением вектора 3, экспрессия которого быстро снижалась после дня 7. Этот эксперимент продемонстрировал, что зкДНК-векторы были способны экспрессировать FVIII из печени после гидродинамической инъекции и что FVIII быстро и легко детектировался в сыворотке после введения зкДНК.[00581] As shown in FIG. 11A, FVIII was readily detected in plasma samples collected on days 3 and 7 from mice treated with two of the three cDNA FVIII vectors, but was not observed in mice treated with PBS. FIG. 11B shows that FVIII expression was dose volume dependent for the two vectors for which FVIII expression was observed and remained relatively constant throughout the 28-day study, with the exception of vector 3, which rapidly declined in expression after day 7. This experiment demonstrated that cccDNA vectors were able to express FVIII from the liver after hydrodynamic injection and that FVIII was rapidly and readily detected in serum after cccDNA injection.

[00582] ПРИМЕР 13: Гидродинамическая доставка зкДНК, экспрессирующей FVIII-тестирование различных зкДНК-векторов, экспрессирующих FVIII[00582] EXAMPLE 13: Hydrodynamic delivery of FVIII-expressing cccDNA testing of various FVIII-expressing cccDNA vectors

[00583] Систему гидродинамической доставки, описанную в Примере 12, использовали для тестирования эффекта различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор способен экспрессировать FVIII после инъекции.[00583] The hydrodynamic delivery system described in Example 12 was used to test the effect of various cccDNA vectors expressing FVIII on serum FVIII levels, and detection of FVIII in serum indicated that the cccDNA vector was capable of expressing FVIII after injection.

[00584] зкДНК-векторы получали, как описано в Примере 12. Каждый из зкДНКFVIII-векторов (по отдельности, без какой-либо инкапсуляции в ЛНЧ) и контроль вводили путем гидродинамической внутривенной (в/в) инъекции мышам C57BL/6. ЗкДНК-векторы вводили в дозе 5 мкг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 90-100 мг/мл. Конечной временной точкой был день 7. В качестве контроля использовали носитель по отдельности.[00584] The cccDNA vectors were prepared as described in Example 12. The cccDNA FVIII vectors (separately, without any encapsulation in LNP) and the control were each administered by hydrodynamic intravenous (IV) injection into C57BL/6 mice. CccDNA vectors were administered at a dose of 5 μg per animal (4 animals per group) by hydrodynamic intravenous injection through the lateral tail vein in a volume of 90-100 mg/ml. The end point was day 7. Vehicle alone was used as a control.

[00585] Следующие зкДНК-векторы тестировали в трех отдельных экспериментах. Последовательности зкДНК-векторов ниже представлены в Таблице 9. В Таблице 9 открытая рамка считывания показана подчеркиванием. Промотор показан жирным шрифтом.[00585] The following cDNA vectors were tested in three separate experiments. The sequences of the cccDNA vectors below are presented in Table 9. In Table 9, the open reading frame is indicated by underlining. The promoter is shown in bold.

(1) зкДНКFVIII-вектор 4, зкДНКFVIII-вектор 6, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 14, зкДНКFVIII-вектор 16, зкДНКFVIII-вектор 18, зкДНКFVIII-вектор 19, зкДНКFVIII-вектор 21, зкДНКFVIII-вектор 22;(1) ccDNAFVIII-vector 4, ccDNAFVIII-vector 6, ccDNAFVIII-vector 12, ccDNAFVIII-vector 14, ccDNAFVIII-vector 16, ccDNAFVIII-vector 18, ccDNAFVIII-vector 19, ccDNAFVIII-vector 21, cc DNAFVIII vector 22;

(2) зкДНКFVIII-вектор 1, зкДНКFVIII-вектор 2, зкДНКFVIII-вектор 3, зкДНКFVIII-вектор 5, зкДНКFVIII-вектор 7, зкДНКFVIII-вектор 8, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 13, зкДНКFVIII-вектор 15;(2) ccDNAFVIII-vector 1, ccDNAFVIII-vector 2, ccDNAFVIII-vector 3, ccDNAFVIII-vector 5, ccDNAFVIII-vector 7, ccDNAFVIII-vector 8, ccDNAFVIII-vector 12, ccDNAFVIII-vector 13, ccDNAFV III-vector 15;

(3) зкДНКFVIII-вектор 9, зкДНКFVIII-вектор 10, зкДНКFVIII-вектор 11, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 17, зкДНКFVIII-вектор 20, зкДНКFVIII-вектор 24, зкДНКFVIII-вектор 25, зкДНКFVIII-вектор 26.(3) ccDNAFVIII-vector 9, ccDNAFVIII-vector 10, ccDNAFVIII-vector 11, ccDNAFVIII-vector 12, ccDNAFVIII-vector 17, ccDNAFVIII-vector 20, ccDNAFVIII-vector 24, ccDNAFVIII-vector 25, h cDNAFVIII-vector 26.

[00586] Исследуемые препараты поставлялись в виде концентрированного исходного раствора и хранились при номинальной температуре 4°С. Составы не перемешивали на вортексе и не центрифугировали. Группы размещали в прозрачных поликарбонатных клетках с контактной подстилкой на вентилируемой стойке в процедурной комнате. Корм и фильтрованную водопроводную воду, подкисленную 1 н. HCl до целевого рН 2,5-3,0, предоставляли животным ad libitum. Кровь собирали в промежуточных и конечных временных точках, как показано ниже:[00586] Study drugs were supplied as a concentrated stock solution and stored at a nominal temperature of 4°C. The compositions were not vortex mixed or centrifuged. The groups were housed in transparent polycarbonate cages with contact bedding on a ventilated rack in the treatment room. Feed and filtered tap water, acidified with 1 N. HCl to a target pH of 2.5-3.0 was provided to the animals ad libitum. Blood was collected at intermediate and final time points as shown below:

[00587] Сбор образцов крови выполняли следующим образом:[00587] Blood sample collection was performed as follows:

[00588] Детали исследования описаны далее:[00588] Details of the study are described below:

[00589] Вид (количество, пол, возраст): Мыши C57BL/6 (JAX 000664) (Ν=40 и 4 запасные, самцы, в возрасте 6 недель на момент прибытия) из Jackson Laboratories.[00589] Species (number, sex, age): C57BL/6 mice (JAX 000664) (N=40 and 4 spare, male, 6 weeks old on arrival) from Jackson Laboratories.

[00590] Класс соединения: зкДНК.[00590] Compound class: ccDNA.

[00591] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.[00591] Cell Observations: Cell observations were performed daily.

[00592] Клинические наблюдения: Клинические наблюдения выполняли через 1, 5-6 и 24 часа после введения дозы в День 0.[00592] Clinical Observations: Clinical observations were performed at 1, 5-6, and 24 hours post-dose on Day 0.

[00593] Масса тела: Массу тела всех животных регистрировали в Дни 0, 3 и 7, в том числе до умерщвления.[00593] Body weight: Body weight of all animals was recorded on Days 0, 3 and 7, including before sacrifice.

[00594] Лекарственная форма: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.[00594] Dosage form: Study drugs were supplied as a concentrated stock solution. The stock solution was diluted with PBS immediately before use. Prepared materials were stored at ~4°C (or on wet ice) unless dispensing was performed immediately.

[00595] Введение дозы: Исследуемые материалы вводили в День 0 путем гидродинамического в/в введения в установленном объеме на животное, 90-100 мл/кг (в зависимости от самого легкого животного в группе) через латеральную хвостовую вену (введение дозы в течение 5 секунд).[00595] Dosing: Test materials were administered on Day 0 by hydrodynamic IV injection at a prescribed volume per animal, 90-100 ml/kg (depending on the lightest animal in the group) via the lateral tail vein (dosing over 5 seconds).

[00596] Сбор крови: У животных собирали промежуточный образец крови в День 3 в соответствии с таблицей выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. У животных собирали кровь в соответствии с приведенными выше таблицами сбора крови. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Готовили одну (1) аликвоту и отмечали любое свертывание в образце цельной крови или гемолиз в плазме. Все образцы хранили при номинальной температуре -70°С. Все образцы хранили при номинальной температуре -70°С до отправки.[00596] Blood Collection: An interim blood sample was collected from the animals on Day 3 according to the table above. After each collection, the animals were subcutaneously injected with 0.5-1.0 ml of lactated Ringer's solution. Blood was collected from animals according to the blood collection tables above. For plasma collections, whole blood was collected into uncoated Eppendorf tubes. 120 μl was immediately withdrawn and placed in tubes containing 13.33 μl of 3.2% sodium citrate. The blood was gently mixed and maintained at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected avoiding cell mass. One (1) aliquot was prepared and any clotting in the whole blood sample or hemolysis in the plasma was noted. All samples were stored at a nominal temperature of -70°C. All samples were stored at a nominal temperature of -70°C until shipment.

[00597] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.[00597] Recovery from anesthesia: Animals were monitored continuously while they were under anesthesia, during recovery, and until mobility was restored.

[00598] Умерщвление и терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения сыворотки в соответствии с СОП учреждения и хранили в двух (2) аликвотах. Для сборов плазмы цельную кровь собирали с помощью шприца, и 600 мкл немедленно помещали в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали четыре (4) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.[00598] Killing and Terminal Blood Collection: On Day 7, animals were sacrificed by CO 2 asphyxia followed by thoracotomy and exsanguination. The maximum available volume of blood was collected by cardiac puncture and processed for serum according to institutional SOPs and stored in two (2) aliquots. For plasma collections, whole blood was collected using a syringe, and 600 μL was immediately placed into tubes containing 66.66 μL of 3.2% sodium citrate. The blood was gently mixed and maintained at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected, avoiding cell mass, and four (4) aliquots were made. Any clotting in the whole blood sample or hemolysis in the plasma was noted.

[00599] Результаты: Результаты, показанные на ФИГ. 12-15, показывают эффект различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор был способен экспрессировать FVIII после инъекции. ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.[00599] Results: The results shown in FIG. 12-15 show the effect of various cccDNA vectors expressing FVIII on serum FVIII levels, whereby detection of FVIII in serum indicated that the cccDNA vector was capable of expressing FVIII after injection. FIG. 12 is a graph depicting plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cccDNA vectors expressing FVIII (ccDNA FVIII vector 4, ccDNA FVIII vector 6, ccDNA FVIII vector 12, ccDNA FVIII vector 14 , cDNAFVIII-vector 16, ccDNAFVIII-vector 18, ccDNAFVIII-vector 19, ccDNAFVIII-vector 21, ccDNAFVIII-vector 22). CccDNAFVIII-vector 16, ccDNAFVIII-vector 19, and ccDNAFVIII-vector 21 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control. FIG. 13 is a graph showing plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII-vector 1, ccDNA FVIII-vector 2, ccDNA FVIII-vector 3, ccDNA FVIII-vector 5 , cDNAFVIII-vector 7, ccDNAFVIII-vector 8, ccDNAFVIII-vector 12, ccDNAFVIII-vector 13, ccDNAFVIII-vector 15). CctDNAFVIII vector 8 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control. FIG. 14 is a graph depicting plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII vector 9, ccDNA FVIII vector 10, ccDNA FVIII vector 11, ccDNA FVIII vector 12 , cDNAFVIII-vector 17, ccDNAFVIII-vector 20, ccDNAFVIII-vector 24, ccDNAFVIII-vector 25, ccDNAFVIII-vector 26). CccDNAFVIII-vector 17 and ccDNAFVIII-vector 20 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control. FIG. 15 is a graph that depicts plasma FVIII concentration (IU/ml) 1 day after hydrodynamic delivery of increasing doses of cccDNAFVIII vector 23 (0.005-50 μg). As shown in FIG. 15, FVIII in plasma increased in a dose-dependent manner with increasing dosage of cDNAFVIII vector 23. Vehicle alone was used as a control.

ПРИМЕР 14: Экспрессия FVIII после доставки ЛНЧ:зкДНК в комбинации с ингибитором киназы у самцов мышей CD-1EXAMPLE 14: FVIII Expression Following Delivery of LNP:ccDNA in Combination with a Kinase Inhibitor in Male CD-1 Mice

[00600] ЛНЧ:зкДНК-векторы получали, как описано в Примере 6. Эффект составов зкДНК:липид тестировали на самцах мышей CD-1. Носитель для дозирования и приготовления ингибитора представлял собой 0,5% метилцеллюлозу.[00600] LNP:ccDNA vectors were prepared as described in Example 6. The effect of cccDNA:lipid formulations was tested in male CD-1 mice. The carrier for dosing and preparing the inhibitor was 0.5% methylcellulose.

[00601] Исследуемый материал ЛНЧ:зкДНК («зкДНКFVIII-вектор 23») вводили следующим образом:[00601] The LNP:ccDNA test material (“ccDNAFVIII-vector 23”) was introduced as follows:

[00602] Образцы крови (промежуточные и конечные) отбирали, как указано ниже:[00602] Blood samples (interim and final) were collected as follows:

[00603] Образцы тканей собирали, как указано ниже:[00603] Tissue samples were collected as follows:

[00604] Детали исследования описаны далее:[00604] Details of the study are described below:

[00605] Вид (количество, пол, возраст): Мыши CD-1 (Ν=10+2 запасные, самцы, в возрасте 4 недель на момент прибытия) из Charles River Laboratories.[00605] Species (number, sex, age): CD-1 mice (Ν=10+2 spare, male, 4 weeks old on arrival) from Charles River Laboratories.

[00606] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.[00606] Cell Observations: Cell observations were performed daily.

[00607] Клинические наблюдения: Клинические наблюдения выполняли примерно через 1, 5-6 и 24 часа после введения дозы исследуемого материала в День 0.[00607] Clinical Observations: Clinical observations were performed approximately 1, 5-6, and 24 hours after dosing of study material on Day 0.

[00608] Масса тела: Массу тела всех животных регистрировали в Дни 0, 1, 2, 3 и 7, в том числе до умерщвления.[00608] Body weight: Body weight of all animals was recorded on Days 0, 1, 2, 3 and 7, including before sacrifice.

[00609] Лекарственная форма исследуемого материала: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.[00609] Dosage form of the study material: The study drugs were supplied in the form of a concentrated stock solution. The stock solution was diluted with PBS immediately before use. Prepared materials were stored at ~4°C (or on wet ice) unless dispensing was performed immediately.

[00610] Введение дозы: Исследуемые препараты вводили в дозе 5 мл/кг в День 0 для Групп 1-2 путем внутривенного введения через латеральную хвостовую вену.[00610] Dosing: Study drugs were administered at a dose of 5 ml/kg on Day 0 for Groups 1-2 by intravenous administration through the lateral tail vein.

[00611] Сбор крови: У всех животных в Группах 1-2 собирали промежуточные образцы крови в День 3 в соответствии с таблицей сбора крови, приведенной выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия с помощью пункции орбитального синуса под анестезией в соответствии с СОП учреждения. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 пл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Была сделана одна (1) аликвота, и будет отмечаться любое свертывание в образце цельной крови или гемолиз в плазме.[00611] Blood Collection: Interim blood samples were collected from all animals in Groups 1-2 on Day 3 according to the blood collection chart above. After each collection, the animals were subcutaneously injected with 0.5-1.0 ml of lactated Ringer's solution. For plasma collections, whole blood was collected into uncoated Eppendorf tubes by orbital sinus puncture under anesthesia according to institutional SOPs. 120 µl was immediately withdrawn and placed in tubes containing 13.33 pL of 3.2% sodium citrate. The blood was mixed gently and stored at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected avoiding cell mass. One (1) aliquot was made and any clotting in the whole blood sample or hemolysis in the plasma will be noted.

[00612] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.[00612] Recovery from anesthesia: Animals were monitored continuously while they were under anesthesia, during recovery, and until mobility was restored.

[00613] Терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения плазмы. Для сборов плазмы цельную кровь собирали с помощью шприца и сразу помещали 600 мкл в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали две (2) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.[00613] Terminal Blood Collection: On Day 7, animals were sacrificed by CO 2 asphyxia followed by thoracotomy and exsanguination. The maximum available volume of blood was collected by cardiac puncture and processed to obtain plasma. For plasma collections, whole blood was collected using a syringe and 600 μL was immediately placed into tubes containing 66.66 μL of 3.2% sodium citrate. The blood was mixed gently and stored at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected, avoiding cell mass, and two (2) aliquots were made. Any clotting in the whole blood sample or hemolysis in the plasma was noted.

[00614] Перфузия: После обескровливания всех животных подвергали перфузии сердца физиологическим раствором. В общих чертах, внутрисердечную перфузию всего тела выполняли путем введения иглы калибра 23/21, прикрепленной к 10 мл шприцу, содержащему физиологический раствор, в просвет левого желудочка для перфузии. Правое предсердие было рассечено, чтобы обеспечить дренажный выход для перфузата. После того, как игла была помещена в сердце, к поршню прикладывали легкое и постоянное давление для перфузии животного. Соответствующий поток промывочного раствора обеспечивали до тех пор, пока выходящий перфузат не станет прозрачным (без видимой крови), это указывает на то, что промывочный раствор насытил тело и процедура завершена.[00614] Perfusion: After exsanguination, all animals were subjected to cardiac perfusion with saline. In general terms, whole body intracardiac perfusion was performed by inserting a 23/21 gauge needle attached to a 10 mL syringe containing saline into the left ventricular lumen for perfusion. The right atrium was incised to provide drainage for the perfusate. Once the needle was placed into the heart, light and constant pressure was applied to the plunger to perfuse the animal. An adequate flow of rinsing solution was maintained until the exiting perfusate became clear (no visible blood), indicating that the rinsing solution had saturated the body and the procedure was complete.

[00615] Сбор ткани: Терминальные ткани собирали у агонирующих животных, которых умерщвляли до запланированной временной точки. При наличии возможности, собирали и сохраняли ткани животных, которые были найдены мертвыми.[00615] Tissue Collection: Terminal tissues were collected from agonizing animals that were sacrificed before the planned time point. Whenever possible, tissues from animals that were found dead were collected and preserved.

[00616] После умерщвления и перфузии забирали печень. Из печени собирали и взвешивали четыре (4) среза по 25-50 мг. Срезы мгновенно замораживали по отдельности и хранили при номинальной температуре -70°С до отправки.[00616] After sacrifice and perfusion, the liver was harvested. Four (4) 25-50 mg sections were collected and weighed from the liver. Sections were flash frozen individually and stored at a nominal temperature of −70°C until shipment.

[00617] Результаты: ФИГ. 16 показывает концентрацию FVIII в плазме (МЕ/мл) через 7 дней после введения исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23. Как показано на ФИГ. 16, FVIII легко детектировался в образцах плазмы мышей, получавших исследуемый препарат ЛНЧ:зкДНКFVIII-вектор 23, но не наблюдался у мышей, получавших только носитель.[00617] Results: FIG. 16 shows plasma FVIII concentration (IU/ml) 7 days after administration of the study drug LNP:ccDNAFVIII-vector 23. As shown in FIG. 16, FVIII was readily detected in plasma samples from mice treated with the test drug LNP:ccDNAFVIII vector 23 but was not observed in mice treated with vehicle alone.

ССЫЛКИLINKS

[00618] Все публикации и ссылки, включая, но не ограничиваясь перечисленными, патенты и заявки на патенты, указанные в данном описании и в Примерах в данном документе, полностью включены посредством ссылки, как если бы каждая отдельная публикация или ссылка была конкретно и по отдельности указана для включения в данный документ посредством ссылки во всей полноте. Любая заявка на патент, согласно которой настоящая заявка испрашивает приоритет, также включена в данный документ посредством ссылки способом, описанным выше для публикаций и ссылок.[00618] All publications and references, including, but not limited to, patents and patent applications set forth in this specification and in the Examples herein, are incorporated by reference in their entirety as if each individual publication or reference were specifically and separately incorporated herein by reference in its entirety. Any patent application to which this application claims priority is also incorporated herein by reference in the manner described above for publications and references.

--->--->

Перечень последовательностей List of sequences

<110> ДЖЕНЕРЕЙШЕН БИО КО.<110> GENERATION BIO CO.

<120> НЕВИРУСНЫЕ ДНК-ВЕКТОРЫ И ВАРИАНТЫ ИХ ПРИМЕНЕНИЯ ДЛЯ ЭКСПРЕССИИ <120> NON-VIRAL DNA VECTORS AND OPTIONS FOR THEIR APPLICATION FOR EXPRESSION

ТЕРАПЕВТИЧЕСКОГО СРЕДСТВА НА ОСНОВЕ ФАКТОРА VIII (FVIII)THERAPEUTIC DRUG BASED ON FACTOR VIII (FVIII)

<130> 131698-06020<130> 131698-06020

<140> PCT/US2020/022738<140> PCT/US2020/022738

<141> 2020-03-13<141> 2020-03-13

<150> 62/856,432<150> 62/856,432

<151> 2019-06-03<151> 2019-06-03

<150> 62/817,904<150> 62/817,904

<151> 2019-03-13<151> 2019-03-13

<160> 398<160> 398

<170> PatentIn version 3.5<170> Patent In version 3.5

<210> 1<210> 1

<211> 141<211> 141

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 1<400> 1

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc

120 120

gagcgcgcag ctgcctgcag g gagcgcgcag ctgcctgcag g

141 141

<210> 2<210> 2

<211> 141<211> 141

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 2<400> 2

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60 60

gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca

120 120

actccatcac taggggttcc t actccatcac taggggttcc t

141 141

<210> 3<210> 3

<211> 130<211> 130

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 3<400> 3

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc

120 120

tgcctgcagg tgcctgcagg

130 130

<210> 4<210> 4

<211> 130<211> 130

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 4<400> 4

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt

60 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact

120 120

aggggttcct aggggttcct

130 130

<210> 5<210> 5

<211> 143<211> 143

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 5<400> 5

ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc

60 60

agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt

120 120

gggcaactcc atcactaggg taa gggcaactcc atcactaggg taa

143 143

<210> 6<210> 6

<211> 144<211> 144

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 6<400> 6

ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc

60 60

agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt

120 120

ggccaactcc atcactagag gtat ggccaactcc atcactagag gtat

144 144

<210> 7<210> 7

<211> 127<211> 127

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 7<400> 7

ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc

60 60

agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg

120 120

gccaact gccaact

127 127

<210> 8<210> 8

<211> 166<211> 166

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 8<400> 8

tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagagggcc tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagaggggcc

60 60

gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc

120 120

gacagggggg agagtgccac actctcaagc aagggggttt tgtaag gacagggggg agagtgccac actctcaagc aagggggttt tgtaag

166 166

<210> 9<210> 9

<211> 144<211> 144

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 9<400> 9

ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg

60 60

cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt

120 120

gggcaactcc atcactaggg gtat gggcaactcc atcactaggg gtat

144 144

<210> 10<210> 10

<211> 143<211> 143

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 10<400> 10

ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc

60 60

ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga

120 120

gcgcgcagag agggagtggg caa gcgcgcagag agggagtggg caa

143 143

<210> 11<210> 11

<211> 144<211> 144

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 11<400> 11

atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc

60 60

ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg

120 120

agtgcgcata gagggagtgg ccaa agtgcgcata gagggagtgg ccaa

144 144

<210> 12<210> 12

<211> 127<211> 127

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 12<400> 12

agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct

60 60

ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag

120 120

tggccaa tggccaa

127 127

<210> 13<210> 13

<211> 166<211> 166

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 13<400> 13

cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc

60 60

gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt

120 120

cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga

166 166

<210> 14<210> 14

<211> 144<211> 144

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 14<400> 14

atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc

60 60

ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga

120 120

gcgcgcatta gagggagtgg gcaa gcgcgcatta gagggagtgg gcaa

144 144

<210> 15<210> 15

<211> 120<211> 120

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 15<400> 15

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg

120 120

<210> 16<210> 16

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 16<400> 16

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca

120 120

gg gg

122 122

<210> 17<210> 17

<211> 129<211> 129

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 17<400> 17

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct

120 120

gcctgcagg gcctgcagg

129 129

<210> 18<210> 18

<211> 101<211> 101

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 18<400> 18

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g

101 101

<210> 19<210> 19

<211> 139<211> 139

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 19<400> 19

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga

120 120

gcgcgcagct gcctgcagg gcgcgcagct gcctgcagg

139 139

<210> 20<210> 20

<211> 137<211> 137

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 20<400> 20

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc

120 120

gcgcagctgc ctgcagg gcgcagctgc ctgcagg

137 137

<210> 21<210> 21

<211> 135<211> 135

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 21<400> 21

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc

120 120

gcagctgcct gcagg gcagctgcct gcagg

135 135

<210> 22<210> 22

<211> 133<211> 133

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 22<400> 22

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc

120 120

agctgcctgc agg aggctgcctgc agg

133 133

<210> 23<210> 23

<211> 139<211> 139

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 23<400> 23

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga

120 120

gcgcgcagct gcctgcagg gcgcgcagct gcctgcagg

139 139

<210> 24<210> 24

<211> 137<211> 137

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 24<400> 24

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc

120 120

gcgcagctgc ctgcagg gcgcagctgc ctgcagg

137 137

<210> 25<210> 25

<211> 135<211> 135

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 25<400> 25

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc

120 120

gcagctgcct gcagg gcagctgcct gcagg

135 135

<210> 26<210> 26

<211> 133<211> 133

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 26<400> 26

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc

120 120

agctgcctgc agg aggctgcctgc agg

133 133

<210> 27<210> 27

<211> 131<211> 131

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 27<400> 27

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag

120 120

ctgcctgcag g ctgcctgcag g

131 131

<210> 28<210> 28

<211> 129<211> 129

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 28<400> 28

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct

120 120

gcctgcagg gcctgcagg

129 129

<210> 29<210> 29

<211> 127<211> 127

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 29<400> 29

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc

120 120

ctgcagg ctgcagg

127 127

<210> 30<210> 30

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 30<400> 30

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca

120 120

gg gg

122 122

<210> 31<210> 31

<211> 130<211> 130

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 31<400> 31

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc

120 120

tgcctgcagg tgcctgcagg

130 130

<210> 32<210> 32

<211> 120<211> 120

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 32<400> 32

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg

60 60

cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct

120 120

<210> 33<210> 33

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 33<400> 33

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc

60 60

ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc

120 120

ct ct

122 122

<210> 34<210> 34

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 34<400> 34

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60 60

ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc

120 120

ct ct

122 122

<210> 35<210> 35

<211> 129<211> 129

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 35<400> 35

cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg

60 60

gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta

120 120

ggggttcct ggggttcct

129 129

<210> 36<210> 36

<211> 101<211> 101

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 36<400> 36

cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc

60 60

gcgcagagag ggagtggcca actccatcac taggggttcc t gcgcagagag ggagtggcca actccatcac taggggttcc t

101 101

<210> 37<210> 37

<211> 139<211> 139

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 37<400> 37

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60 60

gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac

120 120

tccatcacta ggggttcct tccatcacta ggggttcct

139 139

<210> 38<210> 38

<211> 137<211> 137

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 38<400> 38

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60 60

gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc

120 120

catcactagg ggttcct catcactagg ggttcct

137 137

<210> 39<210> 39

<211> 135<211> 135

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 39<400> 39

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60 60

gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca

120 120

tcactagggg ttcct tcactagggg ttcct

135 135

<210> 40<210> 40

<211> 133<211> 133

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 40<400> 40

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60 60

gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc

120 120

actaggggtt cct actaggggtt cct

133 133

<210> 41<210> 41

<211> 139<211> 139

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 41<400> 41

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg

60 60

gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac

120 120

tccatcacta ggggttcct tccatcacta ggggttcct

139 139

<210> 42<210> 42

<211> 137<211> 137

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 42<400> 42

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc

60 60

gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc

120 120

catcactagg ggttcct catcactagg ggttcct

137 137

<210> 43<210> 43

<211> 135<211> 135

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 43<400> 43

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga

60 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca

120 120

tcactagggg ttcct tcactagggg ttcct

135 135

<210> 44<210> 44

<211> 133<211> 133

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 44<400> 44

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc

60 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc

120 120

actaggggtt cct actaggggtt cct

133 133

<210> 45<210> 45

<211> 131<211> 131

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 45<400> 45

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt

60 60

tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac

120 120

taggggttcc t tagggggttcct

131 131

<210> 46<210> 46

<211> 129<211> 129

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 46<400> 46

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg

60 60

gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta

120 120

ggggttcct ggggttcct

129 129

<210> 47<210> 47

<211> 127<211> 127

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 47<400> 47

cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt

60 60

cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg

120 120

ggttcct ggttcct

127 127

<210> 48<210> 48

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 48<400> 48

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca

120 120

gg gg

122 122

<210> 49<210> 49

<211> 12<211> 12

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 49<400> 49

cgatcgttcg at cgatcgttcg at

12 12

<210> 50<210> 50

<211> 12<211> 12

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 50<400> 50

atcgaaccat cg atcgaaccat cg

12 12

<210> 51<210> 51

<211> 12<211> 12

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 51<400> 51

atcgaacgat cg atcgaacgat cg

12 12

<210> 52<210> 52

<211> 165<211> 165

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 52<400> 52

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60 60

ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc

120 120

gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct

165 165

<210> 53<210> 53

<211> 140<211> 140

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 53<400> 53

cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc

60 60

cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cggggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg

120 120

cgcagagaga tcactagggg cgcagagaga tcactagggg

140 140

<210> 54<210> 54

<211> 91<211> 91

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 54<400> 54

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg

60 60

tcgcccggcc tcagtgagcg agcgagcgcg c tcgcccggcc tcagtgagcg agcgagcgcg c

91 91

<210> 55<210> 55

<211> 91<211> 91

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 55<400> 55

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc

60 60

ccgggcggcc tcagtgagcg agcgagcgcg c ccgggcggcc tcagtgagcg agcgagcgcg c

91 91

<210> 56<210> 56

<211> 1662<211> 1662

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 56<400> 56

gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg

60 60

gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct

120 120

ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc

180 180

gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga

240 240

atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt

300 300

atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt

360 360

atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg

420 420

aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat

480 480

taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat

540 540

gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac

600 600

tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg

660 660

agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt

720 720

ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata

780 780

tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt

840 840

caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa

900 900

agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct

960 960

cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg

10201020

caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat

10801080

aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat

11401140

accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt

12001200

atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg

12601260

ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc

13201320

ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc

13801380

ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc

14401440

ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag

15001500

atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg

15601560

tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag

16201620

atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa

16621662

<210> 57<210> 57

<211> 453<211> 453

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полипептидpolypeptide

<220><220>

<221> MOD_RES<221> MOD_RES

<222> (1)..(1)<222> (1)..(1)

<223> Любая аминокислота<223> Any amino acid

<400> 57<400> 57

Xaa Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly ArgXaa Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg

1 5 10 151 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Phe Ser Ser TyrSer Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Phe Ser Ser Tyr

20 25 30 20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp ValGly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45 35 40 45

Ala Val Ile Trp Phe Asp Gly Thr Lys Lys Tyr Tyr Thr Asp Ser ValAla Val Ile Trp Phe Asp Gly Thr Lys Lys Tyr Tyr Thr Asp Ser Val

50 55 60 50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu TyrLys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr

65 70 75 8065 70 75 80

Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr CysLeu Gln Met Asn Thr Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95 85 90 95

Ala Arg Asp Arg Gly Ile Gly Ala Arg Arg Gly Pro Tyr Tyr Met AspAla Arg Asp Arg Gly Ile Gly Ala Arg Arg Gly Pro Tyr Tyr Met Asp

100 105 110 100 105 110

Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr LysVal Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys

115 120 125 115 120 125

Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser GlyGly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly

130 135 140 130 135 140

Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu ProGly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro

145 150 155 160145 150 155 160

Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His ThrVal Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr

165 170 175 165 170 175

Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser ValPhe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val

180 185 190 180 185 190

Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys AsnVal Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn

195 200 205 195 200 205

Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu ProVal Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro

210 215 220 210 215 220

Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro GluLys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu

225 230 235 240225 230 235 240

Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys AspLeu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp

245 250 255 245 250 255

Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val AspThr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp

260 265 270 260 265 270

Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp GlyVal Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly

275 280 285 275 280 285

Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr AsnVal Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn

290 295 300 290 295 300

Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp TrpSer Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp

305 310 315 320305 310 315 320

Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu ProLeu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro

325 330 335 325 330 335

Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg GluAla Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu

340 345 350 340 345 350

Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys AsnPro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn

355 360 365 355 360 365

Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp IleGln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile

370 375 380 370 375 380

Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys ThrAla Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr

385 390 395 400385 390 395 400

Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser LysThr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys

405 410 415 405 410 415

Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser CysLeu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys

420 425 430 420 425 430

Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser LeuSer Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu

435 440 445 435 440 445

Ser Leu Ser Pro GlySer Leu Ser Pro Gly

450 450

<210> 58<210> 58

<211> 214<211> 214

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полипептидpolypeptide

<400> 58<400> 58

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val GlyAsp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 151 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser TyrAsp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Tyr

20 25 30 20 25 30

Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu IleLeu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

35 40 45 35 40 45

Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser GlyTyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60 50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln ProSer Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65 70 75 8065 70 75 80

Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro LeuGlu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro Leu

85 90 95 85 90 95

Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala AlaThr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala

100 105 110 100 105 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser GlyPro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

115 120 125 115 120 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu AlaThr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

130 135 140 130 135 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser GlnLys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145 150 155 160145 150 155 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu SerGlu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

165 170 175 165 170 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val TyrSer Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

180 185 190 180 185 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys SerAla Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

195 200 205 195 200 205

Phe Asn Arg Gly Glu CysPhe Asn Arg Gly Glu Cys

210 210

<210> 59<210> 59

<211> 1310<211> 1310

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 59<400> 59

ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga

60 60

ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc

120 120

atgcgctcag ggctgagcgc ggggagagca gagcacacaa gctcatagac cctggtcgtg atgcgctcag ggctgagcgc ggggagagca gagcacacaa gctcatagac cctggtcgtg

180 180

ggggggagga ccggggagct ggcgcggggc aaactgggaa agcggtgtcg tgtgctggct ggggggagga ccggggagct ggcgcggggc aaactgggaa agcggtgtcg tgtgctggct

240 240

ccgccctctt cccgagggtg ggggagaacg gtatataagt gcggcagtcg ccttggacgt ccgccctctt cccgagggtg ggggagaacg gtatataagt gcggcagtcg ccttggacgt

300 300

tctttttcgc aacgggtttg ccgtcagaac gcaggtgagg ggcgggtgtg gcttccgcgg tctttttcgc aacgggtttg ccgtcagaac gcaggtgagg ggcgggtgtg gcttccgcgg

360 360

gccgccgagc tggaggtcct gctccgagcg ggccgggccc cgctgtcgtc ggcggggatt gccgccgagc tggaggtcct gctccgagcg ggccggggccc cgctgtcgtc ggcggggatt

420 420

agctgcgagc attcccgctt cgagttgcgg gcggcgcggg aggcagagtg cgaggcctag agctgcgagc attcccgctt cgagttgcgg gcggcgcggg aggcagagtg cgaggcctag

480 480

cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc tagcgtggtg tccgcgccgc cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc tagcgtggtg tccgcgccgc

540 540

cgccgcgtgc tactccggcc gcactctggt cttttttttt tttgttgttg ttgccctgct cgccgcgtgc tactccggcc gcactctggt cttttttttt tttgttgttg ttgccctgct

600 600

gccttcgatt gccgttcagc aataggggct aacaaaggga gggtgcgggg cttgctcgcc gccttcgatt gccgttcagc aataggggct aacaaaggga gggtgcgggg cttgctcgcc

660 660

cggagcccgg agaggtcatg gttggggagg aatggaggga caggagtggc ggctggggcc cggagcccgg agaggtcatg gttggggagg aatggaggga caggagtggc ggctggggcc

720 720

cgcccgcctt cggagcacat gtccgacgcc acctggatgg ggcgaggcct ggggtttttc cgcccgcctt cggagcacat gtccgacgcc acctggatgg ggcgaggcct ggggtttttc

780 780

ccgaagcaac caggctgggg ttagcgtgcc gaggccatgt ggccccagca cccggcacga ccgaagcaac caggctgggg ttagcgtgcc gaggccatgt ggccccagca cccggcacga

840 840

tctggcttgg cggcgccgcg ttgccctgcc tccctaacta gggtgaggcc atcccgtccg tctggcttgg cggcgccgcg ttgccctgcc tccctaacta gggtgaggcc atcccgtccg

900 900

gcaccagttg cgtgcgtgga aagatggccg ctcccgggcc ctgttgcaag gagctcaaaa gcaccagttg cgtgcgtgga aagatggccg ctcccggggcc ctgttgcaag gagctcaaaa

960 960

tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa ggaagagggc tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa ggaagagggc

10201020

ctggtccctc accggctgct gcttcctgtg accccgtggt cctatcggcc gcaatagtca ctggtccctc accggctgct gcttcctgtg accccgtggt cctatcggcc gcaatagtca

10801080

cctcgggctt ttgagcacgg ctagtcgcgg cggggggagg ggatgtaatg gcgttggagt cctcgggctt ttgagcacgg ctagtcgcgg cggggggagg ggatgtaatg gcgttggagt

11401140

ttgttcacat ttggtgggtg gagactagtc aggccagcct ggcgctggaa gtcatttttg ttgttcacat ttggtgggtg gagactagtc aggccagcct ggcgctggaa gtcatttttg

12001200

gaatttgtcc ccttgagttt tgagcggagc taattctcgg gcttcttagc ggttcaaagg gaatttgtcc ccttgagttt tgagcggagc taattctcgg gcttcttagc ggttcaaagg

12601260

tatcttttaa accctttttt aggtgttgtg aaaaccaccg ctaattcaaa tatcttttaa accctttttt aggtgttgtg aaaaccaccg ctaattcaaa

13101310

<210> 60<210> 60

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 60<400> 60

gcgcgctcgc tcgctc gcgcgctcgc tcgctc

16 16

<210> 61<210> 61

<211> 6<211> 6

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 61<400> 61

ggttga ggttga

6 6

<210> 62<210> 62

<211> 4<211> 4

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 62<400> 62

agtt agtt

4 4

<210> 63<210> 63

<211> 6<211> 6

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 63<400> 63

ggttgg ggttgg

6 6

<210> 64<210> 64

<211> 6<211> 6

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 64<400> 64

agttgg agttgg

6 6

<210> 65<210> 65

<211> 6<211> 6

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 65<400> 65

agttga agttga

6 6

<210> 66<210> 66

<211> 6<211> 6

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 66<400> 66

rrttrr rrttrr

6 6

<210> 67<210> 67

<211> 581<211> 581

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 67<400> 67

gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat

60 60

ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt

120 120

actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc

180 180

tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt

240 240

aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct

300 300

attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt

360 360

ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac

420 420

gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct

480 480

ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca

540 540

ggggctaggt tgctgggcac tgataattcc gtggtgttgt c ggggctaggt tgctgggcac tgataattcc gtggtgttgt c

581 581

<210> 68<210> 68

<211> 225<211> 225

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 68<400> 68

tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct

60 60

ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct

120 120

gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg

180 180

ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc

225 225

<210> 69<210> 69

<211> 8<211> 8

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 69<400> 69

actgaggc actgaggc

8 8

<210> 70<210> 70

<211> 8<211> 8

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 70<400> 70

gcctcagt gcctcagt

8 8

<210> 71<210> 71

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 71<400> 71

gagcgagcga gcgcgc gagcgagcga gcgcgc

16 16

<210> 72<210> 72

<211> 1923<211> 1923

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 72<400> 72

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta

60 60

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc

120 120

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg

180 180

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc

240 240

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat

300 300

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc

360 360

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga

420 420

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg

480 480

gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg

540 540

cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta

600 600

attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg

660 660

gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg

720 720

cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg

780 780

aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg

840 840

ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc

900 900

gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt

960 960

ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc

10201020

ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc

10801080

ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg

11401140

aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag

12001200

gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc

12601260

tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg

13201320

gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg

13801380

ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc

14401440

ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg

15001500

taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct

15601560

gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg

16201620

aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc

16801680

cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg

17401740

ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc

18001800

ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg

18601860

acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag

19201920

cca cca

19231923

<210> 73<210> 73

<211> 1272<211> 1272

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 73<400> 73

aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc

60 60

ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc

120 120

tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc

180 180

cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc

240 240

tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt

300 300

ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag

360 360

taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa

420 420

gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg

480 480

ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc

540 540

tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt

600 600

gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag

660 660

cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt

720 720

ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat

780 780

cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt

840 840

ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct

900 900

gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg

960 960

cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag

10201020

cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc

10801080

ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag

11401140

cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt

12001200

tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac

12601260

ctttggaact ga ctttggaact ga

12721272

<210> 74<210> 74

<211> 1177<211> 1177

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 74<400> 74

ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc

60 60

tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac

120 120

ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac

180 180

agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca

240 240

tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc

300 300

ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag

360 360

tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa

420 420

tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt

480 480

tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga

540 540

cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca

600 600

agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt

660 660

tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta

720 720

attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt

780 780

accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagaggcca

840 840

gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca

900 900

ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg

960 960

tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg

10201020

gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca

10801080

gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc

11401140

tcctcagctt caggcaccac cactgacctg ggacagt tcctcagctt caggcaccac cactgacctg ggacagt

11771177

<210> 75<210> 75

<211> 547<211> 547

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 75<400> 75

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc

60 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc

120 120

cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag

180 180

gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag

240 240

gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct

300 300

gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt

360 360

gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca

420 420

ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa

480 480

gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg

540 540

gaactga gaactga

547 547

<210> 76<210> 76

<211> 556<211> 556

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 76<400> 76

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc

60 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc

120 120

cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt

180 180

agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc

240 240

aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt

300 300

ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc

360 360

ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct

420 420

tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa

480 480

aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc

540 540

caacctttgg aactga caacctttgg aactga

556 556

<210> 77<210> 77

<211> 1179<211> 1179

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 77<400> 77

ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg

60 60

ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt

120 120

gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca

180 180

gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc

240 240

gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt

300 300

acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg

360 360

gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg

420 420

cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct

480 480

ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg

540 540

caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc

600 600

gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga

660 660

gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct gcgcggccac cgagaatcgg acggggggtag tctcaagctg gccggcctgc tctggtgcct

720 720

ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca

780 780

gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg

840 840

acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg

900 900

tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat

960 960

tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg

10201020

gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa

10801080

ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca

11401140

gtggttcaaa gtttttttct tccatttcag gtgtcgtga gtggttcaaa gtttttttct tccatttcag gtgtcgtga

11791179

<210> 78<210> 78

<211> 141<211> 141

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 78<400> 78

aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt

60 60

cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc

120 120

tgcggcgcgc gcagcacctt t tgcggcgcgc gcagcacctt t

141 141

<210> 79<210> 79

<211> 317<211> 317

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 79<400> 79

ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt

60 60

agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca

120 120

tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa

180 180

ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag

240 240

aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag

300 300

gcctaggctt ttgcaaa gcctaggctt ttgcaaa

317 317

<210> 80<210> 80

<211> 241<211> 241

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 80<400> 80

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag

60 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga

120 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat

180 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga

240 240

c c

241 241

<210> 81<210> 81

<211> 215<211> 215

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 81<400> 81

gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa

60 60

cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc

120 120

tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg

180 180

gatttgggaa tcgtataaga actgtatgag accac gatttgggaa tcgtataaga actgtatgag accac

215 215

<210> 82<210> 82

<211> 546<211> 546

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 82<400> 82

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc

60 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc

120 120

cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag

180 180

gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag

240 240

gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct

300 300

gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt

360 360

gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca

420 420

ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa

480 480

gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg

540 540

gaactg gaactg

546 546

<210> 83<210> 83

<211> 576<211> 576

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 83<400> 83

tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa

60 60

cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata

120 120

atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag

180 180

tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc

240 240

cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta

300 300

tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg

360 360

cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt

420 420

ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca

480 480

aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag

540 540

gtctatataa gcagagctgg tttagtgaac cgtcag gtctatataa gcagagctgg tttagtgaac cgtcag

576 576

<210> 84<210> 84

<211> 150<211> 150

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 84<400> 84

ataaacgata acgccgttgg tggcgtgagg catgtaaaag gttacatcat tatcttgttc ataaacgata acgccgttgg tggcgtgagg catgtaaaag gttacatcat tatcttgttc

60 60

gccatccggt tggtataaat agacgttcat gttggttttt gtttcagttg caagttggct gccatccggt tggtataaat agacgttcat gttggttttt gtttcagttg caagttggct

120 120

gcggcgcgcg cagcaccttt gcggccatct gcggcgcgcg cagcaccttt gcggccatct

150 150

<210> 85<210> 85

<211> 1313<211> 1313

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 85<400> 85

ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga

60 60

ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc

120 120

atgcgcccag ggctgagcgc gggtagatca gagcacacaa gctcacagtc cccggcggtg atgcgcccag ggctgagcgc gggtagatca gagcacacaa gctcacagtc cccggcggtg

180 180

gggggagggg cgcgctgagc gggggccagg gagctggcgc ggggcaaact gggaaagtgg gggggagggg cgcgctgagc gggggccagg gagctggcgc ggggcaaact gggaaagtgg

240 240

tgtcgtgtgc tggctccgcc ctcttcccga gggtggggga gaacggtata taagtgcggt tgtcgtgtgc tggctccgcc ctcttcccga gggtggggga gaacggtata taagtgcggt

300 300

agtcgccttg gacgttcttt ttcgcaacgg gtttgccgtc agaacgcagg tgagtggcgg agtcgccttg gacgttcttt ttcgcaacgg gtttgccgtc agaacgcagg tgagtggcgg

360 360

gtgtggcttc cgcgggcccc ggagctggag ccctgctctg agcgggccgg gctgatatgc gtgtggcttc cgcgggcccc ggagctggag ccctgctctg agcgggccgg gctgatatgc

420 420

gagtgtcgtc cgcagggttt agctgtgagc attcccactt cgagtggcgg gcggtgcggg gagtgtcgtc cgcagggttt agctgtgagc attcccactt cgagtggcgg gcggtgcggg

480 480

ggtgagagtg cgaggcctag cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc ggtgagagtg cgaggcctag cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc

540 540

tagcgtggtg tccgccgccg cgtgccactc cggccgcact atgcgttttt tgtccttgct tagcgtggtg tccgccgccg cgtgccactc cggccgcact atgcgttttt tgtccttgct

600 600

gccctcgatt gccttccagc agcatgggct aacaaaggga gggtgtgggg ctcactctta gccctcgatt gccttccagc agcatgggct aacaaaggga gggtgtgggg ctcactctta

660 660

aggagcccat gaagcttacg ttggatagga atggaagggc aggaggggcg actggggccc aggagcccat gaagcttacg ttggatagga atggaagggc aggaggggcg actggggccc

720 720

gcccgccttc ggagcacatg tccgacgcca cctggatggg gcgaggcctg tggctttccg gcccgccttc ggagcacatg tccgacgcca cctggatggg gcgaggcctg tggctttccg

780 780

aagcaatcgg gcgtgagttt agcctacctg ggccatgtgg ccctagcact gggcacggtc aagcaatcgg gcgtgagttt agcctacctg ggccatgtgg ccctagcact gggcacggtc

840 840

tggcctggcg gtgccgcgtt cccttgcctc ccaacaaggg tgaggccgtc ccgcccggca tggcctggcg gtgccgcgtt cccttgcctc ccaacaaggg tgaggccgtc ccgcccggca

900 900

ccagttgctt gcgcggaaag atggccgctc ccggggccct gttgcaagga gctcaaaatg ccagttgctt gcgcggaaag atggccgctc ccggggccct gttgcaagga gctcaaaatg

960 960

gaggacgcgg cagcccggtg gagcgggcgg gtgagtcacc cacacaaagg aagagggcct gaggacgcgg cagcccggtg gagcgggcgg gtgagtcacc cacacaaagg aagagggcct

10201020

tgcccctcgc cggccgctgc ttcctgtgac cccgtggtct atcggccgca tagtcacctc tgcccctcgc cggccgctgc ttcctgtgac cccgtggtct atcggccgca tagtcacctc

10801080

gggcttctct tgagcaccgc tcgtcgcggc ggggggaggg gatctaatgg cgttggagtt gggcttctct tgagcaccgc tcgtcgcggc ggggggaggg gatctaatgg cgttggagtt

11401140

tgttcacatt tggtgggtgg agactagtca ggccagcctg gcgctggaag tcattcttgg tgttcacatt tggtgggtgg agactagtca ggccagcctg gcgctggaag tcattcttgg

12001200

aatttgcccc tttgagtttg gagcgaggct aattctcaag cctcttagcg gttcaaaggt aatttgcccc tttgagtttg gagcgaggct aattctcaag cctcttagcg gttcaaaggt

12601260

attttctaaa cccgtttcca ggtgttgtga aagccaccgc taattcaaag caa attttctaaa cccgtttcca ggtgttgtga aagccaccgc taattcaaag caa

13131313

<210> 86<210> 86

<211> 213<211> 213

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 86<400> 86

taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta

60 60

tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag

120 120

ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt

180 180

tttaaagcaa gtaaaacctc tacaaatgtg gta tttaaagcaa gtaaaacctc tacaaatgtg gta

213 213

<210> 87<210> 87

<211> 7<211> 7

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический пептид<223> Description of artificial sequence: synthetic peptide

<400> 87<400> 87

Pro Lys Lys Lys Arg Lys ValPro Lys Lys Lys Arg Lys Val

1 515

<210> 88<210> 88

<211> 19<211> 19

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический пептид<223> Description of artificial sequence: synthetic peptide

<400> 88<400> 88

Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr GlyMet Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly

1 5 10 151 5 10 15

Ala His SerAla His Ser

<210> 89<210> 89

<211> 19<211> 19

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический пептид<223> Description of artificial sequence: synthetic peptide

<400> 89<400> 89

Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro AlaMet Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala

1 5 10 151 5 10 15

Ser Arg GlySer Arg Gly

<210> 90<210> 90

<211> 7<211> 7

<212> БЕЛОК<212> PROTEIN

<213> Обезьяний вирус 40<213> Monkey virus 40

<400> 90<400> 90

Pro Lys Lys Lys Arg Lys ValPro Lys Lys Lys Arg Lys Val

1 515

<210> 91<210> 91

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Обезьяний вирус 40<213> Monkey virus 40

<400> 91<400> 91

cccaagaaga agaggaaggt g cccaagaaga agaggaaggt g

21 21

<210> 92<210> 92

<211> 16<211> 16

<212> БЕЛОК<212> PROTEIN

<213> Неизвестное<213> Unknown

<220><220>

<223> Описание неизвестного: двухкомпонентная последовательность NLS <223> Description of unknown: two-component NLS sequence

нуклеоплазминаnucleoplasmin

<400> 92<400> 92

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys LysLys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 151 5 10 15

<210> 93<210> 93

<211> 9<211> 9

<212> БЕЛОК<212> PROTEIN

<213> Неизвестное<213> Unknown

<220><220>

<223> Описание неизвестного: последовательность NLS C-myc<223> Description of the unknown: NLS sequence C-myc

<400> 93<400> 93

Pro Ala Ala Lys Arg Val Lys Leu AspPro Ala Ala Lys Arg Val Lys Leu Asp

1 515

<210> 94<210> 94

<211> 11<211> 11

<212> БЕЛОК<212> PROTEIN

<213> Неизвестное<213> Unknown

<220><220>

<223> Описание неизвестного: последовательность NLS C-myc<223> Description of the unknown: NLS sequence C-myc

<400> 94<400> 94

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser ProArg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 101 5 10

<210> 95<210> 95

<211> 38<211> 38

<212> БЕЛОК<212> PROTEIN

<213> Homo sapiens<213> Homo sapiens

<400> 95<400> 95

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly GlyAsn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 151 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys ProArg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30 20 25 30

Arg Asn Gln Gly Gly TyrArg Asn Gln Gly Gly Tyr

35 35

<210> 96<210> 96

<211> 42<211> 42

<212> БЕЛОК<212> PROTEIN

<213> Неизвестное<213> Unknown

<220><220>

<223> Описание неизвестного: домен IBB из последовательности <223> Description of unknown: IBB domain from sequence

импортина-альфаimportin-alpha

<400> 96<400> 96

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu LeuArg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 151 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys LysArg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30 20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn ValAsp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40 35 40

<210> 97<210> 97

<211> 8<211> 8

<212> БЕЛОК<212> PROTEIN

<213> Неизвестное<213> Unknown

<220><220>

<223> Описание неизвестного: последовательность белка Т миомы<223> Description of the unknown: fibroid T protein sequence

<400> 97<400> 97

Val Ser Arg Lys Arg Pro Arg ProVal Ser Arg Lys Arg Pro Arg Pro

1 515

<210> 98<210> 98

<211> 8<211> 8

<212> БЕЛОК<212> PROTEIN

<213> Неизвестное<213> Unknown

<220><220>

<223> Описание неизвестного: последовательность белка Т миомы<223> Description of the unknown: fibroid T protein sequence

<400> 98<400> 98

Pro Pro Lys Lys Ala Arg Glu AspPro Pro Lys Lys Ala Arg Glu Asp

1 515

<210> 99<210> 99

<211> 8<211> 8

<212> БЕЛОК<212> PROTEIN

<213> Homo sapiens<213> Homo sapiens

<400> 99<400> 99

Pro Gln Pro Lys Lys Lys Pro LeuPro Gln Pro Lys Lys Lys Pro Leu

1 515

<210> 100<210> 100

<211> 12<211> 12

<212> БЕЛОК<212> PROTEIN

<213> Mus musculus<213> Mus musculus

<400> 100<400> 100

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala ProSer Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 101 5 10

<210> 101<210> 101

<211> 70<211> 70

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 101<400> 101

gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga

60 60

gcgagcgcgc gcgagcgcgc

70 70

<210> 102<210> 102

<211> 70<211> 70

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 102<400> 102

gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga

60 60

gcgagcgcgc gcgagcgcgc

70 70

<210> 103<210> 103

<211> 72<211> 72

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 103<400> 103

gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc

60 60

gagcgagcgc gc gagcgagcgc gc

72 72

<210> 104<210> 104

<211> 72<211> 72

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 104<400> 104

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc

60 60

gagcgagcgc gc gagcgagcgc gc

72 72

<210> 105<210> 105

<211> 72<211> 72

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 105<400> 105

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc

60 60

gagcgagcgc gc gagcgagcgc gc

72 72

<210> 106<210> 106

<211> 72<211> 72

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 106<400> 106

gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc

60 60

gagcgagcgc gc gagcgagcgc gc

72 72

<210> 107<210> 107

<211> 83<211> 83

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 107<400> 107

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg

60 60

cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc

83 83

<210> 108<210> 108

<211> 83<211> 83

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 108<400> 108

gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg

60 60

cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc

83 83

<210> 109<210> 109

<211> 77<211> 77

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 109<400> 109

gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag

60 60

tgagcgagcg agcgcgc tgagcgagcg agcgcgc

77 77

<210> 110<210> 110

<211> 77<211> 77

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 110<400> 110

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag

60 60

tgagcgagcg agcgcgc tgagcgagcg agcgcgc

77 77

<210> 111<210> 111

<211> 51<211> 51

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 111<400> 111

gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c

51 51

<210> 112<210> 112

<211> 51<211> 51

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 112<400> 112

gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c

51 51

<210> 113<210> 113

<211> 80<211> 80

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 113<400> 113

gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct

60 60

cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc

80 80

<210> 114<210> 114

<211> 80<211> 80

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 114<400> 114

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

60 60

cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc

80 80

<210> 115<210> 115

<211> 79<211> 79

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 115<400> 115

gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc

60 60

agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc

79 79

<210> 116<210> 116

<211> 79<211> 79

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 116<400> 116

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc

60 60

agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc

79 79

<210> 117<210> 117

<211> 5<211> 5

<212> БЕЛОК<212> PROTEIN

<213> Вирус гриппа<213> Influenza virus

<400> 117<400> 117

Asp Arg Leu Arg ArgAsp Arg Leu Arg Arg

1 515

<210> 118<210> 118

<211> 7<211> 7

<212> БЕЛОК<212> PROTEIN

<213> Вирус гриппа<213> Influenza virus

<400> 118<400> 118

Pro Lys Gln Lys Lys Arg LysPro Lys Gln Lys Lys Arg Lys

1 515

<210> 119<210> 119

<211> 10<211> 10

<212> БЕЛОК<212> PROTEIN

<213> Вирус гепатита дельта<213> Hepatitis delta virus

<400> 119<400> 119

Arg Lys Leu Lys Lys Lys Ile Lys Lys LeuArg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 101 5 10

<210> 120<210> 120

<211> 10<211> 10

<212> БЕЛОК<212> PROTEIN

<213> Mus musculus<213> Mus musculus

<400> 120<400> 120

Arg Glu Lys Lys Lys Phe Leu Lys Arg ArgArg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 101 5 10

<210> 121<210> 121

<211> 20<211> 20

<212> БЕЛОК<212> PROTEIN

<213> Homo sapiens<213> Homo sapiens

<400> 121<400> 121

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys LysLys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 151 5 10 15

Lys Ser Lys LysLys Ser Lys Lys

20 20

<210> 122<210> 122

<211> 17<211> 17

<212> БЕЛОК<212> PROTEIN

<213> Homo sapiens<213> Homo sapiens

<400> 122<400> 122

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr LysArg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 151 5 10 15

LysLys

<210> 123<210> 123

<211> 8<211> 8

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 123<400> 123

gtttaaac gtttaaac

8 8

<210> 124<210> 124

<211> 8<211> 8

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 124<400> 124

ttaattaa ttaattaa

8 8

<210> 125<210> 125

<211> 141<211> 141

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 125<400> 125

aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt

60 60

cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc

120 120

tgcggcgcgc gcagcacctt t tgcggcgcgc gcagcacctt t

141 141

<210> 126<210> 126

<211> 317<211> 317

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 126<400> 126

ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt

60 60

agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca

120 120

tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa

180 180

ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag

240 240

aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag

300 300

gcctaggctt ttgcaaa gcctaggctt ttgcaaa

317 317

<210> 127<210> 127

<211> 72<211> 72

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 127<400> 127

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc

60 60

gagcgagcgc gc gagcgagcgc gc

72 72

<210> 128<210> 128

<211> 60<211> 60

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 128<400> 128

gagacagaca cactcctgct atgggtactg ctgctctggg ttccaggttc cactggtgac gagacagaca cactcctgct atgggtactg ctgctctggg ttccaggttc cactggtgac

60 60

<210> 129<210> 129

<211> 1260<211> 1260

<212> ДНК<212> DNA

<213> Аденоассоциированный вирус - 2<213> Adeno-associated virus - 2

<400> 129<400> 129

atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag

60 60

gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag

120 120

gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg

180 180

gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta

240 240

aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc

300 300

ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg

360 360

gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt

420 420

cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc

480 480

aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa

540 540

tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg

600 600

tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg

660 660

atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag

720 720

gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc

780 780

tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag

840 840

cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc

900 900

aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg

960 960

tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga

10201020

cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa

10801080

aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc

11401140

actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgatt actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgatt

12001200

taaatcaggt atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga taaatcaggt atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga

12601260

<210> 130<210> 130

<211> 1932<211> 1932

<212> ДНК<212> DNA

<213> Аденоассоциированный вирус - 2<213> Adeno-associated virus - 2

<400> 130<400> 130

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc

60 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat

120 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag

180 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg

240 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg

300 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt

360 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc

420 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa

480 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg

540 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag

600 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact

660 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag

720 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg

780 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc

840 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg gatttataaa

900 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc

960 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag

10201020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc

10801080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg

11401140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc

12001200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc

12601260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg

13201320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag

13801380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg

14401440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca

15001500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg

15601560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg

16201620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc

16801680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt

17401740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg

18001800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa

18601860

caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga

19201920

cactctctct ga cactctctct ga

19321932

<210> 131<210> 131

<211> 1876<211> 1876

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 131<400> 131

cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg

60 60

gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt

120 120

gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga

180 180

gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct

240 240

tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac

300 300

caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat

360 360

tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac

420 420

cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt

480 480

gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag

540 540

cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc

600 600

gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag

660 660

atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac

720 720

ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc

780 780

caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac

840 840

taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg

900 900

gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct

960 960

gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac

10201020

taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt

10801080

aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg

11401140

ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag

12001200

caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat

12601260

cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca

13201320

ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga

13801380

ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt

14401440

ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc

15001500

cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac

15601560

gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca

16201620

cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc

16801680

aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc

17401740

tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat

18001800

gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg gggaaaggtg cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg

18601860

catctttgaa caataa catctttgaa caataa

18761876

<210> 132<210> 132

<211> 1194<211> 1194

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 132<400> 132

atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag

60 60

gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag

120 120

gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg

180 180

gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta

240 240

aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc

300 300

ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg

360 360

gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt

420 420

cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc

480 480

aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa

540 540

tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg

600 600

tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg

660 660

atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag

720 720

gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc

780 780

tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag

840 840

cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc

900 900

aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg

960 960

tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga

10201020

cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa

10801080

aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc

11401140

actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa

11941194

<210> 133<210> 133

<211> 1876<211> 1876

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 133<400> 133

cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg

60 60

gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt

120 120

gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga

180 180

gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct

240 240

tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac

300 300

caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat

360 360

tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac

420 420

cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt

480 480

gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag

540 540

cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc

600 600

gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag

660 660

atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac

720 720

ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc

780 780

caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac

840 840

taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg

900 900

gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct

960 960

gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac

10201020

taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt

10801080

aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg

11401140

ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag

12001200

caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat

12601260

cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca

13201320

ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga

13801380

ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt

14401440

ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc

15001500

cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac

15601560

gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca

16201620

cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc

16801680

aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc

17401740

tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat

18001800

gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg gggaaaggtg cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg

18601860

catctttgaa caataa catctttgaa caataa

18761876

<210> 134<210> 134

<211> 51<211> 51

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 134<400> 134

ctaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg c ctaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg c

51 51

<210> 135<210> 135

<211> 65<211> 65

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 135<400> 135

ctaggactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct ctaggactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct

60 60

cagtc cagtc

65 65

<210> 136<210> 136

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 136<400> 136

ggactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag ggactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag

60 60

tcctgca tcctgca

67 67

<210> 137<210> 137

<211> 41<211> 41

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 137<400> 137

gtgcgggcga ccaaaggtcg cccgacgccc gggcgcactc a gtgcgggcga ccaaaggtcg cccgacgccc gggcgcactc a

41 41

<210> 138<210> 138

<211> 56<211> 56

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 138<400> 138

ggactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt cctgca ggactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt cctgca

56 56

<210> 139<210> 139

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 139<400> 139

ctaggactga ggccgcccgg gcgtcgggcg acctttggtc gcccggcctc agtc ctaggactga ggccgcccgg gcgtcgggcg acctttggtc gcccggcctc agtc

54 54

<210> 140<210> 140

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 140<400> 140

ggactgaggc cgggcgacca aaggtcgccc gacggcctca gtcctgca ggactgaggc cgggcgacca aaggtcgccc gacggcctca gtcctgca

48 48

<210> 141<210> 141

<211> 46<211> 46

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 141<400> 141

ctaggactga ggccgtcggg cgacctttgg tcgcccggcc tcagtc ctaggactga ggccgtcggg cgacctttgg tcgcccggcc tcagtc

46 46

<210> 142<210> 142

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 142<400> 142

ggactgaggc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcgcctcag ggactgaggc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcgcctcag

60 60

tcctgca tcctgca

67 67

<210> 143<210> 143

<211> 47<211> 47

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 143<400> 143

atacctaggc acgcgtgtta ctagttatta atagtaatca attacgg atacctaggc acgcgtgtta ctagttatta atagtaatca attacgg

47 47

<210> 144<210> 144

<211> 29<211> 29

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 144<400> 144

atacctaggg gccgcacgcg tgttactag atacctaggg gccgcacgcg tgttactag

29 29

<210> 145<210> 145

<211> 42<211> 42

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 145<400> 145

atacactcag tgcctgcagg cacgtggtcc ggagatccag ac atacactcag tgcctgcagg cacgtggtcc ggagatccag ac

42 42

<210> 146<210> 146

<211> 3754<211> 3754

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 146<400> 146

cctaggtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct cctaggtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct

60 60

tgtagttaat gattaacccg ccatgctact tatcgcggcc gctcaatatt ggccattagc tgtagttaat gattaacccg ccatgctact tatcgcggcc gctcaatatt ggccattagc

120 120

catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt

180 180

gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg

240 240

gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc

300 300

atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa

360 360

cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac

420 420

tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca

480 480

agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg

540 540

gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt

600 600

agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc

660 660

ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat

720 720

gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg

780 780

cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc

840 840

ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg

900 900

agtcgctgcg acgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc agtcgctgcg acgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc

960 960

cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc

10201020

cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa

10801080

gccttgaggg gctccgggag ggccctttgt gcggggggga gcggctcggg gggtgcgtgc gccttgaggg gctccgggag ggccctttgt gcggggggga gcggctcggg gggtgcgtgc

11401140

gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct

12001200

gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg

12601260

gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt

13201320

gcgtgggggg gtgagcaggg ggtgtgggcg cggcggtcgg gctgtaaccc ccccctgcac gcgtgggggg gtgagcaggg ggtgtgggcg cggcggtcgg gctgtaaccc ccccctgcac

13801380

ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt

14401440

ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg

15001500

gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc

15601560

ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagaggcg

16201620

cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc

16801680

ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag

17401740

ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg

18001800

cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg

18601860

accggcggct ctagagcctc tgctaaccat gttttagcct tcttcttttt cctacagctc accggcggct ctagagcctc tgctaaccat gttttagcct tcttcttttt cctacagctc

19201920

ctgggcaacg tgctggttat tgtgctgtct catcatttgt cgacagaatt cctcgaagat ctgggcaacg tgctggttat tgtgctgtct catcatttgt cgacagaatt cctcgaagat

19801980

ccgaaggggt tcaagcttgg cattccggta ctgttggtaa agccagttta aacgccgcca ccgaaggggt tcaagcttgg cattccggta ctgttggtaa agccagttta aacgccgcca

20402040

ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg

21002100

acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct

21602160

acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca

22202220

ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga

22802280

agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct

23402340

tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc

24002400

tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc

24602460

acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga

25202520

acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg

25802580

ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc

26402640

actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg

27002700

tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt

27602760

aattaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt aattaattaa gagcatctta ccgccatta ttcccatatt tgttctgttt ttcttgattt

28202820

gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg

28802880

atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg

29402940

ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac

30003000

tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct

30603060

gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt

31203120

gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt

31803180

gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg

32403240

gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg

33003300

ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt ctgtgccttc ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt ctgtgccttc

33603360

tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc

34203420

cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg

34803480

tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa

35403540

tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct acgtagataa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct acgtagataa

36003600

gtagcatggc gggttaatca ttaactacac ctgcagcagg aacccctagt gatggagttg gtagcatggc gggttaatca ttaactacac ctgcagcagg aacccctagt gatggagttg

36603660

gccactccct ctctgcgcgc tcgctcgctc cctgcaggac tgaggccggg cgaccaaagg gccactccct ctctgcgcgc tcgctcgctc cctgcaggac tgaggccggg cgaccaaagg

37203720

tcgcccgacg cccgggcggc ctcagtcctg cagg tcgcccgacg cccgggcggc ctcagtcctg cagg

37543754

<210> 147<210> 147

<211> 8418<211> 8418

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 147<400> 147

ggcagctgcg cgctcgctcg ctcacctagg ccgcccgggc aaagcccggg cgtcgggcga ggcagctgcg cgctcgctcg ctcacctagg ccgcccgggc aaagcccggg cgtcgggcga

60 60

cctttggtcg cccggcctag gtgagcgagc gagcgcgcag agagggagtg gccaactcca cctttggtcg cccggcctag gtgagcgagc gagcgcgcag agagggagtg gccaactcca

120 120

tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatcg cggccgctca tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatcg cggccgctca

180 180

atattggcca ttagccatat tattcattgg ttatatagca taaatcaata ttggctattg atattggcca ttagccatat tattcattgg ttatatagca taaatcaata ttggctattg

240 240

gccattgcat acgttgtatc tatatcataa tatgtacatt tatattggct catgtccaat gccattgcat acgttgtatc tatatcataa tatgtacatt tatattggct catgtccaat

300 300

atgaccgcca tgttggcatt gattattgac tagttattaa tagtaatcaa ttacggggtc atgaccgcca tgttggcatt gattattgac tagttattaa tagtaatcaa ttacggggtc

360 360

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc

420 420

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt

480 480

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca

540 540

cttggcagta catcaagtgt atcatatgcc aagtccgccc cctattgacg tcaatgacgg cttggcagta catcaagtgt atcatatgcc aagtccgccc cctattgacg tcaatgacgg

600 600

taaatggccc gcctggcatt atgcccagta catgacctta cgggactttc ctacttggca taaatggccc gcctggcatt atgcccagta catgacctta cgggactttc ctacttggca

660 660

gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt

720 720

cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt

780 780

attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg

840 840

gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc

900 900

gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag

960 960

cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc tccgccgccg cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc tccgccgccg

10201020

cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg

10801080

acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc

11401140

tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg ggggagcggc tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg ggggagcggc

12001200

tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggccc gcgctgcccg tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggccc gcgctgcccg

12601260

gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg

13201320

ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct

13801380

gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt

14401440

aacccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg aacccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg

15001500

ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg

15601560

gtgccgggcg gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc gtgccgggcg gggcggggcc gcctcggggcc ggggagggct cgggggaggg gcgcggcggc

16201620

ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa

16801680

tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg

17401740

aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag

18001800

gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag

18601860

cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc

19201920

ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgtttt agccttcttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgtttt agccttcttc

19801980

tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca tttgtcgaca tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca tttgtcgaca

20402040

gaattcctcg aagatccgaa ggggttcaag cttggcattc cggtactgtt ggtaaagcca gaattcctcg aagatccgaa ggggttcaag cttggcattc cggtactgtt ggtaaagcca

21002100

gtttaaacgc cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca gtttaaacgc cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca

21602160

tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgaggcg

22202220

agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc

22802280

ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct

23402340

accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc

24002400

aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt

24602460

tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg

25202520

gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg

25802580

ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg

26402640

gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc

27002700

tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga

27602760

agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg

28202820

acgagctgta caagtaatta attaagagca tcttaccgcc atttattccc atatttgttc acgagctgta caagtaatta attaagagca tcttaccgcc atttattccc atatttgttc

28802880

tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca

29402940

tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt

30003000

taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat

30603060

ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc

31203120

tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt

31803180

gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg

32403240

cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg

33003300

tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc

33603360

cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt

34203420

gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt

34803480

gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca

35403540

ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga

36003600

ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca

36603660

tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca gcaggaaccc tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca gcaggaaccc

37203720

ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctccctgc aggactgagg ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctccctgc aggactgagg

37803780

ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tcctgcaggg agcgagcgag ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tcctgcaggg agcgagcgag

38403840

cgcgcagctg cctgcacggg cgcgccggta ccgggagatg ggggaggcta actgaaacac cgcgcagctg cctgcacggg cgcgccggta ccgggagatg ggggaggcta actgaaacac

39003900

ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa ggaagggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa

39603960

cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct

40204020

gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca

40804080

ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc

41404140

cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg

42004200

cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca

42604260

gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat

43204320

ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg

43804380

agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc

44404440

ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat

45004500

aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca

45604560

gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg

46204620

actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg

46804680

gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag

47404740

cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt

48004800

aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag

48604860

ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg

49204920

ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct

49804980

ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat

50405040

ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc

51005100

aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac

51605160

gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat

52205220

atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg

52805280

gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac

53405340

gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca

54005400

taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat

54605460

tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt

55205520

tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt

55805580

ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa

56405640

taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg

57005700

ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg

57605760

gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag

58205820

gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga

58805880

cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct

59405940

ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc

60006000

tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg

60606060

gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc

61206120

tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca

61806180

ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag

62406240

ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct

63006300

ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc

63606360

accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga

64206420

tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca

64806480

cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat

65406540

taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac

66006600

caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt

66606660

gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt

67206720

gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag

67806780

ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct

68406840

attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt

69006900

gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc

69606960

tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt

70207020

agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg

70807080

gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg

71407140

actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct

72007200

tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc

72607260

attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt

73207320

tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt

73807380

tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg

74407440

aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat

75007500

tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg

75607560

cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc

76207620

gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc

76807680

ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag

77407740

agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc

78007800

gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa

78607860

gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg

79207920

aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt

79807980

gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacaggc

80408040

gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt

81008100

aataacgaag agatgacaga aaaattttca ttctgtgaca gagaaaaagt agccgaagat aataacgaag agatgacaga aaaattttca ttctgtgaca gagaaaaagt agccgaagat

81608160

gacggtttgt cacatggagt tggcaggatg tttgattaaa aacataacag gaagaaaaat gacggtttgt cacatggagt tggcaggatg tttgattaaa aacataacag gaagaaaaat

82208220

gccccgctgt gggcggacaa aatagttggg aactgggagg ggtggaaatg gagtttttaa gccccgctgt gggcggacaa aatagttggg aactgggagg ggtggaaatg gagtttttaa

82808280

ggattattta gggaagagtg acaaaataga tgggaactgg gtgtagcgtc gtaagctaat ggattattta gggaagagtg acaaaataga tgggaactgg gtgtagcgtc gtaagctaat

83408340

acgaaaatta aaaatgacaa aatagtttgg aactagattt cacttatctg gttcggatct acgaaaatta aaaatgacaa aatagtttgg aactagatt cacttatctg gttcggatct

84008400

cctagtgagc tccctgca cctagtgagc tccctgca

84188418

<210> 148<210> 148

<211> 225<211> 225

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 148<400> 148

tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct

60 60

ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct

120 120

gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg

180 180

ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc

225 225

<210> 149<210> 149

<211> 1177<211> 1177

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 149<400> 149

ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc

60 60

tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac

120 120

ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac

180 180

agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca

240 240

tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc

300 300

ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag

360 360

tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa

420 420

tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt

480 480

tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga

540 540

cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca

600 600

agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt

660 660

tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta

720 720

attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt

780 780

accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagaggcca

840 840

gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca

900 900

ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg

960 960

tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg

10201020

gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca

10801080

gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc

11401140

tcctcagctt caggcaccac cactgacctg ggacagt tcctcagctt caggcaccac cactgacctg ggacagt

11771177

<210> 150<210> 150

<211> 1326<211> 1326

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 150<400> 150

ctgcagggcc cactagtgga gccgagagta attcatacaa aaggagggat cgccttcgca ctgcagggcc cactagtgga gccgagagta attcatacaa aaggagggat cgccttcgca

60 60

aggggagagc ccagggaccg tccctaaatt ctcacagacc caaatccctg tagccgcccc aggggagagc cccaggaccg tccctaaatt ctcacagacc caaatccctg tagccgcccc

120 120

acgacagcgc gaggagcatg cgcccagggc tgagcgcggg tagatcagag cacacaagct acgacagcgc gaggagcatg cgcccagggc tgagcgcggg tagatcagag cacacaagct

180 180

cacagtcccc ggcggtgggg ggaggggcgc gctgagcggg ggccagggag ctggcgcggg cacagtcccc ggcggtgggg ggaggggcgc gctgagcggg ggccagggag ctggcgcggg

240 240

gcaaactggg aaagtggtgt cgtgtgctgg ctccgccctc ttcccgaggg tgggggagaa gcaaactggg aaagtggtgt cgtgtgctgg ctccgccctc ttcccgaggg tggggggagaa

300 300

cggtatataa gtgcggtagt cgccttggac gttctttttc gcaacgggtt tgccgtcaga cggtatataa gtgcggtagt cgccttggac gttctttttc gcaacgggtt tgccgtcaga

360 360

acgcaggtga gtggcgggtg tggcttccgc gggccccgga gctggagccc tgctctgagc acgcaggtga gtggcgggtg tggcttccgc gggccccgga gctggagccc tgctctgagc

420 420

gggccgggct gatatgcgag tgtcgtccgc agggtttagc tgtgagcatt cccacttcga gggccgggct gatatgcgag tgtcgtccgc agggtttagc tgtgagcatt cccacttcga

480 480

gtggcgggcg gtgcgggggt gagagtgcga ggcctagcgg caaccccgta gcctcgcctc gtggcgggcg gtgcgggggt gagagtgcga ggcctagcgg caaccccgta gcctcgcctc

540 540

gtgtccggct tgaggcctag cgtggtgtcc gccgccgcgt gccactccgg ccgcactatg gtgtccggct tgaggcctag cgtggtgtcc gccgccgcgt gccactccgg ccgcactatg

600 600

cgttttttgt ccttgctgcc ctcgattgcc ttccagcagc atgggctaac aaagggaggg cgttttttgt ccttgctgcc ctcgattgcc ttccagcagc atgggctaac aaagggaggg

660 660

tgtggggctc actcttaagg agcccatgaa gcttacgttg gataggaatg gaagggcagg tgtggggctc actcttaagg agcccatgaa gcttacgttg gataggaatg gaagggcagg

720 720

aggggcgact ggggcccgcc cgccttcgga gcacatgtcc gacgccacct ggatggggcg aggggcgact ggggcccgcc cgccttcgga gcacatgtcc gacgccacct ggatggggcg

780 780

aggcctgtgg ctttccgaag caatcgggcg tgagtttagc ctacctgggc catgtggccc aggcctgtgg ctttccgaag caatcgggcg tgagtttagc ctacctgggc catgtggccc

840 840

tagcactggg cacggtctgg cctggcggtg ccgcgttccc ttgcctccca acaagggtga tagcactggg cacggtctgg cctggcggtg ccgcgttccc ttgcctccca acaagggtga

900 900

ggccgtcccg cccggcacca gttgcttgcg cggaaagatg gccgctcccg gggccctgtt ggccgtcccg cccggcacca gttgcttgcg cggaaagatg gccgctcccg gggccctgtt

960 960

gcaaggagct caaaatggag gacgcggcag cccggtggag cgggcgggtg agtcacccac gcaaggagct caaaatggag gacgcggcag cccggtggag cgggcgggtg agtcaccac

10201020

acaaaggaag agggccttgc ccctcgccgg ccgctgcttc ctgtgacccc gtggtctatc acaaaggaag agggccttgc ccctcgccgg ccgctgcttc ctgtgacccc gtggtctatc

10801080

ggccgcatag tcacctcggg cttctcttga gcaccgctcg tcgcggcggg gggaggggat ggccgcatag tcacctcggg cttctcttga gcaccgctcg tcgcggcggg gggaggggat

11401140

ctaatggcgt tggagtttgt tcacatttgg tgggtggaga ctagtcaggc cagcctggcg ctaatggcgt tggagtttgt tcacatttgg tgggtggaga ctagtcaggc cagcctggcg

12001200

ctggaagtca ttcttggaat ttgccccttt gagtttggag cgaggctaat tctcaagcct ctggaagtca ttcttggaat ttgccccttt gagtttggag cgaggctaat tctcaagcct

12601260

cttagcggtt caaaggtatt ttctaaaccc gtttccaggt gttgtgaaag ccaccgctaa cttagcggtt caaaggtatt ttctaaaccc gtttccaggt gttgtgaaag ccaccgctaa

13201320

ttcaaa ttcaaa

13261326

<210> 151<210> 151

<211> 573<211> 573

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 151<400> 151

gtaagagttt tatgtttttt catctctgct tgtatttttc tagtaatgga agcctggtat gtaagagttt tatgtttttt catctctgct tgtatttttc tagtaatgga agcctggtat

60 60

tttaaaatag ttaaattttc ctttagtgct gatttctaga ttattattac tgttgttgtt tttaaaatag ttaaattttc ctttagtgct gatttctaga ttattattac tgttgttgtt

120 120

gttattattg tcattatttg catctgagaa cccttaggtg gttatattat tgatatattt gttattattg tcattatttg catctgagaa cccttaggtg gttatattat tgatatattt

180 180

ttggtatctt tgatgacaat aatgggggat tttgaaagct tagctttaaa tttcttttaa ttggtatctt tgatgacaat aatgggggat tttgaaagct tagctttaaa tttcttttaa

240 240

ttaaaaaaaa atgctaggca gaatgactca aattacgttg gatacagttg aatttattac ttaaaaaaaa atgctaggca gaatgactca aattacgttg gatacagttg aatttattac

300 300

ggtctcatag ggcctgcctg ctcgaccatg ctatactaaa aattaaaagt gtgtgttact ggtctcatag ggcctgcctg ctcgaccatg ctatactaaa aattaaaagt gtgtgttact

360 360

aattttataa atggagtttc catttatatt tacctttatt tcttatttac cattgtctta aattttataa atggagtttc catttatatt tacctttatt tcttatttac cattgtctta

420 420

gtagatattt acaaacatga cagaaacact aaatcttgag tttgaatgca cagatataaa gtagatattt acaaacatga cagaaacact aaatcttgag tttgaatgca cagatataaa

480 480

cacttaacgg gttttaaaaa taataatgtt ggtgaaaaaa tataactttg agtgtagcag cacttaacgg gttttaaaaa taataatgtt ggtgaaaaaa tataactttg agtgtagcag

540 540

agaggaacca ttgccacctt cagattttcc tgt agaggaacca ttgccacctt cagattttcc tgt

573 573

<210> 152<210> 152

<211> 1993<211> 1993

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 152<400> 152

acgatcggga actggcatct tcagggagta gcttaggtca gtgaagagaa gaacaaaaag acgatcggga actggcatct tcagggagta gcttaggtca gtgaagagaa gaacaaaaag

60 60

cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc

120 120

cctgtttcca cagacaagag tgagatcgcc catcggtata atgatttggg agaacaacat cctgtttcca cagacaagag tgagatcgcc catcggtata atgatttggg agaacaacat

180 180

ttcaaaggcc tgtaagttat aatgctgaaa gcccacttaa tatttctggt agtattagtt ttcaaaggcc tgtaagttat aatgctgaaa gcccacttaa tatttctggt agtattagtt

240 240

aaagttttaa aacacctttt tccaccttga gtgtgagaat tgtagagcag tgctgtccag aaagttttaa aacacctttt tccaccttga gtgtgagaat tgtagagcag tgctgtccag

300 300

tagaaatgtg tgcattgaca gaaagactgt ggatctgtgc tgagcaatgt ggcagccaga tagaaatgtg tgcattgaca gaaagactgt ggatctgtgc tgagcaatgt ggcagccaga

360 360

gatcacaagg ctatcaagca ctttgcacat ggcaagtgta actgagaagc acacattcaa gatcacaagg ctatcaagca ctttgcacat ggcaagtgta actgagaagc acacattcaa

420 420

ataatagtta attttaattg aatgtatcta gccatgtgtg gctagtagct cctttcctgg ataatagtta attttaattg aatgtatcta gccatgtgtg gctagtagct cctttcctgg

480 480

agagagaatc tggagcccac atctaacttg ttaagtctgg aatcttattt tttatttctg agagagaatc tggagcccac atctaacttg ttaagtctgg aatcttattt tttatttctg

540 540

gaaaggtcta tgaactatag ttttgggggc agctcactta ctaactttta atgcaataag gaaaggtcta tgaactatag ttttgggggc agctcactta ctaactttta atgcaataag

600 600

atctcatggt atcttgagaa cattattttg tctctttgta gtactgaaac cttatacatg atctcatggt atcttgagaa cattattttg tctctttgta gtactgaaac cttatacatg

660 660

tgaagtaagg ggtctatact taagtcacat ctccaacctt agtaatgttt taatgtagta tgaagtaagg ggtctatact taagtcacat ctccaacctt agtaatgttt taatgtagta

720 720

aaaaaatgag taattaattt atttttagaa ggtcaatagt atcatgtatt ccaaataaca aaaaaatgag taattaattt atttttagaa ggtcaatagt atcatgtatt ccaaataaca

780 780

gaggtatatg gttagaaaag aaacaattca aaggacttat ataatatcta gccttgacaa gaggtatatg gttagaaaag aaacaattca aaggacttat ataatatcta gccttgacaa

840 840

tgaataaatt tagagagtag tttgcctgtt tgcctcatgt tcataaatct attgacacat tgaataaatt tagagagtag tttgcctgtt tgcctcatgt tcataaatct attgacacat

900 900

atgtgcatct gcacttcagc atggtagaag tccatattcc tttgcttgga aaggcaggtg atgtgcatct gcacttcagc atggtagaag tccatattcc tttgcttgga aaggcaggtg

960 960

ttcccattac gcctcagaga atagctgacg ggaagaggct ttctagatag ttgtatgaaa ttcccattac gcctcagaga atagctgacg ggaagaggct ttctagatag ttgtatgaaa

10201020

gatatacaaa atctcgcagg tatacacagg catgatttgc tggttgggag agccacttgc gatatacaaa atctcgcagg tatacacagg catgatttgc tggttgggag agccacttgc

10801080

ctcatactga ggtttttgtg tctgcttttc agagtcctga ttgccttttc ccagtatctc ctcatactga ggtttttgtg tctgcttttc agagtcctga ttgccttttc ccagtatctc

11401140

cagaaatgct catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag cagaaatgct catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag

12001200

acgtgtgttg ccgatgagtc tgccgccaac tgtgacaaat cccttgtgag taccttctga acgtgtgttg ccgatgagtc tgccgccaac tgtgacaaat cccttgtgag taccttctga

12601260

ttttgtggat ctactttcct gctttctgga actctgtttc aaagccaatc atgactccat ttttgtggat ctactttcct gctttctgga actctgtttc aaagccaatc atgactccat

13201320

cacttaaggc cccgggaaca ctgtggcaga gggcagcaga gagattgata aagccagggt cacttaaggc cccgggaaca ctgtggcaga gggcagcaga gagattgata aagccaggt

13801380

gatgggaatt ttctgtggga ctccatttca tagtaattgc agaagctaca atacactcaa gatgggaatt ttctgtggga ctccatttca tagtaattgc agaagctaca atacactcaa

14401440

aaagtctcac cacatgactg cccaaatggg agcttgacag tgacagtgac agtagatatg aaagtctcac cacatgactg cccaaatggg agcttgacag tgacagtgac agtagatatg

15001500

ccaaagtgga tgagggaaag accacaagag ctaaaccctg taaaaagaac tgtaggcaac ccaaagtgga tgagggaaag accacaagag ctaaaccctg taaaaagaac tgtaggcaac

15601560

taaggaatgc agagagaaga agttgccttg gaagagcata ccaactgcct ctccaatacc taaggaatgc agagagaaga agttgccttg gaagagcata ccaactgcct ctccaatacc

16201620

aatggtcatc cctaaaacat acgtatgaat aacatgcaga ctaagcaggc tacatttagg aatggtcatc cctaaaacat acgtatgaat aacatgcaga ctaagcaggc tacatttagg

16801680

aatatacatg tatttacata aatgtatatg catgtaacaa caatgaatga aaactgaggt aatatacatg tatttacata aatgtatatg catgtaacaa caatgaatga aaactgaggt

17401740

catggatctg aaagagagca agggggctta catgagaggg tttggaggga ggggttggag catggatctg aaagagagca agggggctta catgagagg tttggaggga ggggttggag

18001800

ggagggaggt attattcttt agttttacag ggaacgtagt aaaaacatag gcttctccca ggagggaggt attattcttt agttttacag ggaacgtagt aaaaacatag gcttctccca

18601860

aaggagcaga gcccatgagg agctgtgcaa ggttccccag cttgatttta cctgctcctc aaggagcaga gcccatgagg agctgtgcaa ggttccccag cttgatttta cctgctcctc

19201920

aaattccctt gatttgtttt tattataatg actttactcc tagcttttag tgtcagatag aaattccctt gatttgtttt tattataatg actttactcc tagcttttag tgtcagatag

19801980

aaaacatgga agg aaaacatgga agg

19931993

<210> 153<210> 153

<211> 1350<211> 1350

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 153<400> 153

taggaggctg aggcaggagg atcgcttgag cccaggagtt cgagaccagc ctgggcaaca taggaggctg aggcaggagg atcgcttgag cccaggagtt cgagaccagc ctgggcaaca

60 60

tagtgtgatc ttgtatctat aaaaataaac aaaattagct tggtgtggtg gcgcctgtag tagtgtgatc ttgtatctat aaaaataaac aaaattagct tggtgtggtg gcgcctgtag

120 120

tccccagcca cttggagggg tgaggtgaga ggattgcttg agcccgggat ggtccaggct tccccagcca cttggagggg tgaggtgaga ggattgcttg agcccgggat ggtccaggct

180 180

gcagtgagcc atgatcgtgc cactgcactc cagcctgggc gacagagtga gaccctgtct gcagtgagcc atgatcgtgc cactgcactc cagcctgggc gacagagtga gaccctgtct

240 240

cacaacaaca acaacaacaa caaaaaggct gagctgcacc atgcttgacc cagtttctta cacaacaaca acaacaacaa caaaaaggct gagctgcacc atgcttgacc cagtttctta

300 300

aaattgttgt caaagcttca ttcactccat ggtgctatag agcacaagat tttatttggt aaattgttgt caaagcttca ttcactccat ggtgctatag agcacaagat tttatttggt

360 360

gagatggtgc tttcatgaat tcccccaaca gagccaagct ctccatctag tggacaggga gagatggtgc tttcatgaat tcccccaaca gagccaagct ctccatctag tggacaggga

420 420

agctagcagc aaaccttccc ttcactacaa aacttcattg cttggccaaa aagagagtta agctagcagc aaaccttccc ttcactacaa aacttcattg cttggccaaa aagagagtta

480 480

attcaatgta gacatctatg taggcaatta aaaacctatt gatgtataaa acagtttgca attcaatgta gacatctatg taggcaatta aaaacctatt gatgtataaa acagtttgca

540 540

ttcatggagg gcaactaaat acattctagg actttataaa agatcacttt ttatttatgc ttcatggagg gcaactaaat acattctagg actttataaa agatcacttt ttatttatgc

600 600

acagggtgga acaagatgga ttatcaagtg tcaagtccaa tctatgacat caattattat acagggtgga acaagatgga ttatcaagtg tcaagtccaa tctatgacat caattattat

660 660

acatcggagc cctgccaaaa aatcaatgtg aagcaaatcg cagcccgcct cctgcctccg acatcggagc cctgccaaaa aatcaatgtg aagcaaatcg cagcccgcct cctgcctccg

720 720

ctctactcac tggtgttcat ctttggtttt gtgggcaaca tgctggtcat cctcatcctg ctctactcac tggtgttcat ctttggtttt gtgggcaaca tgctggtcat cctcatcctg

780 780

ataaactgca aaaggctgaa gagcatgact gacatctacc tgctcaacct ggccatctct ataaactgca aaaggctgaa gagcatgact gacatctacc tgctcaacct ggccatctct

840 840

gacctgtttt tccttcttac tgtccccttc tgggctcact atgctgccgc ccagtgggac gacctgtttt tccttcttac tgtccccttc tgggctcact atgctgccgc ccagtgggac

900 900

tttggaaata caatgtgtca actcttgaca gggctctatt ttataggctt cttctctgga tttggaaata caatgtgtca actcttgaca gggctctatt ttataggctt cttctctgga

960 960

atcttcttca tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctgtgttt atcttcttca tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctgtgttt

10201020

gctttaaaag ccaggacggt cacctttggg gtggtgacaa gtgtgatcac ttgggtggtg gctttaaaag ccaggacggt cacctttggg gtggtgacaa gtgtgatcac ttgggtggtg

10801080

gctgtgtttg cgtctctccc aggaatcatc tttaccagat ctcaaaaaga aggtcttcat gctgtgtttg cgtctctccc aggaatcatc tttaccagat ctcaaaaaga aggtcttcat

11401140

tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca

12001200

ttaaagatag tcatcttggg gctggtcctg ccgctgcttg tcatggtcat ctgctactcg ttaaagatag tcatcttggg gctggtcctg ccgctgcttg tcatggtcat ctgctactcg

12601260

ggaatcctaa aaactctgct tcggtgtcga aatgagaaga agaggcacag ggctgtgagg ggaatcctaa aaactctgct tcggtgtcga aatgagaaga agaggcacag ggctgtgagg

13201320

cttatcttca ccatcatgat tgtttatttt cttatcttca ccatcatgat tgtttatttt

13501350

<210> 154<210> 154

<211> 1223<211> 1223

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 154<400> 154

tgacagagac tcttgggatg acgcactgct gcatcaaccc catcatctat gcctttgtcg tgacagagac tcttgggatg acgcactgct gcatcaaccc catcatctat gcctttgtcg

60 60

gggagaagtt cagaaactac ctcttagtct tcttccaaaa gcacattgcc aaacgcttct gggagaagtt cagaaactac ctcttagtct tcttccaaaa gcacattgcc aaacgcttct

120 120

gcaaatgctg ttctattttc cagcaagagg ctcccgagcg agcaagctca gtttacaccc gcaaatgctg ttctattttc cagcaagagg ctcccgagcg agcaagctca gtttacaccc

180 180

gatccactgg ggagcaggaa atatctgtgg gcttgtgaca cggactcaag tgggctggtg gatccactgg ggagcaggaa atatctgtgg gcttgtgaca cggactcaag tgggctggtg

240 240

acccagtcag agttgtgcac atggcttagt tttcatacac agcctgggct gggggtgggg acccagtcag agttgtgcac atggcttagt tttcatacac agcctgggct gggggtgggg

300 300

tgggagaggt cttttttaaa aggaagttac tgttatagag ggtctaagat tcatccattt tggggagaggt cttttttaaa aggaagttac tgttatagag ggtctaagat tcatccatt

360 360

atttggcatc tgtttaaagt agattagatc ttttaagccc atcaattata gaaagccaaa atttggcatc tgtttaaagt agattagatc ttttaagccc atcaattata gaaagccaaa

420 420

tcaaaatatg ttgatgaaaa atagcaacct ttttatctcc ccttcacatg catcaagtta tcaaaatatg ttgatgaaaa atagcaacct ttttatctcc ccttcacatg catcaagtta

480 480

ttgacaaact ctcccttcac tccgaaagtt ccttatgtat atttaaaaga aagcctcaga ttgacaaact ctcccttcac tccgaaagtt ccttatgtat atttaaaaga aagcctcaga

540 540

gaattgctga ttcttgagtt tagtgatctg aacagaaata ccaaaattat ttcagaaatg gaattgctga ttcttgagtt tagtgatctg aacagaaata ccaaaattat ttcagaaatg

600 600

tacaactttt tacctagtac aaggcaacat ataggttgta aatgtgttta aaacaggtct tacaactttt tacctagtac aaggcaacat ataggttgta aatgtgttta aaacaggtct

660 660

ttgtcttgct atggggagaa aagacatgaa tatgattagt aaagaaatga cacttttcat ttgtcttgct atggggagaa aagacatgaa tatgattagt aaagaaatga cacttttcat

720 720

gtgtgatttc ccctccaagg tatggttaat aagtttcact gacttagaac caggcgagag gtgtgatttc ccctccaagg tatggttaat aagtttcact gacttagaac caggcgagag

780 780

acttgtggcc tgggagagct ggggaagctt cttaaatgag aaggaatttg agttggatca acttgtggcc tgggagagct ggggaagctt cttaaatgag aaggaatttg agttggatca

840 840

tctattgctg gcaaagacag aagcctcact gcaagcactg catgggcaag cttggctgta tctattgctg gcaaagacag aagcctcact gcaagcactg catgggcaag cttggctgta

900 900

gaaggagaca gagctggttg ggaagacatg gggaggaagg acaaggctag atcatgaaga gaaggagaca gagctggttg ggaagacatg gggaggaagg acaaggctag atcatgaaga

960 960

accttgacgg cattgctccg tctaagtcat gagctgagca gggagatcct ggttggtgtt accttgacgg cattgctccg tctaagtcat gagctgagca ggggagatcct ggttggtgtt

10201020

gcagaaggtt tactctgtgg ccaaaggagg gtcaggaagg atgagcattt agggcaagga gcagaaggtt tactctgtgg ccaaaggagg gtcaggaagg atgagcattt agggcaagga

10801080

gaccaccaac agccctcagg tcagggtgag gatggcctct gctaagctca aggcgtgagg gaccaccaac agccctcagg tcagggtgag gatggcctct gctaagctca aggcgtgagg

11401140

atgggaagga gggaggtatt cgtaaggatg ggaaggaggg aggtattcgt gcagcatatg atgggaagga gggaggtatt cgtaaggatg ggaaggaggg aggtattcgt gcagcatatg

12001200

aggatgcaga gtcagcagaa ctg aggatgcaga gtcagcagaa ctg

12231223

<210> 155<210> 155

<211> 215<211> 215

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 155<400> 155

gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa

60 60

cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc

120 120

tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg

180 180

gatttgggaa tcttataagt tctgtatgag accac gatttgggaa tcttataagt tctgtatgag accac

215 215

<210> 156<210> 156

<211> 141<211> 141

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 156<400> 156

cctgcaggca gctgcgcgct cgctcgctca cctaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca cctaggccgc ccgggcaaag cccgggcgtc

60 60

gggcgacctt tggtcgcccg gcctaggtga gcgagcgagc gcgcagagag ggagtggcca gggcgacctt tggtcgcccg gcctaggtga gcgagcgagc gcgcagagag ggagtggcca

120 120

actccatcac taggggttcc t actccatcac taggggttcc t

141 141

<210> 157<210> 157

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 157<400> 157

gcgcgctcgc tcgctcacc gcgcgctcgc tcgctcacc

19 19

<210> 158<210> 158

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 158<400> 158

ctaggtgagc gagcgagcgc gc ctaggtgagc gagcgagcgc gc

22 22

<210> 159<210> 159

<211> 75<211> 75

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 159<400> 159

cctgcaggac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctgcaggac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg

60 60

cctcagtcct gcagg cctcagtcct gcagg

75 75

<210> 160<210> 160

<211> 130<211> 130

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 160<400> 160

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagt aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagt

60 60

gcgggcgacc aaaggtcgcc cgacgcccgg gcgcactcag tgagcgagcg agcgcgcagc gcgggcgacc aaaggtcgcc cgacgcccgg gcgcactcag tgagcgagcg agcgcgcagc

120 120

tgcctgcagg tgcctgcagg

130 130

<210> 161<210> 161

<211> 142<211> 142

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 161<400> 161

cctgcaggca gctgcgcgct cgctcgctcc ctaggactga ggccgcccgg gcgtcgggcg cctgcaggca gctgcgcgct cgctcgctcc ctaggactga ggccgcccgg gcgtcgggcg

60 60

acctttggtc gcccggcctc agtcctaggg agcgagcgag cgcgcagaga gggagtggcc acctttggtc gcccggcctc agtcctaggg agcgagcgag cgcgcagaga gggagtggcc

120 120

aactccatca ctaggggttc ct aactccatca ctaggggttc ct

142 142

<210> 162<210> 162

<211> 80<211> 80

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 162<400> 162

gcgcgctcgc tcgctcactg agtgcgggcg accaaaggtc gcccgacgcc cgggcgcact gcgcgctcgc tcgctcactg agtgcgggcg accaaaggtc gcccgacgcc cgggcgcact

60 60

cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc

80 80

<210> 163<210> 163

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 163<400> 163

gcgcgctcgc tcgctcactg a gcgcgctcgc tcgctcactg a

21 21

<210> 164<210> 164

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 164<400> 164

gtgagcgagc gagcgcgc gtgagcgagc gagcgcgc

18 18

<210> 165<210> 165

<211> 89<211> 89

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 165<400> 165

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc

60 60

gcccggcctc agtgagcgag cgagcgcgc gcccggcctc agtgagcgag cgagcgcgc

89 89

<210> 166<210> 166

<211> 89<211> 89

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 166<400> 166

gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc

60 60

gggcggcctc agtgagcgag cgagcgcgc gggcggcctc agtgagcgag cgagcgcgc

89 89

<210> 167<210> 167

<211> 87<211> 87

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 167<400> 167

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc

60 60

ccggcctcag tgagcgagcg agcgcgc ccggcctcag tgagcgagcg agcgcgc

87 87

<210> 168<210> 168

<211> 87<211> 87

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 168<400> 168

gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg

60 60

gcggcctcag tgagcgagcg agcgcgc gcggcctcag tgagcgagcg agcgcgc

87 87

<210> 169<210> 169

<211> 85<211> 85

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 169<400> 169

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc

60 60

ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc

85 85

<210> 170<210> 170

<211> 85<211> 85

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 170<400> 170

gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc

60 60

ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc

85 85

<210> 171<210> 171

<211> 89<211> 89

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 171<400> 171

gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc

60 60

gcccggcctc agtgagcgag cgagcgcgc gcccggcctc agtgagcgag cgagcgcgc

89 89

<210> 172<210> 172

<211> 89<211> 89

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 172<400> 172

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc

60 60

gggcggcctc agtgagcgag cgagcgcgc gggcggcctc agtgagcgag cgagcgcgc

89 89

<210> 173<210> 173

<211> 87<211> 87

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 173<400> 173

gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc

60 60

ccggcctcag tgagcgagcg agcgcgc ccggcctcag tgagcgagcg agcgcgc

87 87

<210> 174<210> 174

<211> 87<211> 87

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 174<400> 174

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg

60 60

gcggcctcag tgagcgagcg agcgcgc gcggcctcag tgagcgagcg agcgcgc

87 87

<210> 175<210> 175

<211> 85<211> 85

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 175<400> 175

gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc

60 60

ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc

85 85

<210> 176<210> 176

<211> 85<211> 85

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 176<400> 176

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc

60 60

ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc

85 85

<210> 177<210> 177

<211> 83<211> 83

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 177<400> 177

gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg

60 60

cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc

83 83

<210> 178<210> 178

<211> 83<211> 83

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 178<400> 178

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg

60 60

cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc

83 83

<210> 179<210> 179

<211> 81<211> 81

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 179<400> 179

gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc

60 60

tcagtgagcg agcgagcgcg c tcagtgagcg agcgagcgcg c

81 81

<210> 180<210> 180

<211> 81<211> 81

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 180<400> 180

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc

60 60

tcagtgagcg agcgagcgcg c tcagtgagcg agcgagcgcg c

81 81

<210> 181<210> 181

<211> 79<211> 79

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 181<400> 181

gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc

60 60

agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc

79 79

<210> 182<210> 182

<211> 79<211> 79

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 182<400> 182

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc

60 60

agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc

79 79

<210> 183<210> 183

<211> 81<211> 81

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 183<400> 183

ctgcgcgctc gctcgctcac tgaggccgaa acgtcgggcg acctttggtc gcccggcctc ctgcgcgctc gctcgctcac tgaggccgaa acgtcgggcg acctttggtc gcccggcctc

60 60

agtgagcgag cgagcgcgca g agtgagcgag cgagcgcgca g

81 81

<210> 184<210> 184

<211> 81<211> 81

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 184<400> 184

ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg tttcggcctc ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg tttcggcctc

60 60

agtgagcgag cgagcgcgca g agtgagcgag cgagcgcgca g

81 81

<210> 185<210> 185

<211> 72<211> 72

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 185<400> 185

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc

60 60

gagcgagcgc gc gagcgagcgc gc

72 72

<210> 186<210> 186

<211> 80<211> 80

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 186<400> 186

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

60 60

cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc

80 80

<210> 187<210> 187

<211> 79<211> 79

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 187<400> 187

gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc

60 60

agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc

79 79

<210> 188<210> 188

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 188<400> 188

ggagtcaaag ttctgtttgc cctgatctgc atcgctgtgg ccgaggcc ggagtcaaag ttctgtttgc cctgatctgc atcgctgtgg ccgaggcc

48 48

<210> 189<210> 189

<211> 99<211> 99

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

олигонуклеотидoligonucleotide

<400> 189<400> 189

attcatacca acttgaagaa aaagttcagc ctcttcatcc tggtctttct cctgttcgca attcatacca acttgaagaa aaagttcagc ctcttcatcc tggtctttct cctgttcgca

60 60

gtcatctgtg tttggaagaa agggagcgac tatgaggcc gtcatctgtg tttggaagaa agggagcgac tatgaggcc

99 99

<210> 190<210> 190

<211> 588<211> 588

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 190<400> 190

gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt

60 60

gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc

120 120

ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag

180 180

gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac

240 240

aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc

300 300

tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc

360 360

acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca

420 420

aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt

480 480

gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg

540 540

gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaacc gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaacc

588 588

<210> 191<210> 191

<211> 399<211> 399

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 191<400> 191

cgggggaggc tgctggtgaa tattaaccaa ggtcacccca gttatcggag gagcaaacag cgggggaggc tgctggtgaa tattaaccaa ggtcacccca gttatcggag gagcaaacag

60 60

gggctaagtc cacacgcgtg gtaccgtctg tctgcacatt tcgtagagcg agtgttccga gggctaagtc cacacgcgtg gtaccgtctg tctgcacatt tcgtagagcg agtgttccga

120 120

tactctaatc tccctaggca aggttcatat ttgtgtaggt tacttattct ccttttgttg tactctaatc tccctaggca aggttcatat ttgtgtaggt tacttattct ccttttgttg

180 180

actaagtcaa taatcagaat cagcaggttt ggagtcagct tggcagggat cagcagcctg actaagtcaa taatcagaat cagcaggttt ggagtcagct tggcagggat cagcagcctg

240 240

ggttggaagg agggggtata aaagcccctt caccaggaga agccgtcaca cagatccaca ggttggaagg agggggtata aaagcccctt caccaggaga agccgtcaca cagatccaca

300 300

agctcctgaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt agctcctgaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt

360 360

acctggagca cctgcctgaa atcacttttt ttcaggttg acctggagca cctgcctgaa atcacttttt ttcaggttg

399 399

<210> 192<210> 192

<211> 14359<211> 14359

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 192<400> 192

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct

43804380

gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag

44404440

tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag

45004500

caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga

45604560

gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag

46204620

aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca

46804680

cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc

47404740

atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca

48004800

tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca

48604860

ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca

49204920

agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag

49804980

acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg

50405040

ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc

51005100

aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag

51605160

tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc

52205220

ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta

52805280

agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact

53405340

cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg

54005400

ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg

54605460

aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg

55205520

gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt

55805580

gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga

56405640

tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa

57005700

gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctggggagagc

57605760

tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg

58205820

tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc

58805880

ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg

59405940

tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt

60006000

cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag

60606060

aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa

61206120

acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc

61806180

tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc

62406240

tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg

63006300

agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct

63606360

ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg

64206420

gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac

64806480

ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg

65406540

ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg

66006600

gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg

66606660

tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg

67206720

aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata

67806780

acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc

68406840

actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg

69006900

acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata

69606960

agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc

70207020

acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca

70807080

tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc

71407140

ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc

72007200

tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga

72607260

gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg

73207320

ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca

73807380

accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt

74407440

cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg

75007500

aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca

75607560

gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg

76207620

cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt

76807680

acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa

77407740

accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag

78007800

ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg

78607860

aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcccaga agcttcagcc aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcccaga agcttcagcc

79207920

agaatagcag acacccctcc accagacaga agcagttcaa cgccacaaca atccccgaga agaatagcag acacccctcc acgacaga agcagttcaa cgccacaaca atccccgaga

79807980

acgacatcga gaaaaccgat ccttggtttg cccacagaac ccctatgcct aagatccaga acgacatcga gaaaaccgat ccttggtttg cccacagaac ccctatgcct aagatccaga

80408040

acgtgtcctc cagcgatctg ctgatgctcc tgagacagag ccctacacct cacggactga acgtgtcctc cagcgatctg ctgatgctcc tgagacagag ccctacacct cacggactga

81008100

gcctgtccga tctgcaagag gccaaatacg aaaccttcag cgacgaccct tctcctggcg gcctgtccga tctgcaagag gccaaatacg aaaccttcag cgacgaccct tctcctggcg

81608160

ccatcgacag caacaatagc ctgagcgaga tgacccactt cagaccacag ctgcaccaca ccatcgacag caacaatagc ctgagcgaga tgacccactt cagaccacag ctgcaccaca

82208220

gcggcgacat ggtgtttaca cctgagagcg gcctccagct gagactgaat gagaagctgg gcggcgacat ggtgtttaca cctgagagcg gcctccagct gagactgaat gagaagctgg

82808280

gaaccaccgc cgccaccgag ctgaagaaac tggacttcaa ggtgtcctct accagcaaca gaaccaccgc cgccaccgag ctgaagaaac tggacttcaa ggtgtcctct accagcaaca

83408340

acctgatcag cacaatcccc tccgacaacc tggctgccgg caccgacaac acatcttctc acctgatcag cacaatcccc tccgacaacc tggctgccgg caccgacaac acatcttctc

84008400

tgggcccacc tagcatgccc gtgcactacg atagccagct ggataccaca ctgttcggca tgggcccacc tagcatgccc gtgcactacg atagccagct ggataccaca ctgttcggca

84608460

agaagtctag ccctctgaca gagtctggcg gccctctgtc tctgagcgag gaaaacaacg agaagtctag ccctctgaca gagtctggcg gccctctgtc tctgagcgag gaaaacaacg

85208520

acagcaagct gctggaatcc ggcctgatga acagccaaga gtcctcctgg ggcaagaatg acagcaagct gctggaatcc ggcctgatga acagccaaga gtcctcctgg ggcaagaatg

85808580

tgtccagcac cgagtccggc agactgttca agggaaagag agcccacgga cctgctctgc tgtccagcac cgagtccggc agactgttca agggaaagag agcccacgga cctgctctgc

86408640

tgaccaagga taacgccctg ttcaaagtgt ccatcagcct gctcaagacc aacaagacct tgaccaagga taacgccctg ttcaaagtgt ccatcagcct gctcaagacc aacaagacct

87008700

ccaacaactc cgccaccaac agaaagaccc acatcgacgg ccctagcctg ctgatcgaga ccaacaactc cgccaccaac agaaagaccc acatcgacgg ccctagcctg ctgatcgaga

87608760

atagccctag cgtctggcag aatatcctgg aaagcgacac cgagttcaag aaagtgaccc atagccctag cgtctggcag aatatcctgg aaagcgacac cgagttcaag aaagtgaccc

88208820

ctctgatcca cgaccggatg ctcatggaca agaacgccac cgctctgcgg ctgaaccaca ctctgatcca cgaccggatg ctcatggaca agaacgccac cgctctgcgg ctgaaccaca

88808880

tgagcaacaa gacaaccagc agcaagaata tggaaatggt gcagcagaag aaagagggcc tgagcaacaa gacaaccagc agcaagaata tggaaatggt gcagcagaag aaagaggggcc

89408940

ccattcctcc agacgctcag aaccccgata tgagcttctt caagatgctc tttctgcccg ccattcctcc agacgctcag aaccccgata tgagcttctt caagatgctc tttctgcccg

90009000

agagcgcccg gtggattcag agaacacacg gcaagaactc cctgaactcc ggccagggac agagcgcccg gtggattcag agaacacacg gcaagaactc cctgaactcc ggccagggac

90609060

cttctccaaa gcagctggtt tccctgggac ctgagaagtc cgtggaagga cagaacttcc cttctccaaa gcagctggtt tccctgggac ctgagaagtc cgtggaagga cagaacttcc

91209120

tgagcgaaaa gaacaaagtg gtcgtcggca agggcgagtt caccaaggat gtgggcctga tgagcgaaaa gaacaaagtg gtcgtcggca agggcgagtt caccaaggat gtgggcctga

91809180

aagagatggt ctttcccagc agccggaacc tgttcctgac caacctggac aacctgcacg aagagatggt ctttcccagc agccggaacc tgttcctgac caacctggac aacctgcacg

92409240

agaacaacac ccacaatcaa gagaagaaga tccaagagga aatcgaaaag aaagagacac agaacaacac ccacaatcaa gagaagaaga tccaagagga aatcgaaaag aaagagacac

93009300

tcatccaaga gaacgtggtg ctgcctcaga tccacacagt gaccggcacc aagaacttta tcatccaaga gaacgtggtg ctgcctcaga tccacacagt gaccggcacc aagaacttta

93609360

tgaagaatct gttcctgctg agtacccggc agaacgtgga aggcagctac gatggcgctt tgaagaatct gttcctgctg agtacccggc agaacgtgga aggcagctac gatggcgctt

94209420

atgcccctgt gctgcaggac ttcagatccc tgaacgactc caccaatcgg acaaagaagc atgcccctgt gctgcaggac ttcagatccc tgaacgactc caccaatcgg acaaagaagc

94809480

acacagccca cttctccaag aagggcgaag aagagaacct ggaaggactg ggcaatcaga acacagccca cttctccaag aagggcgaag aagagaacct ggaaggactg ggcaatcaga

95409540

ccaagcagat cgtcgagaag tacgcctgca ccaccagaat cagccccaac acaagccagc ccaagcagat cgtcgagaag tacgcctgca ccaccagaat cagccccaac acaagccagc

96009600

agaacttcgt gacccagcgg agcaaaagag ccctgaagca gtttcggctg cccctggaag agaacttcgt gacccagcgg agcaaaagag ccctgaagca gtttcggctg cccctggaag

96609660

aaaccgagct ggaaaagcgg atcatcgtgg acgacaccag cacacagtgg tccaagaaca aaaccgagct ggaaaagcgg atcatcgtgg acgacaccag cacacagtgg tccaagaaca

97209720

tgaagcactt gacccctagc acactgaccc agatcgacta caacgagaaa gagaagggcg tgaagcactt gacccctagc acactgaccc agatcgacta caacgagaaa gagaagggcg

97809780

ctatcacaca gagcccactg agcgactgtc tgaccagaag ccacagcatc cctcaggcca ctatcacaca gagcccactg agcgactgtc tgaccagaag ccacagcatc cctcaggcca

98409840

acagatcccc tctgccaatc gccaaagtgt ctagcttccc cagcatcaga cccatctacc acagatcccc tctgccaatc gccaaagtgt ctagcttccc cagcatcaga cccatctacc

99009900

tgaccagagt gctgttccag gacaacagca gccatctgcc agccgccagc taccggaaga tgaccagagt gctgttccag gacaacagca gccatctgcc agccgccagc taccggaaga

99609960

aagattctgg cgtgcaagag agcagccact ttctgcaggg cgctaagaag aacaatctga aagattctgg cgtgcaagag agcagccact ttctgcaggg cgctaagaag aacaatctga

1002010020

gcctggctat tctgaccctg gaaatgaccg gcgatcagag agaagtcggc tctctgggca gcctggctat tctgaccctg gaaatgaccg gcgatcagag agaagtcggc tctctgggca

1008010080

ccagcgccac aaatagcgtg acctacaaaa aggtggaaaa caccgtgctg cctaagcctg ccagcgccac aaatagcgtg acctacaaaa aggtggaaaa caccgtgctg cctaagcctg

1014010140

acctgccaaa gacaagcggc aaggtggaac tgctgccaaa ggtgcacatc taccagaagg acctgccaaa gacaagcggc aaggtggaac tgctgccaaa ggtgcacatc taccagaagg

1020010200

acctgtttcc taccgagaca agcaacggct ctcccggcca tctggatctg gtggaaggat acctgtttcc taccgagaca agcaacggct ctcccggcca tctggatctg gtggaaggat

1026010260

ctctgctgca gggaaccgag ggcgccatca agtggaacga ggccaataga cctggcaagg ctctgctgca gggaaccgag ggcgccatca agtggaacga ggccaataga cctggcaagg

1032010320

tgcccttcct gagagtggcc acagagtcca gcgccaagac accctctaaa ctgctggacc tgcccttcct gagagtggcc acagagtcca gcgccaagac accctctaaa ctgctggacc

1038010380

ctctggcctg ggacaaccac tatggcactc agatccccaa agaggaatgg aagtcccaag ctctggcctg ggacaaccac tatggcactc agatccccaa agaggaatgg aagtcccaag

1044010440

agaagtcccc tgaaaagacc gccttcaaga agaaggacac cattctgtcc ctgaatgcct agaagtcccc tgaaaagacc gccttcaaga agaaggacac cattctgtcc ctgaatgcct

1050010500

gcgagagcaa ccacgccatt gccgccatca atgagggcca gaacaagccc gagatcgaag gcgagagcaa ccacgccatt gccgccatca atgagggcca gaacaagccc gagatcgaag

1056010560

tgacctgggc caagcaggga agaaccgaga gactgtgtag ccagaatcct cctgtgctga tgacctgggc caagcaggga agaaccgaga gactgtgtag ccagaatcct cctgtgctga

1062010620

agcggcacca gagagaaatc acccggacca cactgcagag cgaccaagaa gagatcgatt agcggcacca gagagaaatc acccggacca cactgcagag cgaccaagaa gagatcgatt

1068010680

acgacgatac catcagcgtc gagatgaaga aagaagattt cgacatctac gacgaggacg acgacgatac catcagcgtc gagatgaaga aagaagattt cgacatctac gacgaggacg

1074010740

agaatcagag ccctcggagc ttccagaaga aaaccaggca ctactttatt gccgccgtcg agaatcagag ccctcggagc ttccagaaga aaaccaggca ctactttatt gccgccgtcg

1080010800

agcggctgtg ggactacgga atgtctagct ctcctcacgt gctgcggaat agagcccagt agcggctgtg ggactacgga atgtctagct ctcctcacgt gctgcggaat agagcccagt

1086010860

ctggtagcgt gccccagttc aaaaaggtcg tgttccaaga gttcaccgac ggcagcttca ctggtagcgt gccccagttc aaaaaggtcg tgttccaaga gttcaccgac ggcagcttca

1092010920

cccagccact gtatagaggc gagctgaacg agcatctggg cctgctgggc ccttatatca cccagccact gtatagaggc gagctgaacg agcatctggg cctgctgggc ccttatatca

1098010980

gagccgaagt ggaagataac atcatggtca ccttccggaa tcaggctagc cggccttaca gagccgaagt ggaagataac atcatggtca ccttccggaa tcaggctagc cggccttaca

1104011040

gcttctacag ctccctgatc tcctacgaag aggaccagag acagggcgca gagccccgga gcttctacag ctccctgatc tcctacgaag aggaccagag acagggcgca gagccccgga

1110011100

agaatttcgt gaagcccaac gagactaaga cctacttttg gaaggtgcag caccatatgg agaatttcgt gaagcccaac gagactaaga cctacttttg gaaggtgcag caccatatgg

1116011160

cccctacaaa ggacgagttc gactgcaaag cctgggccta cttctccgat gtggacctcg cccctacaaa ggacgagttc gactgcaaag cctgggccta cttctccgat gtggacctcg

1122011220

aaaaggacgt gcacagcgga ctcatcggcc cactgcttgt gtgccacacc aacacactga aaaaggacgt gcacagcgga ctcatcggcc cactgcttgt gtgccacacc aacacactga

1128011280

accccgctca cggcagacaa gtgacagtgc aagagttcgc cctgtttttc accatcttcg accccgctca cggcagacaa gtgacagtgc aagagttcgc cctgtttttc accatcttcg

1134011340

acgaaacgaa gtcctggtac ttcaccgaaa acatggaaag aaactgcagg gccccttgca acgaaacgaa gtcctggtac ttcaccgaaa acatggaaag aaactgcagg gccccttgca

1140011400

acattcagat ggaagatccc accttcaaag agaactaccg gttccacgcc atcaacggct acattcagat ggaagatccc accttcaaag agaactaccg gttccacgcc atcaacggct

1146011460

acatcatgga cacactgccc ggcctggtta tggcccagga tcagagaatc cggtggtatc acatcatgga cacactgccc ggcctggtta tggcccagga tcagagaatc cggtggtatc

1152011520

tgctgtccat gggctccaac gagaatatcc actccatcca cttcagcggc cacgtgttca tgctgtccat gggctccaac gagaatatcc actccatcca cttcagcggc cacgtgttca

1158011580

ccgtgcggaa aaaagaagag tacaaaatgg ccctgtacaa tctgtaccct ggggtgttcg ccgtgcggaa aaaagaagag tacaaaatgg ccctgtacaa tctgtaccct ggggtgttcg

1164011640

aaaccgttga gatgctgcct agcaaggccg gaatttggag agtggaatgt ctgattggag aaaccgttga gatgctgcct agcaaggccg gaatttggag agtggaatgt ctgattggag

1170011700

agcacctcca cgccgggatg agcaccctgt ttctggtgta ctccaacaag tgtcagaccc agcacctcca cgccgggatg agcaccctgt ttctggtgta ctccaacaag tgtcagaccc

1176011760

ctctcggcat ggcctctggc cacattagag acttccagat caccgccagc ggacagtatg ctctcggcat ggcctctggc cacattagag acttccagat caccgccagc ggacagtatg

1182011820

gacagtgggc ccctaaactg gccagactgc actactccgg cagcatcaat gcctggtcca gacagtgggc ccctaaactg gccagactgc actactccgg cagcatcaat gcctggtcca

1188011880

ccaaagagcc tttcagctgg atcaaagtgg acctgctggc tcccatgatc atccacggaa ccaaagagcc tttcagctgg atcaaagtgg acctgctggc tcccatgatc atccacggaa

1194011940

tcaagaccca gggcgccaga caaaagttca gcagcctgta catcagccag ttcatcatca tcaagaccca gggcgccaga caaaagttca gcagcctgta catcagccag ttcatcatca

1200012000

tgtacagcct ggacggaaag aagtggcaga cctaccgggg caatagcacc ggcacactga tgtacagcct ggacggaaag aagtggcaga cctaccgggg caatagcacc ggcacactga

1206012060

tggtgttctt cggcaacgtg gactccagcg gcattaagca caacatcttc aaccctccaa tggtgttctt cggcaacgtg gactccagcg gcattaagca caacatcttc aaccctccaa

1212012120

tcattgcccg gtacatccgg ctgcacccca cacactacag catcaggtct accctgagaa tcattgcccg gtacatccgg ctgcacccca cacactacag catcaggtct accctgagaa

1218012180

tggaactgat gggctgcgac ctgaacagct gctctatgcc cctcggaatg gaaagcaagg tggaactgat gggctgcgac ctgaacagct gctctatgcc cctcggaatg gaaagcaagg

1224012240

ccatcagcga cgcccagatc acagcctcta gctacttcac caacatgttc gccacttgga ccatcagcga cgcccagatc acagcctcta gctacttcac caacatgttc gccacttgga

1230012300

gcccctctaa ggcccggctt catctgcaag gcagaagcaa cgcttggagg ccccaagtga gcccctctaa ggcccggctt catctgcaag gcagaagcaa cgcttggagg ccccaagtga

1236012360

acaaccccaa agaatggctc caggtggact ttcagaaaac catgaaagtg acaggcgtga acaaccccaa agaatggctc caggtggact ttcagaaaac catgaaagtg acaggcgtga

1242012420

ccacacaggg cgtcaagtcc ctgctgacct ctatgtacgt gaaagagttt ctgatcagct ccacacaggg cgtcaagtcc ctgctgacct ctatgtacgt gaaagagttt ctgatcagct

1248012480

ccagccagga cggccaccag tggaccctgt tcttccagaa cggcaaagtg aaagtgttcc ccagccagga cggccaccag tggaccctgt tcttccagaa cggcaaagtg aaagtgttcc

1254012540

agggaaatca ggacagcttc acacccgtgg tcaatagtct ggacccacca ctgctgaccc agggaaatca ggacagcttc acacccgtgg tcaatagtct ggacccacca ctgctgaccc

1260012600

gctacctgcg aattcaccct cagtcttggg tgcaccagat tgccctgcgg atggaagtgc gctacctgcg aattcaccct cagtcttggg tgcaccagat tgccctgcgg atggaagtgc

1266012660

tgggctgtga agctcaggac ctctactagt taattaagag catcttaccg ccatttattc tgggctgtga agctcaggac ctctactagt taattaagag catcttaccg ccatttattc

1272012720

ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata aaacaaaatg ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata aaacaaaatg

1278012780

gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg tattgccaca gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg tattgccaca

1284012840

agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta atcaacctct agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta atcaacctct

1290012900

ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc cttttacgct ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc cttttacgct

1296012960

gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta cggctttcgt gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta cggctttcgt

1302013020

tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt ggcccgttgt tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt ggcccgttgt

1308013080

ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg gctggggcat ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg gctggggcat

1314013140

tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga tcgccacggc tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga tcgccacggc

1320013200

agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc tgggcactga agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc tgggcactga

1326013260

taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt gcccctcccc taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt gcccctcccc

1332013320

cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga

1338013380

aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga

1344013440

cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat

1350013500

ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta actacacctg ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta actacacctg

1356013560

caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact

1362013620

gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg

1368013680

cagctgcctg caggggcgcg cctcgaggca tgcggtacca agcttgtcga gaagtactag cagctgcctg caggggcgcg cctcgaggca tgcggtacca agcttgtcga gaagtactag

1374013740

aggatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca aggatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca

1380013800

cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt

1386013860

gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt

1392013920

ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg

1398013980

atctgatcac tgatatcgcc taggagatcc gaaccagata agtgaaatct agttccaaac atctgatcac tgatatcgcc taggagatcc gaaccagata agtgaaatct agttccaaac

1404014040

tattttgtca tttttaattt tcgtattagc ttacgacgct acacccagtt cccatctatt tattttgtca tttttaattt tcgtattagc ttacgacgct acacccagtt cccatctatt

1410014100

ttgtcactct tccctaaata atccttaaaa actccatttc cacccctccc agttcccaac ttgtcactct tccctaaata atccttaaaa actccatttc cacccctccc agttcccaac

1416014160

tattttgtcc gcccacagcg gggcattttt cttcctgtta tgtttttaat caaacatcct tattttgtcc gccccacagcg gggcattttt cttcctgtta tgtttttaat caaacatcct

1422014220

gccaactcca tgtgacaaac cgtcatcttc ggctactttt tctctgtcac agaatgaaaa gccaactcca tgtgacaaac cgtcatcttc ggctactttt tctctgtcac agaatgaaaa

1428014280

tttttctgtc atctcttcgt tattaatgtt tgtaattgac tgaatatcaa cgcttatttg tttttctgtc atctcttcgt tattaatgtt tgtaattgac tgaatatcaa cgcttatttg

1434014340

cagcctgaat ggcgaatgg cagcctgaat ggcgaatgg

1435914359

<210> 193<210> 193

<211> 11677<211> 11677

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 193<400> 193

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct

43804380

gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag

44404440

tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag

45004500

caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga

45604560

gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag

46204620

aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca

46804680

cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc

47404740

atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca

48004800

tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca

48604860

ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca

49204920

agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag

49804980

acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg

50405040

ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc

51005100

aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag

51605160

tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc

52205220

ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta

52805280

agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact

53405340

cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg

54005400

ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg

54605460

aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg

55205520

gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt

55805580

gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga

56405640

tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa

57005700

gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctggggagagc

57605760

tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg

58205820

tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc

58805880

ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg

59405940

tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt

60006000

cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag

60606060

aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa

61206120

acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc

61806180

tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc

62406240

tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg

63006300

agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct

63606360

ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg

64206420

gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac

64806480

ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg

65406540

ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg

66006600

gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg

66606660

tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg

67206720

aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata

67806780

acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc

68406840

actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg

69006900

acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata

69606960

agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc

70207020

acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca

70807080

tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc

71407140

ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc

72007200

tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga

72607260

gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg

73207320

ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca

73807380

accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt

74407440

cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg

75007500

aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca

75607560

gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg

76207620

cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt

76807680

acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa

77407740

accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag

78007800

ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg

78607860

aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg agcttcagcc aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg agcttcagcc

79207920

agaatcctcc tgtgctgaag cggcaccagc gcgagatcac cagaacaacc ctgcagagcg agaatcctcc tgtgctgaag cggcaccagc gcgagatcac cagaacaacc ctgcagagcg

79807980

accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa gaagatttcg accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa gaagatttcg

80408040

acatctacga cgaggacgag aatcagagcc ccagaagctt tcagaaaaag acccggcact acatctacga cgaggacgag aatcagagcc ccagaagctt tcagaaaaag acccggcact

81008100

acttcattgc cgccgtcgag agactgtggg actacggcat gtctagcagc cctcacgtgc acttcattgc cgccgtcgag agactgtggg actacggcat gtctagcagc cctcacgtgc

81608160

tgagaaatag agcccagagc ggcagcgtgc cccagttcaa gaaagtggtg ttccaagagt tgagaaatag agcccagagc ggcagcgtgc cccagttcaa gaaagtggtg ttccaagagt

82208220

tcaccgacgg cagcttcacc cagccactgt atagaggcga gctgaacgag catctgggcc tcaccgacgg cagcttcacc cagccactgt atagaggcga gctgaacgag catctgggcc

82808280

tgctgggccc ttatatcaga gccgaagtgg aagataacat catggtcacc ttccggaatc tgctgggccc ttatatcaga gccgaagtgg aagataacat catggtcacc ttccggaatc

83408340

aggctagccg gccttacagc ttctacagct ccctgatcag ctacgaagag gaccagagac aggctagccg gccttacagc ttctacagct ccctgatcag ctacgaagag gaccagagac

84008400

agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc tacttttgga agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc tacttttgga

84608460

aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaagcc tgggcctact aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaagcc tgggcctact

85208520

tctccgatgt ggatctggaa aaggacgtgc acagcgggct catcggacca ctgcttgtgt tctccgatgt ggatctggaa aaggacgtgc acagcgggct catcggacca ctgcttgtgt

85808580

gccacaccaa cacactgaac cccgctcacg gcagacaagt gacagtgcaa gagttcgccc gccacaccaa cacactgaac cccgctcacg gcagacaagt gacagtgcaa gagttcgccc

86408640

tgttcttcac catcttcgac gaaacaaaga gctggtactt caccgagaat atggaacgga tgttcttcac catcttcgac gaaacaaaga gctggtactt caccgagaat atggaacgga

87008700

actgcagagc cccttgcaac atccagatgg aagatcccac cttcaaagag aactaccggt actgcagagc cccttgcaac atccagatgg aagatcccac cttcaaagag aactaccggt

87608760

tccacgccat caacggctac atcatggaca cactgcccgg cctggttatg gcccaggatc tccacgccat caacggctac atcatggaca cactgcccgg cctggttatg gcccaggatc

88208820

agagaatccg gtggtatctg ctgtccatgg gctccaacga gaatatccac agcatccact agagaatccg gtggtatctg ctgtccatgg gctccaacga gaatatccac agcatccact

88808880

tcagcggcca cgtgttcacc gtgcggaaaa aagaagagta caaaatggcc ctgtacaatc tcagcggcca cgtgttcacc gtgcggaaaa aagaagagta caaaatggcc ctgtacaatc

89408940

tgtaccctgg ggtgttcgaa accgtggaaa tgctgccttc caaggccggc atttggagag tgtaccctgg ggtgttcgaa accgtggaaa tgctgccttc caaggccggc atttggagag

90009000

tggaatgtct gattggagag cacctccacg ccggaatgag caccctgttt ctggtgtaca tggaatgtct gattggagag cacctccacg ccggaatgag caccctgttt ctggtgtaca

90609060

gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac ttccagatca gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac ttccagatca

91209120

ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tcggctgcac tacagcggca ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tcggctgcac tacagcggca

91809180

gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac ctgctggctc gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac ctgctggctc

92409240

ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc agcctgtaca ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc agcctgtaca

93009300

tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc tacagaggca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc tacagaggca

93609360

acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc attaagcaca acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc attaagcaca

94209420

acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca cactacagca acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca cactacagca

94809480

tccggtctac cctgagaatg gaactgatgg gctgcgacct gaacagctgc tctatgcccc tccggtctac cctgagaatg gaactgatgg gctgcgacct gaacagctgc tctatgcccc

95409540

tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc tacttcacca tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc tacttcacca

96009600

acatgttcgc cacttggagc ccctccaagg ctagactgca tctgcagggc agaagcaacg acatgttcgc cacttggagc ccctccaagg ctagactgca tctgcagggc agaagcaacg

96609660

cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggttgacttt caaaagacca cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggttgacttt caaaagacca

97209720

tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct atgtacgtga tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct atgtacgtga

97809780

aagagttcct gatctccagc agccaggacg gccatcagtg gaccctgttt ttccagaacg aagagttcct gatctccagc agccaggacg gccatcagtg gaccctgttt ttccagaacg

98409840

gcaaagtgaa agtgttccag ggcaatcagg acagcttcac acccgtggtc aattctctgg gcaaagtgaa agtgttccag ggcaatcagg acagcttcac acccgtggtc aattctctgg

99009900

accctccact gctgaccaga tacctgcgga ttcaccctca gtcttgggtg caccagatcg accctccact gctgaccaga tacctgcgga ttcaccctca gtcttgggtg caccagatcg

99609960

ctctgcggat ggaagtgctg ggctgtgaag ctcaggacct ctactagtta attaagagca ctctgcggat ggaagtgctg ggctgtgaag ctcaggacct ctactagtta attaagagca

1002010020

tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa

1008010080

tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag

1014010140

ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt

1020010200

tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta

1026010260

tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc

1032010320

ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga

1038010380

ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac

1044010440

ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc

1050010500

cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc

1056010560

taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc

1062010620

tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct

1068010680

ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg

1074010740

gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg

1080010800

ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt

1086010860

aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg

1092010920

cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc

1098010980

agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg cggtaccaag agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg cggtaccaag

1104011040

cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga ggttttactt cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga ggttttactt

1110011100

gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt

1116011160

gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat

1122011220

ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat

1128011280

gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga accagataag gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga accagataag

1134011340

tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt acgacgctac tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt acgacgctac

1140011400

acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac tccatttcca acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac tccatttcca

1146011460

cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct tcctgttatg cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct tcctgttatg

1152011520

tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg ctactttttc tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg ctactttttc

1158011580

tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg taattgactg tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg taattgactg

1164011640

aatatcaacg cttatttgca gcctgaatgg cgaatgg aatatcaacg cttatttgca gcctgaatgg cgaatgg

1167711677

<210> 194<210> 194

<211> 13634<211> 13634

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 194<400> 194

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca

43804380

aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct

44404440

gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca

45004500

gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc

45604560

agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat agtggaagct gtacactgcc caggcaaagc gtccggggcag cgtaggcggg cgactcagat

46204620

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat

46804680

attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac

47404740

agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc

48004800

taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc

48604860

tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag

49204920

ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat

49804980

tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc

50405040

gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg

51005100

tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg

51605160

cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc

52205220

atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat

52805280

tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac

53405340

gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc

54005400

cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc

54605460

aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc

55205520

aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc

55805580

aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct

56405640

agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg

57005700

atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag

57605760

gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc

58205820

ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag

58805880

tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag

59405940

gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac

60006000

tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc

60606060

cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat

61206120

atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga

61806180

agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa

62406240

gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag

63006300

agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc

63606360

aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc

64206420

ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct

64806480

ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac

65406540

cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc

66006600

ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag

66606660

atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg

67206720

tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat

67806780

cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg

68406840

cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag

69006900

accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag

69606960

gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc

70207020

ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg

70807080

ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac

71407140

atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat

72007200

agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac

72607260

atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg

73207320

tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg

73807380

tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc

74407440

gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc

75007500

gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc

75607560

accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg

76207620

atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc

76807680

ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag ccacctagca tgcccgtgca ctacgatagc cagctggata cccacactgtt cggcaagaag

77407740

tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc

78007800

aagctgctgg aatccggcct gatgaacagc caagagtcct cctggggcaa gaatgtgtcc aagctgctgg aatccggcct gatgaacagc caagagtcct cctggggcaa gaatgtgtcc

78607860

agcaccgagt ccggcagact gttcaaggga aagagagccc acggacctgc tctgctgacc agcaccgagt ccggcagact gttcaaggga aagagagccc acggacctgc tctgctgacc

79207920

aaggataacg ccctgttcaa agtgtccatc agcctgctca agaccaacaa gacctccaac aaggataacg ccctgttcaa agtgtccatc agcctgctca agaccaacaa gacctccaac

79807980

aactccgcca ccaacagaaa gacccacatc gacggcccta gcctgctgat cgagaatagc aactccgcca ccaacagaaa gacccacatc gacggcccta gcctgctgat cgagaatagc

80408040

cctagcgtct ggcagaatat cctggaaagc gacaccgagt tcaagaaagt gacccctctg cctagcgtct ggcagaatat cctggaaagc gacaccgagt tcaagaaagt gacccctctg

81008100

atccacgacc ggatgctcat ggacaagaac gccaccgctc tgcggctgaa ccacatgagc atccacgacc ggatgctcat ggacaagaac gccaccgctc tgcggctgaa ccacatgagc

81608160

aacaagacaa ccagcagcaa gaatatggaa atggtgcagc agaagaaaga gggccccatt aacaagacaa ccagcagcaa gaatatggaa atggtgcagc agaagaaaga gggccccatt

82208220

cctccagacg ctcagaaccc cgatatgagc ttcttcaaga tgctctttct gcccgagagc cctccagacg ctcagaaccc cgatatgagc ttcttcaaga tgctctttct gcccgagagc

82808280

gcccggtgga ttcagagaac acacggcaag aactccctga actccggcca gggaccttct gcccggtgga ttcagagaac acacggcaag aactccctga actccggcca gggaccttct

83408340

ccaaagcagc tggtttccct gggacctgag aagtccgtgg aaggacagaa cttcctgagc ccaaagcagc tggtttccct gggacctgag aagtccgtgg aaggacagaa cttcctgagc

84008400

gaaaagaaca aagtggtcgt cggcaagggc gagttcacca aggatgtggg cctgaaagag gaaaagaaca aagtggtcgt cggcaagggc gagttcacca aggatgtggg cctgaaagag

84608460

atggtctttc ccagcagccg gaacctgttc ctgaccaacc tggacaacct gcacgagaac atggtctttc ccagcagccg gaacctgttc ctgaccaacc tggacaacct gcacgagaac

85208520

aacacccaca atcaagagaa gaagatccaa gaggaaatcg aaaagaaaga gacactcatc aacacccaca atcaagagaa gaagatccaa gaggaaatcg aaaagaaaga gacactcatc

85808580

caagagaacg tggtgctgcc tcagatccac acagtgaccg gcaccaagaa ctttatgaag caagagaacg tggtgctgcc tcagatccac acagtgaccg gcaccaagaa ctttatgaag

86408640

aatctgttcc tgctgagtac ccggcagaac gtggaaggca gctacgatgg cgcttatgcc aatctgttcc tgctgagtac ccggcagaac gtggaaggca gctacgatgg cgcttatgcc

87008700

cctgtgctgc aggacttcag atccctgaac gactccacca atcggacaaa gaagcacaca cctgtgctgc aggacttcag atccctgaac gactccacca atcggacaaa gaagcacaca

87608760

gcccacttct ccaagaaggg cgaagaagag aacctggaag gactgggcaa tcagaccaag gcccacttct ccaagaaggg cgaagaagag aacctggaag gactgggcaa tcagaccaag

88208820

cagatcgtcg agaagtacgc ctgcaccacc agaatcagcc ccaacacaag ccagcagaac cagatcgtcg agaagtacgc ctgcaccacc agaatcagcc ccaacacaag ccagcagaac

88808880

ttcgtgaccc agcggagcaa aagagccctg aagcagtttc ggctgcccct ggaagaaacc ttcgtgaccc agcggagcaa aagagccctg aagcagtttc ggctgcccct ggaagaaacc

89408940

gagctggaaa agcggatcat cgtggacgac accagcacac agtggtccaa gaacatgaag gagctggaaa agcggatcat cgtggacgac accagcacac agtggtccaa gaacatgaag

90009000

cacttgaccc ctagcacact gacccagatc gactacaacg agaaagagaa gggcgctatc cacttgaccc ctagcacact gacccagatc gactacaacg agaaagagaa gggcgctatc

90609060

acacagagcc cactgagcga ctgtctgacc agaagccaca gcatccctca ggccaacaga acacagagcc cactgagcga ctgtctgacc agaagccaca gcatccctca ggccaacaga

91209120

tcccctctgc caatcgccaa agtgtctagc ttccccagca tcagacccat ctacctgacc tcccctctgc caatcgccaa agtgtctagc ttccccagca tcagacccat ctacctgacc

91809180

agagtgctgt tccaggacaa cagcagccat ctgccagccg ccagctaccg gaagaaagat agagtgctgt tccaggacaa cagcagccat ctgccagccg ccagctaccg gaagaaagat

92409240

tctggcgtgc aagagagcag ccactttctg cagggcgcta agaagaacaa tctgagcctg tctggcgtgc aagagagcag ccactttctg cagggcgcta agaagaacaa tctgagcctg

93009300

gctattctga ccctggaaat gaccggcgat cagagagaag tcggctctct gggcaccagc gctattctga ccctggaaat gaccggcgat cagagagaag tcggctctct gggcaccagc

93609360

gccacaaata gcgtgaccta caaaaaggtg gaaaacaccg tgctgcctaa gcctgacctg gccacaaata gcgtgaccta caaaaaggtg gaaaacaccg tgctgcctaa gcctgacctg

94209420

ccaaagacaa gcggcaaggt ggaactgctg ccaaaggtgc acatctacca gaaggacctg ccaaagacaa gcggcaaggt ggaactgctg ccaaaggtgc acatctacca gaaggacctg

94809480

tttcctaccg agacaagcaa cggctctccc ggccatctgg atctggtgga aggatctctg tttcctaccg agacaagcaa cggctctccc ggccatctgg atctggtgga aggatctctg

95409540

ctgcagggaa ccgagggcgc catcaagtgg aacgaggcca atagacctgg caaggtgccc ctgcagggaa ccgagggcgc catcaagtgg aacgaggcca atagacctgg caaggtgccc

96009600

ttcctgagag tggccacaga gtccagcgcc aagacaccct ctaaactgct ggaccctctg ttcctgagag tggccacaga gtccagcgcc aagacaccct ctaaactgct ggaccctctg

96609660

gcctgggaca accactatgg cactcagatc cccaaagagg aatggaagtc ccaagagaag gcctgggaca accactatgg cactcagatc cccaaagagg aatggaagtc ccaagagaag

97209720

tcccctgaaa agaccgcctt caagaagaag gacaccattc tgtccctgaa tgcctgcgag tcccctgaaa agaccgcctt caagaagaag gacaccattc tgtccctgaa tgcctgcgag

97809780

agcaaccacg ccattgccgc catcaatgag ggccagaaca agcccgagat cgaagtgacc agcaaccacg ccattgccgc catcaatgag ggccagaaca agcccgagat cgaagtgacc

98409840

tgggccaagc agggaagaac cgagagactg tgtagccaga atcctcctgt gctgaagcgg tgggccaagc agggaagaac cgagagactg tgtagccaga atcctcctgt gctgaagcgg

99009900

caccagagag aaatcacccg gaccacactg cagagcgacc aagaagagat cgattacgac caccagagag aaatcacccg gaccacactg cagagcgacc aagaagagat cgattacgac

99609960

gataccatca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat gataccatca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat

1002010020

cagagccctc ggagcttcca gaagaaaacc aggcactact ttattgccgc cgtcgagcgg cagagccctc ggagcttcca gaagaaaacc aggcactact ttattgccgc cgtcgagcgg

1008010080

ctgtgggact acggaatgtc tagctctcct cacgtgctgc ggaatagagc ccagtctggt ctgtgggact acggaatgtc tagctctcct cacgtgctgc ggaatagagc ccagtctggt

1014010140

agcgtgcccc agttcaaaaa ggtcgtgttc caagagttca ccgacggcag cttcacccag agcgtgcccc agttcaaaaa ggtcgtgttc caagagttca ccgacggcag cttcacccag

1020010200

ccactgtata gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc ccactgtata gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc

1026010260

gaagtggaag ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc gaagtggaag ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc

1032010320

tacagctccc tgatctccta cgaagaggac cagagacagg gcgcagagcc ccggaagaat tacagctccc tgatctccta cgaagaggac cagagacagg gcgcagagcc ccggaagaat

1038010380

ttcgtgaagc ccaacgagac taagacctac ttttggaagg tgcagcacca tatggcccct ttcgtgaagc ccaacgagac taagacctac ttttggaagg tgcagcacca tatggcccct

1044010440

acaaaggacg agttcgactg caaagcctgg gcctacttct ccgatgtgga cctcgaaaag acaaaggacg agttcgactg caaagcctgg gcctacttct ccgatgtgga cctcgaaaag

1050010500

gacgtgcaca gcggactcat cggcccactg cttgtgtgcc acaccaacac actgaacccc gacgtgcaca gcggactcat cggcccactg cttgtgtgcc acaccaacac actgaacccc

1056010560

gctcacggca gacaagtgac agtgcaagag ttcgccctgt ttttcaccat cttcgacgaa gctcacggca gacaagtgac agtgcaagag ttcgccctgt ttttcaccat cttcgacgaa

1062010620

acgaagtcct ggtacttcac cgaaaacatg gaaagaaact gcagggcccc ttgcaacatt acgaagtcct ggtacttcac cgaaaacatg gaaagaaact gcagggcccc ttgcaacatt

1068010680

cagatggaag atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc cagatggaag atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc

1074010740

atggacacac tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg atggacacac tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg

1080010800

tccatgggct ccaacgagaa tatccactcc atccacttca gcggccacgt gttcaccgtg tccatgggct ccaacgagaa tatccactcc atccacttca gcggccacgt gttcaccgtg

1086010860

cggaaaaaag aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc cggaaaaaag aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc

1092010920

gttgagatgc tgcctagcaa ggccggaatt tggagagtgg aatgtctgat tggagagcac gttgagatgc tgcctagcaa ggccggaatt tggagagtgg aatgtctgat tggagagcac

1098010980

ctccacgccg ggatgagcac cctgtttctg gtgtactcca acaagtgtca gacccctctc ctccacgccg ggatgagcac cctgtttctg gtgtactcca acaagtgtca gacccctctc

1104011040

ggcatggcct ctggccacat tagagacttc cagatcaccg ccagcggaca gtatggacag ggcatggcct ctggccacat tagagacttc cagatcaccg ccagcggaca gtatggacag

1110011100

tgggccccta aactggccag actgcactac tccggcagca tcaatgcctg gtccaccaaa tgggccccta aactggccag actgcactac tccggcagca tcaatgcctg gtccaccaaa

1116011160

gagcctttca gctggatcaa agtggacctg ctggctccca tgatcatcca cggaatcaag gagcctttca gctggatcaa agtggacctg ctggctccca tgatcatcca cggaatcaag

1122011220

acccagggcg ccagacaaaa gttcagcagc ctgtacatca gccagttcat catcatgtac acccagggcg ccagacaaaa gttcagcagc ctgtacatca gccagttcat catcatgtac

1128011280

agcctggacg gaaagaagtg gcagacctac cggggcaata gcaccggcac actgatggtg agcctggacg gaaagaagtg gcagacctac cggggcaata gcaccggcac actgatggtg

1134011340

ttcttcggca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt ttcttcggca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt

1140011400

gcccggtaca tccggctgca ccccacacac tacagcatca ggtctaccct gagaatggaa gcccggtaca tccggctgca ccccacacac tacagcatca ggtctaccct gagaatggaa

1146011460

ctgatgggct gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc ctgatgggct gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc

1152011520

agcgacgccc agatcacagc ctctagctac ttcaccaaca tgttcgccac ttggagcccc agcgacgccc agatcacagc ctctagctac ttcaccaaca tgttcgccac ttggagcccc

1158011580

tctaaggccc ggcttcatct gcaaggcaga agcaacgctt ggaggcccca agtgaacaac tctaaggccc ggcttcatct gcaaggcaga agcaacgctt ggaggcccca agtgaacaac

1164011640

cccaaagaat ggctccaggt ggactttcag aaaaccatga aagtgacagg cgtgaccaca cccaaagaat ggctccaggt ggactttcag aaaaccatga aagtgacagg cgtgaccaca

1170011700

cagggcgtca agtccctgct gacctctatg tacgtgaaag agtttctgat cagctccagc cagggcgtca agtccctgct gacctctatg tacgtgaaag agtttctgat cagctccagc

1176011760

caggacggcc accagtggac cctgttcttc cagaacggca aagtgaaagt gttccaggga caggacggcc accagtggac cctgttcttc cagaacggca aagtgaaagt gttccaggga

1182011820

aatcaggaca gcttcacacc cgtggtcaat agtctggacc caccactgct gacccgctac aatcaggaca gcttcacacc cgtggtcaat agtctggacc caccactgct gacccgctac

1188011880

ctgcgaattc accctcagtc ttgggtgcac cagattgccc tgcggatgga agtgctgggc ctgcgaattc accctcagtc ttgggtgcac cagattgccc tgcggatgga agtgctgggc

1194011940

tgtgaagctc aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tgtgaagctc aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata

1200012000

tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg

1206012060

gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca

1212012120

aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt

1218012180

acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg

1224012240

gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct

1230012300

cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc

1236012360

aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca

1242012420

ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac

1248012480

tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt

1254012540

ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc

1260012600

cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg

1266012660

catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca

1272012720

agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc

1278012780

tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga

1284012840

ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc

1290012900

cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct

1296012960

gcctgcaggg gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat gcctgcaggg gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat

1302013020

cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct

1308013080

ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc

1314013140

ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc

1320013200

actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg

1326013260

atcactgata tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt atcactgata tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt

1332013320

tgtcattttt aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc tgtcattttt aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc

1338013380

actcttccct aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt actcttccct aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt

1344013440

tgtccgccca cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa tgtccgccca cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa

1350013500

ctccatgtga caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctccatgtga caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt

1356013560

ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc

1362013620

tgaatggcga atgg tgaatggcga atgg

1363413634

<210> 195<210> 195

<211> 10952<211> 10952

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 195<400> 195

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca

43804380

aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct

44404440

gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca

45004500

gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc

45604560

agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat agtggaagct gtacactgcc caggcaaagc gtccggggcag cgtaggcggg cgactcagat

46204620

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat

46804680

attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac

47404740

agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc

48004800

taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc

48604860

tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag

49204920

ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat

49804980

tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc

50405040

gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg

51005100

tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg

51605160

cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc

52205220

atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat

52805280

tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac

53405340

gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc

54005400

cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc

54605460

aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc

55205520

aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc

55805580

aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct

56405640

agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg

57005700

atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag

57605760

gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc

58205820

ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag

58805880

tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag

59405940

gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac

60006000

tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc

60606060

cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat

61206120

atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga

61806180

agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa

62406240

gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag

63006300

agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc

63606360

aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc

64206420

ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct

64806480

ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac

65406540

cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc

66006600

ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag

66606660

atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg

67206720

tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat

67806780

cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg

68406840

cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag

69006900

accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag

69606960

gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc

70207020

ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg

70807080

ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac

71407140

atcagcgcct acctgctgag caagaacaat gccatcgagc ctcggagctt cagccagaat atcagcgcct acctgctgag caagaacaat gccatcgagc ctcggagctt cagccagaat

72007200

cctcctgtgc tgaagcggca ccagcgcgag atcaccagaa caaccctgca gagcgaccaa cctcctgtgc tgaagcggca ccagcgcgag atcaccagaa caaccctgca gagcgaccaa

72607260

gaggaaatcg attacgacga caccatcagc gtcgagatga agaaagaaga tttcgacatc gaggaaatcg attacgacga caccatcagc gtcgagatga agaaagaaga tttcgacatc

73207320

tacgacgagg acgagaatca gagccccaga agctttcaga aaaagacccg gcactacttc tacgacgagg acgagaatca gagccccaga agctttcaga aaaagacccg gcactacttc

73807380

attgccgccg tcgagagact gtgggactac ggcatgtcta gcagccctca cgtgctgaga attgccgccg tcgagagact gtgggactac ggcatgtcta gcagccctca cgtgctgaga

74407440

aatagagccc agagcggcag cgtgccccag ttcaagaaag tggtgttcca agagttcacc aatagagccc agagcggcag cgtgccccag ttcaagaaag tggtgttcca agagttcacc

75007500

gacggcagct tcacccagcc actgtataga ggcgagctga acgagcatct gggcctgctg gacggcagct tcacccagcc actgtataga ggcgagctga acgagcatct gggcctgctg

75607560

ggcccttata tcagagccga agtggaagat aacatcatgg tcaccttccg gaatcaggct ggcccttata tcagagccga agtggaagat aacatcatgg tcaccttccg gaatcaggct

76207620

agccggcctt acagcttcta cagctccctg atcagctacg aagaggacca gagacagggc agccggcctt acagcttcta cagctccctg atcagctacg aagaggacca gagacagggc

76807680

gctgagccca gaaagaactt cgtgaagccc aacgagacta agacctactt ttggaaggtg gctgagccca gaaagaactt cgtgaagccc aacgagacta agacctactt ttggaaggtg

77407740

cagcaccaca tggcccctac aaaggacgag ttcgactgca aagcctgggc ctacttctcc cagcaccaca tggcccctac aaaggacgag ttcgactgca aagcctgggc ctacttctcc

78007800

gatgtggatc tggaaaagga cgtgcacagc gggctcatcg gaccactgct tgtgtgccac gatgtggatc tggaaaagga cgtgcacagc gggctcatcg gaccactgct tgtgtgccac

78607860

accaacacac tgaaccccgc tcacggcaga caagtgacag tgcaagagtt cgccctgttc accaacacac tgaaccccgc tcacggcaga caagtgacag tgcaagagtt cgccctgttc

79207920

ttcaccatct tcgacgaaac aaagagctgg tacttcaccg agaatatgga acggaactgc ttcaccatct tcgacgaaac aaagagctgg tacttcaccg agaatatgga acggaactgc

79807980

agagcccctt gcaacatcca gatggaagat cccaccttca aagagaacta ccggttccac agagcccctt gcaacatcca gatggaagat cccaccttca aagagaacta ccggttccac

80408040

gccatcaacg gctacatcat ggacacactg cccggcctgg ttatggccca ggatcagaga gccatcaacg gctacatcat ggacacactg cccggcctgg ttatggccca ggatcagaga

81008100

atccggtggt atctgctgtc catgggctcc aacgagaata tccacagcat ccacttcagc atccggtggt atctgctgtc catgggctcc aacgagaata tccacagcat ccacttcagc

81608160

ggccacgtgt tcaccgtgcg gaaaaaagaa gagtacaaaa tggccctgta caatctgtac ggccacgtgt tcaccgtgcg gaaaaaagaa gagtacaaaa tggccctgta caatctgtac

82208220

cctggggtgt tcgaaaccgt ggaaatgctg ccttccaagg ccggcatttg gagagtggaa cctggggtgt tcgaaaccgt ggaaatgctg ccttccaagg ccggcatttg gagagtggaa

82808280

tgtctgattg gagagcacct ccacgccgga atgagcaccc tgtttctggt gtacagcaac tgtctgattg gagagcacct ccacgccgga atgagcaccc tgtttctggt gtacagcaac

83408340

aagtgtcaga cccctctcgg catggcctct ggacacatca gagacttcca gatcaccgcc aagtgtcaga cccctctcgg catggcctct ggacacatca gagacttcca gatcaccgcc

84008400

tctggccagt acggacagtg ggctcctaaa ctggctcggc tgcactacag cggcagcatc tctggccagt acggacagtg ggctcctaaa ctggctcggc tgcactacag cggcagcatc

84608460

aatgcctggt ccaccaaaga gcccttcagc tggatcaagg tggacctgct ggctcccatg aatgcctggt ccaccaaaga gcccttcagc tggatcaagg tggacctgct ggctcccatg

85208520

atcatccacg gaatcaagac ccagggcgcc agacagaagt tcagcagcct gtacatcagc atcatccacg gaatcaagac ccagggcgcc agacagaagt tcagcagcct gtacatcagc

85808580

cagttcatca tcatgtacag cctggacggc aagaagtggc agacctacag aggcaacagc cagttcatca tcatgtacag cctggacggc aagaagtggc agacctacag aggcaacagc

86408640

accggcacac tcatggtgtt cttcggcaac gtggactcca gcggcattaa gcacaacatc accggcacac tcatggtgtt cttcggcaac gtggactcca gcggcattaa gcacaacatc

87008700

ttcaaccctc caatcattgc ccggtacatc cggctgcacc ccacacacta cagcatccgg ttcaaccctc caatcattgc ccggtacatc cggctgcacc ccacacacta cagcatccgg

87608760

tctaccctga gaatggaact gatgggctgc gacctgaaca gctgctctat gcccctcgga tctaccctga gaatggaact gatgggctgc gacctgaaca gctgctctat gcccctcgga

88208820

atggaaagca aggccatcag cgacgcccag atcacagcca gcagctactt caccaacatg atggaaagca aggccatcag cgacgcccag atcacagcca gcagctactt caccaacatg

88808880

ttcgccactt ggagcccctc caaggctaga ctgcatctgc agggcagaag caacgcttgg ttcgccactt ggagcccctc caaggctaga ctgcatctgc agggcagaag caacgcttgg

89408940

aggccccaag tgaacaaccc caaagagtgg ctgcaggttg actttcaaaa gaccatgaaa aggccccaag tgaacaaccc caaagagtgg ctgcaggttg actttcaaaa gaccatgaaa

90009000

gtgaccggcg tgaccacaca gggcgtcaag tctctgctga cctctatgta cgtgaaagag gtgaccggcg tgaccacaca gggcgtcaag tctctgctga cctctatgta cgtgaaagag

90609060

ttcctgatct ccagcagcca ggacggccat cagtggaccc tgtttttcca gaacggcaaa ttcctgatct ccagcagcca ggacggccat cagtggaccc tgtttttcca gaacggcaaa

91209120

gtgaaagtgt tccagggcaa tcaggacagc ttcacacccg tggtcaattc tctggaccct gtgaaagtgt tccagggcaa tcaggacagc ttcacacccg tggtcaattc tctggaccct

91809180

ccactgctga ccagatacct gcggattcac cctcagtctt gggtgcacca gatcgctctg ccactgctga ccagatacct gcggattcac cctcagtctt gggtgcacca gatcgctctg

92409240

cggatggaag tgctgggctg tgaagctcag gacctctact agttaattaa gagcatctta cggatggaag tgctgggctg tgaagctcag gacctctact agttaattaa gagcatctta

93009300

ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta

93609360

ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag

94209420

gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg

94809480

ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg

95409540

ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc

96009600

gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt

96609660

tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca

97209720

ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc

97809780

cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt

98409840

tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg

99009900

tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct

99609960

aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg

1002010020

gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg

1008010080

cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca

1014010140

ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc

1020010200

tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga

1026010260

gcgagcgagc gcgcagctgc ctgcaggggc gcgcctcgag gcatgcggta ccaagcttgt gcgagcgagc gcgcagctgc ctgcaggggc gcgcctcgag gcatgcggta ccaagcttgt

1032010320

cgagaagtac tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt cgagaagtac tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt

1038010380

aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt

1044010440

taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac

1050010500

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc

1056010560

ttatcatgtc tggatctgat cactgatatc gcctaggaga tccgaaccag ataagtgaaa ttatcatgtc tggatctgat cactgatatc gcctaggaga tccgaaccag ataagtgaaa

1062010620

tctagttcca aactattttg tcatttttaa ttttcgtatt agcttacgac gctacaccca tctagttcca aactattttg tcatttttaa ttttcgtatt agcttacgac gctacaccca

1068010680

gttcccatct attttgtcac tcttccctaa ataatcctta aaaactccat ttccacccct gttcccatct attttgtcac tcttccctaa ataatcctta aaaactccat ttccacccct

1074010740

cccagttccc aactattttg tccgcccaca gcggggcatt tttcttcctg ttatgttttt cccagttccc aactattttg tccgcccaca gcggggcatt tttcttcctg ttatgttttt

1080010800

aatcaaacat cctgccaact ccatgtgaca aaccgtcatc ttcggctact ttttctctgt aatcaaacat cctgccaact ccatgtgaca aaccgtcatc ttcggctact ttttctctgt

1086010860

cacagaatga aaatttttct gtcatctctt cgttattaat gtttgtaatt gactgaatat cacagaatga aaatttttct gtcatctctt cgttattaat gtttgtaatt gactgaatat

1092010920

caacgcttat ttgcagcctg aatggcgaat gg caacgcttat ttgcagcctg aatggcgaat gg

1095210952

<210> 196<210> 196

<211> 14266<211> 14266

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 196<400> 196

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc

43804380

ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt

44404440

ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgaggtg

45004500

ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg

45604560

ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt

46204620

atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg

46804680

agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc

47404740

ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc

48004800

accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac

48604860

ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca

49204920

ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat

49804980

gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag

50405040

ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg

51005100

caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg

51605160

ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca

52205220

cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc

52805280

gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt

53405340

ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta

54005400

ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt

54605460

ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt ggttcattct caagcctcag acagtggttc aaagtttttt tcttccatt caggtgtcgt

55205520

gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc

55805580

tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg

56405640

actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc

57005700

ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca

57605760

ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta

58205820

caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc

58805880

ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg

59405940

acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca

60006000

cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga

60606060

catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag

61206120

ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt

61806180

tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca

62406240

gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga

63006300

acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact acggctacgt gaacagaagc ctgcctggac tgatcggctg cccagaaag tccgtgtact

63606360

ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca

64206420

ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga

64806480

ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc

65406540

accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc

66006600

tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga

66606660

tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg

67206720

ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt

67806780

acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg

68406840

gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga

69006900

cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg

69606960

gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca

70207020

tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg

70807080

tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg

71407140

tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca

72007200

gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct

72607260

acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc

73207320

tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc

73807380

tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc

74407440

actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg

75007500

cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg

75607560

gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg

76207620

gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca

76807680

gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca

77407740

ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca

78007800

atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc

78607860

agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc

79207920

acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga

79807980

gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa

80408040

ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga

81008100

cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc

81608160

tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg

82208220

acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg

82808280

ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata

83408340

gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc

84008400

ctctgtctct gagcgaggaa aacaacgaca gcaagctgct ggaatccggc ctgatgaaca ctctgtctct gagcgaggaa aacaacgaca gcaagctgct ggaatccggc ctgatgaaca

84608460

gccaagagtc ctcctggggc aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gccaagagtc ctcctggggc aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg

85208520

gaaagagagc ccacggacct gctctgctga ccaaggataa cgccctgttc aaagtgtcca gaaagagagc ccacggacct gctctgctga ccaaggataa cgccctgttc aaagtgtcca

85808580

tcagcctgct caagaccaac aagacctcca acaactccgc caccaacaga aagacccaca tcagcctgct caagaccaac aagacctcca acaactccgc caccaacaga aagacccaca

86408640

tcgacggccc tagcctgctg atcgagaata gccctagcgt ctggcagaat atcctggaaa tcgacggccc tagcctgctg atcgagaata gccctagcgt ctggcagaat atcctggaaa

87008700

gcgacaccga gttcaagaaa gtgacccctc tgatccacga ccggatgctc atggacaaga gcgacaccga gttcaagaaa gtgacccctc tgatccacga ccggatgctc atggacaaga

87608760

acgccaccgc tctgcggctg aaccacatga gcaacaagac aaccagcagc aagaatatgg acgccaccgc tctgcggctg aaccacatga gcaacaagac aaccagcagc aagaatatgg

88208820

aaatggtgca gcagaagaaa gagggcccca ttcctccaga cgctcagaac cccgatatga aaatggtgca gcagaagaaa gagggcccca ttcctccaga cgctcagaac cccgatatga

88808880

gcttcttcaa gatgctcttt ctgcccgaga gcgcccggtg gattcagaga acacacggca gcttcttcaa gatgctcttt ctgcccgaga gcgcccggtg gattcagaga acacacggca

89408940

agaactccct gaactccggc cagggacctt ctccaaagca gctggtttcc ctgggacctg agaactccct gaactccggc cagggacctt ctccaaagca gctggtttcc ctgggacctg

90009000

agaagtccgt ggaaggacag aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg agaagtccgt ggaaggacag aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg

90609060

gcgagttcac caaggatgtg ggcctgaaag agatggtctt tcccagcagc cggaacctgt gcgagttcac caaggatgtg ggcctgaaag agatggtctt tcccagcagc cggaacctgt

91209120

tcctgaccaa cctggacaac ctgcacgaga acaacaccca caatcaagag aagaagatcc tcctgaccaa cctggacaac ctgcacgaga acaacaccca caatcaagag aagaagatcc

91809180

aagaggaaat cgaaaagaaa gagacactca tccaagagaa cgtggtgctg cctcagatcc aagaggaaat cgaaaagaaa gagacactca tccaagagaa cgtggtgctg cctcagatcc

92409240

acacagtgac cggcaccaag aactttatga agaatctgtt cctgctgagt acccggcaga acacagtgac cggcaccaag aactttatga agaatctgtt cctgctgagt acccggcaga

93009300

acgtggaagg cagctacgat ggcgcttatg cccctgtgct gcaggacttc agatccctga acgtggaagg cagctacgat ggcgcttatg cccctgtgct gcaggacttc agatccctga

93609360

acgactccac caatcggaca aagaagcaca cagcccactt ctccaagaag ggcgaagaag acgactccac caatcggaca aagaagcaca cagcccactt ctccaagaag ggcgaagaag

94209420

agaacctgga aggactgggc aatcagacca agcagatcgt cgagaagtac gcctgcacca agaacctgga aggactgggc aatcagacca agcagatcgt cgagaagtac gcctgcacca

94809480

ccagaatcag ccccaacaca agccagcaga acttcgtgac ccagcggagc aaaagagccc ccagaatcag ccccaacaca agccagcaga acttcgtgac ccagcggagc aaaagagccc

95409540

tgaagcagtt tcggctgccc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg tgaagcagtt tcggctgccc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg

96009600

acaccagcac acagtggtcc aagaacatga agcacttgac ccctagcaca ctgacccaga acaccagcac acagtggtcc aagaacatga agcacttgac ccctagcaca ctgacccaga

96609660

tcgactacaa cgagaaagag aagggcgcta tcacacagag cccactgagc gactgtctga tcgactacaa cgagaaagag aagggcgcta tcacacagag cccactgagc gactgtctga

97209720

ccagaagcca cagcatccct caggccaaca gatcccctct gccaatcgcc aaagtgtcta ccagaagcca cagcatccct caggccaaca gatcccctct gccaatcgcc aaagtgtcta

97809780

gcttccccag catcagaccc atctacctga ccagagtgct gttccaggac aacagcagcc gcttccccag catcagaccc atctacctga cgagtgct gttccaggac aacagcagcc

98409840

atctgccagc cgccagctac cggaagaaag attctggcgt gcaagagagc agccactttc atctgccagc cgccagctac cggaagaaag attctggcgt gcaagagagc agccactttc

99009900

tgcagggcgc taagaagaac aatctgagcc tggctattct gaccctggaa atgaccggcg tgcagggcgc taagaagaac aatctgagcc tggctattct gaccctggaa atgaccggcg

99609960

atcagagaga agtcggctct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg atcagagaga agtcggctct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg

1002010020

tggaaaacac cgtgctgcct aagcctgacc tgccaaagac aagcggcaag gtggaactgc tggaaaacac cgtgctgcct aagcctgacc tgccaaagac aagcggcaag gtggaactgc

1008010080

tgccaaaggt gcacatctac cagaaggacc tgtttcctac cgagacaagc aacggctctc tgccaaaggt gcacatctac cagaaggacc tgtttcctac cgagacaagc aacggctctc

1014010140

ccggccatct ggatctggtg gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ccggccatct ggatctggtg gaaggatctc tgctgcaggg aaccgagggc gccatcaagt

1020010200

ggaacgaggc caatagacct ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ggaacgaggc caatagacct ggcaaggtgc ccttcctgag agtggccaca gagtccagcg

1026010260

ccaagacacc ctctaaactg ctggaccctc tggcctggga caaccactat ggcactcaga ccaagacacc ctctaaactg ctggaccctc tggcctggga caaccactat ggcactcaga

1032010320

tccccaaaga ggaatggaag tcccaagaga agtcccctga aaagaccgcc ttcaagaaga tccccaaaga ggaatggaag tcccaagaga agtcccctga aaagaccgcc ttcaagaaga

1038010380

aggacaccat tctgtccctg aatgcctgcg agagcaacca cgccattgcc gccatcaatg aggacaccat tctgtccctg aatgcctgcg agagcaacca cgccattgcc gccatcaatg

1044010440

agggccagaa caagcccgag atcgaagtga cctgggccaa gcagggaaga accgagagac agggccagaa caagcccgag atcgaagtga cctgggccaa gcagggaaga accgagagac

1050010500

tgtgtagcca gaatcctcct gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgtgtagcca gaatcctcct gtgctgaagc ggcaccagag agaaatcacc cggaccacac

1056010560

tgcagagcga ccaagaagag atcgattacg acgataccat cagcgtcgag atgaagaaag tgcagagcga ccaagaagag atcgattacg acgataccat cagcgtcgag atgaagaaag

1062010620

aagatttcga catctacgac gaggacgaga atcagagccc tcggagcttc cagaagaaaa aagatttcga catctacgac gaggacgaga atcagagccc tcggagcttc cagaagaaaa

1068010680

ccaggcacta ctttattgcc gccgtcgagc ggctgtggga ctacggaatg tctagctctc ccaggcacta ctttattgcc gccgtcgagc ggctgtggga ctacggaatg tctagctctc

1074010740

ctcacgtgct gcggaataga gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt ctcacgtgct gcggaataga gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt

1080010800

tccaagagtt caccgacggc agcttcaccc agccactgta tagaggcgag ctgaacgagc tccaagagtt caccgacggc agcttcaccc agccactgta tagaggcgag ctgaacgagc

1086010860

atctgggcct gctgggccct tatatcagag ccgaagtgga agataacatc atggtcacct atctgggcct gctgggccct tatatcagag ccgaagtgga agataacatc atggtcacct

1092010920

tccggaatca ggctagccgg ccttacagct tctacagctc cctgatctcc tacgaagagg tccggaatca ggctagccgg ccttacagct tctacagctc cctgatctcc tacgaagagg

1098010980

accagagaca gggcgcagag ccccggaaga atttcgtgaa gcccaacgag actaagacct accagagaca gggcgcagag ccccggaaga atttcgtgaa gcccaacgag actaagacct

1104011040

acttttggaa ggtgcagcac catatggccc ctacaaagga cgagttcgac tgcaaagcct acttttggaa ggtgcagcac catatggccc ctacaaagga cgagttcgac tgcaaagcct

1110011100

gggcctactt ctccgatgtg gacctcgaaa aggacgtgca cagcggactc atcggcccac gggcctactt ctccgatgtg gacctcgaaa aggacgtgca cagcggactc atcggcccac

1116011160

tgcttgtgtg ccacaccaac acactgaacc ccgctcacgg cagacaagtg acagtgcaag tgcttgtgtg ccacaccaac acactgaacc ccgctcacgg cagacaagtg acagtgcaag

1122011220

agttcgccct gtttttcacc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca agttcgccct gtttttcacc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca

1128011280

tggaaagaaa ctgcagggcc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga tggaaagaaa ctgcagggcc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga

1134011340

actaccggtt ccacgccatc aacggctaca tcatggacac actgcccggc ctggttatgg actaccggtt ccacgccatc aacggctaca tcatggacac actgcccggc ctggttatgg

1140011400

cccaggatca gagaatccgg tggtatctgc tgtccatggg ctccaacgag aatatccact cccaggatca gagaatccgg tggtatctgc tgtccatggg ctccaacgag aatatccact

1146011460

ccatccactt cagcggccac gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc ccatccactt cagcggccac gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc

1152011520

tgtacaatct gtaccctggg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tgtacaatct gtaccctggg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa

1158011580

tttggagagt ggaatgtctg attggagagc acctccacgc cgggatgagc accctgtttc tttggagagt ggaatgtctg attggagagc acctccacgc cgggatgagc accctgtttc

1164011640

tggtgtactc caacaagtgt cagacccctc tcggcatggc ctctggccac attagagact tggtgtactc caacaagtgt cagacccctc tcggcatggc ctctggccac attagagact

1170011700

tccagatcac cgccagcgga cagtatggac agtgggcccc taaactggcc agactgcact tccagatcac cgccagcgga cagtatggac agtgggcccc taaactggcc agactgcact

1176011760

actccggcag catcaatgcc tggtccacca aagagccttt cagctggatc aaagtggacc actccggcag catcaatgcc tggtccacca aagagccttt cagctggatc aaagtggacc

1182011820

tgctggctcc catgatcatc cacggaatca agacccaggg cgccagacaa aagttcagca tgctggctcc catgatcatc cacggaatca agacccaggg cgccagacaa aagttcagca

1188011880

gcctgtacat cagccagttc atcatcatgt acagcctgga cggaaagaag tggcagacct gcctgtacat cagccagttc atcatcatgt acagcctgga cggaaagaag tggcagacct

1194011940

accggggcaa tagcaccggc acactgatgg tgttcttcgg caacgtggac tccagcggca accggggcaa tagcaccggc acactgatgg tgttcttcgg caacgtggac tccagcggca

1200012000

ttaagcacaa catcttcaac cctccaatca ttgcccggta catccggctg caccccacac ttaagcacaa catcttcaac cctccaatca ttgcccggta catccggctg caccccacac

1206012060

actacagcat caggtctacc ctgagaatgg aactgatggg ctgcgacctg aacagctgct actacagcat caggtctacc ctgagaatgg aactgatggg ctgcgacctg aacagctgct

1212012120

ctatgcccct cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gcctctagct ctatgcccct cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gcctctagct

1218012180

acttcaccaa catgttcgcc acttggagcc cctctaaggc ccggcttcat ctgcaaggca acttcaccaa catgttcgcc acttggagcc cctctaaggc ccggcttcat ctgcaaggca

1224012240

gaagcaacgc ttggaggccc caagtgaaca accccaaaga atggctccag gtggactttc gaagcaacgc ttggaggccc caagtgaaca accccaaaga atggctccag gtggactttc

1230012300

agaaaaccat gaaagtgaca ggcgtgacca cacagggcgt caagtccctg ctgacctcta agaaaaccat gaaagtgaca ggcgtgacca cacagggcgt caagtccctg ctgacctcta

1236012360

tgtacgtgaa agagtttctg atcagctcca gccaggacgg ccaccagtgg accctgttct tgtacgtgaa agagtttctg atcagctcca gccaggacgg ccaccagtgg accctgttct

1242012420

tccagaacgg caaagtgaaa gtgttccagg gaaatcagga cagcttcaca cccgtggtca tccagaacgg caaagtgaaa gtgttccagg gaaatcagga cagcttcaca cccgtggtca

1248012480

atagtctgga cccaccactg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc atagtctgga cccaccactg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc

1254012540

accagattgc cctgcggatg gaagtgctgg gctgtgaagc tcaggacctc tactagttaa accagattgc cctgcggatg gaagtgctgg gctgtgaagc tcaggacctc tactagttaa

1260012600

ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat

1266012660

acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt

1272012720

aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt

1278012780

acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat

1284012840

tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct

1290012900

agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc

1296012960

tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc

1302013020

tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt

1308013080

cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg

1314013140

gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg

1320013200

ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc

1326013260

cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc

1332013320

tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag

1338013380

gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca

1344013440

tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact

1350013500

ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg

1356013560

ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc

1362013620

ggtaccaagc ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag ggtaccaagc ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag

1368013680

gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat

1374013740

gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc

1380013800

atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa

1386013860

ctcatcaatg tatcttatca tgtctggatc tgatcactga tatcgcctag gagatccgaa ctcatcaatg tatcttatca tgtctggatc tgatcactga tatcgcctag gagatccgaa

1392013920

ccagataagt gaaatctagt tccaaactat tttgtcattt ttaattttcg tattagctta cgataagt gaaatctagt tccaaactat tttgtcattt ttaattttcg tattagctta

1398013980

cgacgctaca cccagttccc atctattttg tcactcttcc ctaaataatc cttaaaaact cgacgctaca cccagttccc atctattttg tcactcttcc ctaaataatc cttaaaaact

1404014040

ccatttccac ccctcccagt tcccaactat tttgtccgcc cacagcgggg catttttctt ccatttccac ccctcccagt tcccaactat tttgtccgcc cacagcgggg catttttctt

1410014100

cctgttatgt ttttaatcaa acatcctgcc aactccatgt gacaaaccgt catcttcggc cctgttatgt ttttaatcaa acatcctgcc aactccatgt gacaaaccgt catcttcggc

1416014160

tactttttct ctgtcacaga atgaaaattt ttctgtcatc tcttcgttat taatgtttgt tactttttct ctgtcacaga atgaaaattt ttctgtcatc tcttcgttat taatgtttgt

1422014220

aattgactga atatcaacgc ttatttgcag cctgaatggc gaatgg aattgactga atatcaacgc ttatttgcag cctgaatggc gaatgg

1426614266

<210> 197<210> 197

<211> 11584<211> 11584

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 197<400> 197

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc

43804380

ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt

44404440

ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgaggtg

45004500

ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg

45604560

ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt

46204620

atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg

46804680

agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc

47404740

ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc

48004800

accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac

48604860

ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca

49204920

ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat

49804980

gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag

50405040

ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg

51005100

caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg

51605160

ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca

52205220

cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc

52805280

gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt

53405340

ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta

54005400

ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt

54605460

ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt ggttcattct caagcctcag acagtggttc aaagtttttt tcttccatt caggtgtcgt

55205520

gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc

55805580

tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg

56405640

actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc

57005700

ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca

57605760

ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta

58205820

caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc

58805880

ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg

59405940

acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca

60006000

cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga

60606060

catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag

61206120

ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt

61806180

tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca

62406240

gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga

63006300

acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact acggctacgt gaacagaagc ctgcctggac tgatcggctg cccagaaag tccgtgtact

63606360

ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca

64206420

ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga

64806480

ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc

65406540

accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc

66006600

tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga

66606660

tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg

67206720

ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt

67806780

acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg

68406840

gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga

69006900

cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg

69606960

gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca

70207020

tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg

70807080

tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg

71407140

tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca

72007200

gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct

72607260

acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc

73207320

tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc

73807380

tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc

74407440

actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg

75007500

cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg

75607560

gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg

76207620

gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca

76807680

gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca

77407740

ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca

78007800

atgccatcga gcctcggagc ttcagccaga atcctcctgt gctgaagcgg caccagcgcg atgccatcga gcctcggagc ttcagccaga atcctcctgt gctgaagcgg caccagcgcg

78607860

agatcaccag aacaaccctg cagagcgacc aagaggaaat cgattacgac gacaccatca agatcaccag aacaaccctg cagagcgacc aagaggaaat cgattacgac gacaccatca

79207920

gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat cagagcccca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat cagagcccca

79807980

gaagctttca gaaaaagacc cggcactact tcattgccgc cgtcgagaga ctgtgggact gaagctttca gaaaaagacc cggcactact tcattgccgc cgtcgagaga ctgtgggact

80408040

acggcatgtc tagcagccct cacgtgctga gaaatagagc ccagagcggc agcgtgcccc acggcatgtc tagcagccct cacgtgctga gaaatagagc ccagagcggc agcgtgcccc

81008100

agttcaagaa agtggtgttc caagagttca ccgacggcag cttcacccag ccactgtata agttcaagaa agtggtgttc caagagttca ccgacggcag cttcacccag ccactgtata

81608160

gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc gaagtggaag gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc gaagtggaag

82208220

ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc tacagctccc ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc tacagctccc

82808280

tgatcagcta cgaagaggac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc tgatcagcta cgaagaggac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc

83408340

ccaacgagac taagacctac ttttggaagg tgcagcacca catggcccct acaaaggacg ccaacgagac taagacctac ttttggaagg tgcagcacca catggcccct acaaaggacg

84008400

agttcgactg caaagcctgg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca agttcgactg caaagcctgg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca

84608460

gcgggctcat cggaccactg cttgtgtgcc acaccaacac actgaacccc gctcacggca gcgggctcat cggaccactg cttgtgtgcc acaccaacac actgaacccc gctcacggca

85208520

gacaagtgac agtgcaagag ttcgccctgt tcttcaccat cttcgacgaa acaaagagct gacaagtgac agtgcaagag ttcgccctgt tcttcaccat cttcgacgaa acaaagagct

85808580

ggtacttcac cgagaatatg gaacggaact gcagagcccc ttgcaacatc cagatggaag ggtacttcac cgagaatatg gaacggaact gcagagcccc ttgcaacatc cagatggaag

86408640

atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc atggacacac atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc atggacacac

87008700

tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg tccatgggct tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg tccatgggct

87608760

ccaacgagaa tatccacagc atccacttca gcggccacgt gttcaccgtg cggaaaaaag ccaacgagaa tatccacagc atccacttca gcggccacgt gttcaccgtg cggaaaaaag

88208820

aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc gtggaaatgc aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc gtggaaatgc

88808880

tgccttccaa ggccggcatt tggagagtgg aatgtctgat tggagagcac ctccacgccg tgccttccaa ggccggcatt tggagagtgg aatgtctgat tggagagcac ctccacgccg

89408940

gaatgagcac cctgtttctg gtgtacagca acaagtgtca gacccctctc ggcatggcct gaatgagcac cctgtttctg gtgtacagca acaagtgtca gacccctctc ggcatggcct

90009000

ctggacacat cagagacttc cagatcaccg cctctggcca gtacggacag tgggctccta ctggacacat cagagacttc cagatcaccg cctctggcca gtacggacag tgggctccta

90609060

aactggctcg gctgcactac agcggcagca tcaatgcctg gtccaccaaa gagcccttca aactggctcg gctgcactac agcggcagca tcaatgcctg gtccaccaaa gagcccttca

91209120

gctggatcaa ggtggacctg ctggctccca tgatcatcca cggaatcaag acccagggcg gctggatcaa ggtggacctg ctggctccca tgatcatcca cggaatcaag acccaggcg

91809180

ccagacagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg cgacagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg

92409240

gcaagaagtg gcagacctac agaggcaaca gcaccggcac actcatggtg ttcttcggca gcaagaagtg gcagacctac agaggcaaca gcaccggcac actcatggtg ttcttcggca

93009300

acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt gcccggtaca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt gcccggtaca

93609360

tccggctgca ccccacacac tacagcatcc ggtctaccct gagaatggaa ctgatgggct tccggctgca ccccacacac tacagcatcc ggtctaccct gagaatggaa ctgatgggct

94209420

gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc agcgacgccc gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc agcgacgccc

94809480

agatcacagc cagcagctac ttcaccaaca tgttcgccac ttggagcccc tccaaggcta agatcacagc cagcagctac ttcaccaaca tgttcgccac ttggagcccc tccaaggcta

95409540

gactgcatct gcagggcaga agcaacgctt ggaggcccca agtgaacaac cccaaagagt gactgcatct gcagggcaga agcaacgctt ggaggcccca agtgaacaac cccaaagagt

96009600

ggctgcaggt tgactttcaa aagaccatga aagtgaccgg cgtgaccaca cagggcgtca ggctgcaggt tgactttcaa aagaccatga aagtgaccgg cgtgaccaca cagggcgtca

96609660

agtctctgct gacctctatg tacgtgaaag agttcctgat ctccagcagc caggacggcc agtctctgct gacctctatg tacgtgaaag agttcctgat ctccagcagc caggacggcc

97209720

atcagtggac cctgtttttc cagaacggca aagtgaaagt gttccagggc aatcaggaca atcagtggac cctgtttttc cagaacggca aagtgaaagt gttccagggc aatcaggaca

97809780

gcttcacacc cgtggtcaat tctctggacc ctccactgct gaccagatac ctgcggattc gcttcacacc cgtggtcaat tctctggacc ctccactgct gaccagatac ctgcggattc

98409840

accctcagtc ttgggtgcac cagatcgctc tgcggatgga agtgctgggc tgtgaagctc accctcagtc ttgggtgcac cagatcgctc tgcggatgga agtgctgggc tgtgaagctc

99009900

aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tttgttctgt aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tttgttctgt

99609960

ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt

1002010020

acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa

1008010080

gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg

1014010140

tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc

1020010200

tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta

1026010260

taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt

1032010320

ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca

1038010380

actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc

1044010440

ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt

1050010500

gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac

1056010560

cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg

1062010620

tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga

1068010680

ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc tagagcatgg ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc tagagcatgg

1074010740

ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga ggaaccccta ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga ggaaccccta

1080010800

gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca

1086010860

aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg

1092010920

gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat cataatcagc gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat cataatcagc

1098010980

cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac

1104011040

ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt

1110011100

tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct

1116011160

agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg atcactgata agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg atcactgata

1122011220

tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt tgtcattttt tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt tgtcattttt

1128011280

aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc actcttccct aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc actcttccct

1134011340

aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt tgtccgccca aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt tgtccgccca

1140011400

cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa ctccatgtga cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa ctccatgtga

1146011460

caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctgtcatctc caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctgtcatctc

1152011520

ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc tgaatggcga ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc tgaatggcga

1158011580

atgg atgg

1158411584

<210> 198<210> 198

<211> 11558<211> 11558

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 198<400> 198

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca

43804380

aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct

44404440

gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca

45004500

gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc

45604560

agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat agtggaagct gtacactgcc caggcaaagc gtccggggcag cgtaggcggg cgactcagat

46204620

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat

46804680

attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac

47404740

agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc

48004800

taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc

48604860

tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag

49204920

ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat

49804980

tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc

50405040

gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg

51005100

tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg

51605160

cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc

52205220

atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat

52805280

tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac

53405340

gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc

54005400

cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc

54605460

aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc

55205520

aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc

55805580

aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct

56405640

agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg

57005700

atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag

57605760

gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc

58205820

ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag

58805880

tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag

59405940

gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac

60006000

tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc

60606060

cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat

61206120

atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga

61806180

agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa

62406240

gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag

63006300

agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc

63606360

aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc

64206420

ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct

64806480

ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac

65406540

cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc

66006600

ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag

66606660

atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg

67206720

tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat

67806780

cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg

68406840

cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag

69006900

accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag

69606960

gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc

70207020

ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg

70807080

ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac

71407140

atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat

72007200

agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac

72607260

atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg

73207320

tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg

73807380

tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc

74407440

gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc

75007500

gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc

75607560

accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg

76207620

atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc

76807680

ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag ccacctagca tgcccgtgca ctacgatagc cagctggata cccacactgtt cggcaagaag

77407740

tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc

78007800

aagctgcctc ctgtgctgaa gcggcaccag cgggaaatca ccagaaccac actgcagagc aagctgcctc ctgtgctgaa gcggcaccag cgggaaatca ccagaaccac actgcagagc

78607860

gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc

79207920

gacatctacg acgaggacga gaatcagagc cccagatcct ttcagaaaaa gacccggcac gacatctacg acgaggacga gaatcagagc cccagatcct ttcagaaaaa gacccggcac

79807980

tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg

80408040

ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag

81008100

ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc

81608160

ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat

82208220

caggctagcc ggccttacag cttctacagc tccctgatct cctacgaaga ggaccagaga caggctagcc ggccttacag cttctacagc tccctgatct cctacgaaga ggaccagaga

82808280

cagggcgctg agccccggaa gaatttcgtg aagcccaacg agactaagac ctacttttgg cagggcgctg agccccggaa gaatttcgtg aagcccaacg agactaagac ctacttttgg

83408340

aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac

84008400

ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg

84608460

tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc

85208520

ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg

85808580

aactgcaggg ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg aactgcaggg ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg

86408640

ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat

87008700

cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac

87608760

ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat

88208820

ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga

88808880

gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac

89408940

tccaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc tccaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc

90009000

accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctactccggc accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctactccggc

90609060

agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct

91209120

cccatgatca tccacggaat caagacccag ggcgcaagac agaagttcag cagcctgtac cccatgatca tccacggaat caagacccag ggcgcaagac agaagttcag cagcctgtac

91809180

atcagccagt tcatcatcat gtacagcctg gacggaaaga agtggcagac ctaccggggc atcagccagt tcatcatcat gtacagcctg gacggaaaga agtggcagac ctaccggggc

92409240

aatagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac aatagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac

93009300

aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc

93609360

atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc

94209420

ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc ctcggaatgg aaagcaaggc catcagcgac gccgatca cagccagcag ctacttcacc

94809480

aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac

95409540

gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc

96009600

atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg

96609660

aaagagttcc tgattagcag cagccaggac ggccaccagt ggaccctgtt tttccagaac aaagagttcc tgattagcag cagccaggac ggccaccagt ggaccctgtt tttccagaac

97209720

ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg

97809780

gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc

98409840

gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc

99009900

atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa

99609960

atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta

1002010020

gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg

1008010080

ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact

1014010140

atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg

1020010200

cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag

1026010260

aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa

1032010320

cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc

1038010380

ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacaggg

1044010440

ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat

1050010500

ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc

1056010560

tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg

1062010620

ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg

1068010680

gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag catggcgggt gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag catggcgggt

1074010740

taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct

1080010800

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

1086010860

cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa

1092010920

gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact

1098010980

tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt

1104011040

tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa

1110011100

tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa

1116011160

tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa

1122011220

gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta

1128011280

cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccattcc

1134011340

acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat

1140011400

gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt

1146011460

ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact

1152011520

gaatatcaac gcttatttgc agcctgaatg gcgaatgg gaatatcaac gcttatttgc agcctgaatg gcgaatgg

1155811558

<210> 199<210> 199

<211> 12190<211> 12190

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 199<400> 199

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60 60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120 120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt

180 180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240 240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300 300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360 360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420 420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480 480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540 540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600 600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660 660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720 720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780 780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840 840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900 900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960 960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

10201020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

10801080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

11401140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

12001200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

12601260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

13201320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

13801380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

14401440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

15001500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

15601560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

16201620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

16801680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

17401740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

18001800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

18601860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

19201920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

19801980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

20402040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

21002100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

21602160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

22202220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

22802280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

23402340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

24002400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

24602460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

25202520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

25802580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

26402640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

27002700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

27602760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

28202820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

28802880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

29402940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

30003000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

30603060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

31203120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

31803180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

32403240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

33003300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

33603360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

34203420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

34803480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

35403540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

36003600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

36603660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

37203720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

37803780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

38403840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

39003900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

39603960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

40204020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

40804080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

41404140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

42004200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

42604260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

43204320

tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc

43804380

ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt

44404440

ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgaggtg

45004500

ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg

45604560

ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt

46204620

atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg

46804680

agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc

47404740

ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc

48004800

accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac

48604860

ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca

49204920

ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat

49804980

gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag

50405040

ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg

51005100

caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg

51605160

ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca

52205220

cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc

52805280

gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt

53405340

ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta

54005400

ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt

54605460

ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt ggttcattct caagcctcag acagtggttc aaagtttttt tcttccatt caggtgtcgt

55205520

gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc

55805580

tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg

56405640

actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc

57005700

ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca

57605760

ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta

58205820

caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc

58805880

ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg

59405940

acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca

60006000

cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga

60606060

catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag

61206120

ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt

61806180

tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca

62406240

gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga

63006300

acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact acggctacgt gaacagaagc ctgcctggac tgatcggctg cccagaaag tccgtgtact

63606360

ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca

64206420

ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga

64806480

ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc

65406540

accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc

66006600

tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga

66606660

tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg

67206720

ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt

67806780

acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg

68406840

gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga

69006900

cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg

69606960

gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca

70207020

tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg

70807080

tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg

71407140

tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca

72007200

gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct

72607260

acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc

73207320

tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc

73807380

tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc

74407440

actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg

75007500

cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg

75607560

gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg

76207620

gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca

76807680

gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca

77407740

ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca

78007800

atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc

78607860

agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc

79207920

acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga

79807980

gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa

80408040

ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga

81008100

cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc

81608160

tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg

82208220

acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg

82808280

ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata

83408340

gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc

84008400

ctctgtctct gagcgaggaa aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc ctctgtctct gagcgaggaa aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc

84608460

agcgggaaat caccagaacc acactgcaga gcgaccaaga ggaaatcgat tacgacgaca agcgggaaat caccagaacc acactgcaga gcgaccaaga ggaaatcgat tacgacgaca

85208520

ccatcagcgt cgagatgaag aaagaagatt tcgacatcta cgacgaggac gagaatcaga ccatcagcgt cgagatgaag aaagaagatt tcgacatcta cgacgaggac gagaatcaga

85808580

gccccagatc ctttcagaaa aagacccggc actacttcat tgccgccgtc gagagactgt gccccagatc ctttcagaaa aagacccggc actacttcat tgccgccgtc gagagactgt

86408640

gggactacgg catgtctagc agccctcacg tgctgagaaa tagagcccag agcggcagcg gggactacgg catgtctagc agccctcacg tgctgagaaa tagagcccag agcggcagcg

87008700

tgccccagtt caagaaagtg gtgttccaag agttcaccga cggcagcttc acccagccac tgccccagtt caagaaagtg gtgttccaag agttcaccga cggcagcttc acccagccac

87608760

tgtatagagg cgagctgaac gagcatctgg gcctgctggg cccttatatc agagccgaag tgtatagagg cgagctgaac gagcatctgg gcctgctggg cccttatatc agagccgaag

88208820

tggaagataa catcatggtc accttccgga atcaggctag ccggccttac agcttctaca tggaagataa catcatggtc accttccgga atcaggctag ccggccttac agcttctaca

88808880

gctccctgat ctcctacgaa gaggaccaga gacagggcgc tgagccccgg aagaatttcg gctccctgat ctcctacgaa gaggaccaga gacagggcgc tgagccccgg aagaatttcg

89408940

tgaagcccaa cgagactaag acctactttt ggaaggtgca gcaccacatg gcccctacaa tgaagcccaa cgagactaag acctactttt ggaaggtgca gcaccacatg gcccctacaa

90009000

aggacgagtt cgactgcaaa gcctgggcct acttctccga tgtggatctg gaaaaggacg aggacgagtt cgactgcaaa gcctgggcct acttctccga tgtggatctg gaaaaggacg

90609060

tgcacagcgg gctcatcgga ccactgcttg tgtgccacac caacacactg aaccccgctc tgcacagcgg gctcatcgga ccactgcttg tgtgccacac caacacactg aaccccgctc

91209120

acggcagaca agtgacagtg caagagttcg ccctgttctt caccatcttc gacgaaacaa acggcagaca agtgacagtg caagagttcg ccctgttctt caccatcttc gacgaaacaa

91809180

agagctggta cttcaccgag aatatggaac ggaactgcag ggccccttgc aacatccaga agagctggta cttcaccgag aatatggaac ggaactgcag ggccccttgc aacatccaga

92409240

tggaagatcc caccttcaaa gagaactacc ggttccacgc catcaacggc tacatcatgg tggaagatcc caccttcaaa gagaactacc ggttccacgc catcaacggc tacatcatgg

93009300

acacactgcc cggcctggtt atggcccagg atcagagaat ccggtggtat ctgctgtcca acacactgcc cggcctggtt atggcccagg atcagagaat ccggtggtat ctgctgtcca

93609360

tgggctccaa cgagaatatc cacagcatcc acttcagcgg ccacgtgttc accgtgcgga tgggctccaa cgagaatatc cacagcatcc acttcagcgg ccacgtgttc accgtgcgga

94209420

aaaaagaaga gtacaaaatg gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaaaagaaga gtacaaaatg gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg

94809480

aaatgctgcc ttccaaggcc ggcatttgga gagtggaatg tctgattgga gagcacctcc aaatgctgcc ttccaaggcc ggcatttgga gagtggaatg tctgattgga gagcacctcc

95409540

acgccggaat gagcaccctg tttctggtgt actccaacaa gtgtcagacc cctctcggca acgccggaat gagcaccctg tttctggtgt actccaacaa gtgtcagacc cctctcggca

96009600

tggcctctgg acacatcaga gacttccaga tcaccgcctc tggccagtac ggacagtggg tggcctctgg acacatcaga gacttccaga tcaccgcctc tggccagtac ggacagtggg

96609660

ctcctaaact ggctcggctg cactactccg gcagcatcaa tgcctggtcc accaaagagc ctcctaaact ggctcggctg cactactccg gcagcatcaa tgcctggtcc accaaagagc

97209720

ccttcagctg gatcaaggtg gacctgctgg ctcccatgat catccacgga atcaagaccc ccttcagctg gatcaaggtg gacctgctgg ctcccatgat catccacgga atcaagaccc

97809780

agggcgcaag acagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc agggcgcaag acagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc

98409840

tggacggaaa gaagtggcag acctaccggg gcaatagcac cggcacactc atggtgttct tggacggaaa gaagtggcag acctaccggg gcaatagcac cggcacactc atggtgttct

99009900

tcggcaacgt ggactccagc ggcattaagc acaacatctt caaccctcca atcattgccc tcggcaacgt ggactccagc ggcattaagc acaacatctt caaccctcca atcattgccc

99609960

ggtacatccg gctgcacccc acacactaca gcatccggtc taccctgaga atggaactga ggtacatccg gctgcacccc acaactaca gcatccggtc taccctgaga atggaactga

1002010020

tgggctgcga cctgaacagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg tgggctgcga cctgaacagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg

1008010080

acgcccagat cacagccagc agctacttca ccaacatgtt cgccacttgg agcccctcca acgcccagat cacagccagc agctacttca ccaacatgtt cgccacttgg agcccctcca

1014010140

aggctagact gcatctgcag ggcagaagca acgcttggag gccccaagtg aacaacccca aggctagact gcatctgcag ggcagaagca acgcttggag gccccaagtg aacaacccca

1020010200

aagagtggct gcaggttgac tttcaaaaga ccatgaaagt gaccggcgtg accacacagg aagagtggct gcaggttgac tttcaaaaga ccatgaaagt gaccggcgtg accacacagg

1026010260

gcgtcaagtc tctgctgacc tctatgtacg tgaaagagtt cctgattagc agcagccagg gcgtcaagtc tctgctgacc tctatgtacg tgaaagagtt cctgattagc agcagccagg

1032010320

acggccacca gtggaccctg tttttccaga acggcaaagt gaaagtgttc cagggcaatc acggccacca gtggaccctg tttttccaga acggcaaagt gaaagtgttc cagggcaatc

1038010380

aggacagctt cacacccgtg gtcaattctc tggaccctcc actgctgacc agatacctgc aggacagctt cacacccgtg gtcaattctc tggaccctcc actgctgacc agatacctgc

1044010440

ggattcaccc tcagtcttgg gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg ggattcaccc tcagtcttgg gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg

1050010500

aagctcagga cctctactag ttaattaaga gcatcttacc gccatttatt cccatatttg aagctcagga cctctactag ttaattaaga gcatcttacc gccatttatt cccatatttg

1056010560

ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa

1062010620

tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca

1068010680

tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa

1074010740

aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata

1080010800

tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc

1086010860

cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg

1092010920

tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac

1098010980

ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat

1104011040

cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt

1110011100

ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc

1116011160

cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc

1122011220

gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg

1128011280

ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga

1134011340

gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa

1140011400

cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg

1146011460

cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct

1152011520

gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata

1158011580

atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc

1164011640

ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat

1170011700

aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg

1176011760

cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca

1182011820

ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc

1188011880

atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc

1194011940

ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc

1200012000

cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc

1206012060

atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt

1212012120

catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa

1218012180

tggcgaatgg tggcgaatgg

1219012190

<210> 200<210> 200

<211> 12165<211> 12165

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 200<400> 200

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60 60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120 120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180 180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240 240

atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg

300 300

cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag

360 360

cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc

420 420

cgccatgcta cttatcgcgg ccgctcaata ttggccatta gccatattat tcattggtta cgccatgcta cttatcgcgg ccgctcaata ttggccatta gccatattat tcattggtta

480 480

tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat atcataatat tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat atcataatat

540 540

gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat tattgactag gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat tattgactag

600 600

ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt

660 660

tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac

720 720

gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg

780 780

ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag

840 840

tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat

900 900

gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat

960 960

ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc

10201020

aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg

10801080

ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg

11401140

tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg

12001200

gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg cgacgctgcc gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg cgacgctgcc

12601260

ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg

13201320

cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagcgct cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagcgct

13801380

tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag gggctccggg tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag gggctccggg

14401440

agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg

15001500

agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc

15601560

tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg

16201620

gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag

16801680

ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc ccgagttgct ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc ccgagttgct

17401740

gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg

18001800

ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg ccgggcgggg ggtggcggca ggtggggggtg ccgggcgggg cggggccgcc tcgggccggg

18601860

gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg

19201920

agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact tcctttgtcc agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact tcctttgtcc

19801980

caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg

20402040

gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg tgcgtcgccg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg tgcgtcgccg

21002100

cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga cggctgcctt cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga cggctgcctt

21602160

tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc

22202220

ctctgctaac catgttttag cctttcttct ttttcctaca gctcctgggc aacgtgctgg ctctgctaac catgttttag cctttcttct ttttcctaca gctcctgggc aacgtgctgg

22802280

ttattgtgct gtctcatcat ttgtcgacag aattcctcga agatccgaag gggttcaagc ttattgtgct gtctcatcat ttgtcgacag aattcctcga agatccgaag gggttcaagc

23402340

ttggcattcc ggtactgttg gtaaagccag tttaaaccgc agccaccatg cagatcgagc ttggcattcc ggtactgttg gtaaagccag tttaaaccgc agccaccatg cagatcgagc

24002400

tgtctacctg cttcttcctg tgcctgctgc ggttctgctt cagcgccacc agaagatatt tgtctacctg cttcttcctg tgcctgctgc ggttctgctt cagcgccacc agaagatatt

24602460

acctgggcgc cgtggaactg agctgggact acatgcagtc tgacctggga gagctgcccg acctgggcgc cgtggaactg agctgggact acatgcagtc tgacctggga gagctgcccg

25202520

tggacgctag atttcctcca agagtgccca agagcttccc cttcaacacc tccgtggtgt tggacgctag atttcctcca agagtgccca agagcttccc cttcaacacc tccgtggtgt

25802580

acaagaaaac cctgttcgtg gaattcaccg accacctgtt caatatcgcc aagcctcggc acaagaaaac cctgttcgtg gaattcaccg accacctgtt caatatcgcc aagcctcggc

26402640

ctccttggat gggactgctg ggacctacaa ttcaggccga ggtgtacgac accgtggtca ctccttggat gggactgctg ggacctacaa ttcaggccga ggtgtacgac accgtggtca

27002700

tcaccctgaa gaacatggcc agccatcctg tgtctctgca cgccgtggga gtgtcttatt tcaccctgaa gaacatggcc agccatcctg tgtctctgca cgccgtggga gtgtcttatt

27602760

ggaaggcttc tgagggcgcc gagtacgacg atcagacaag ccagagagag aaagaggacg ggaaggcttc tgagggcgcc gagtacgacg atcagacaag cccagagag aaagaggacg

28202820

acaaggtttt ccctggcggc agccacacct atgtctggca ggtcctgaaa gaaaacggcc acaaggtttt ccctggcggc agccacacct atgtctggca ggtcctgaaa gaaaacggcc

28802880

ctatggcctc cgatcctctg tgcctgacat acagctacct gagccacgtg gacctggtca ctatggcctc cgatcctctg tgcctgacat acagctacct gagccacgtg gacctggtca

29402940

aggacctgaa ttctggcctg atcggagccc tgctcgtgtg tagagaaggc agcctggcca aggacctgaa ttctggcctg atcggagccc tgctcgtgtg tagagaaggc agcctggcca

30003000

aagagaaaac ccagacactg cacaagttca tcctgctgtt cgccgtgttc gacgagggca aagagaaaac cgagacactg cacaagttca tcctgctgtt cgccgtgttc gacgagggca

30603060

agagctggca cagcgagaca aagaacagcc tgatgcagga cagggatgcc gcctctgcta agagctggca cagcgagaca aagaacagcc tgatgcagga cagggatgcc gcctctgcta

31203120

gagcttggcc taagatgcac accgtgaacg gctacgtgaa cagaagcctg cctggactga gagcttggcc taagatgcac accgtgaacg gctacgtgaa cagaagcctg cctggactga

31803180

tcggctgcca cagaaagtcc gtgtactggc acgtgatcgg catgggcaca acacctgagg tcggctgcca cagaaagtcc gtgtactggc acgtgatcgg catgggcaca acacctgagg

32403240

tgcacagcat ctttctggaa ggccacacct tcctcgtgcg gaaccacaga caggccagcc tgcacagcat ctttctggaa ggccacacct tcctcgtgcg gaaccacaga caggccagcc

33003300

tggaaatcag ccctatcacc ttcctgaccg ctcagaccct gctgatggat ctgggccagt tggaaatcag ccctatcacc ttcctgaccg ctcagaccct gctgatggat ctgggccagt

33603360

ttctgctgtt ctgccacatc agctcccacc agcacgatgg catggaagcc tacgtgaagg ttctgctgtt ctgccacatc agctcccacc agcacgatgg catggaagcc tacgtgaagg

34203420

tggacagctg ccccgaagaa ccccagctgc ggatgaagaa caacgaggaa gccgaggact tggacagctg ccccgaagaa ccccagctgc ggatgaagaa caacgaggaa gccgaggact

34803480

acgacgacga cctgaccgac tctgagatgg acgtcgtcag attcgacgac gataacagcc acgacgacga cctgaccgac tctgagatgg acgtcgtcag attcgacgac gataacagcc

35403540

ccagcttcat ccagatcaga agcgtggcca agaagcaccc caagacctgg gtgcactata ccagcttcat ccagatcaga agcgtggcca agaagcaccc caagacctgg gtgcactata

36003600

tcgccgccga ggaagaggac tgggattacg ctcctctggt gctggcccct gacgacagaa tcgccgccga ggaagaggac tgggattacg ctcctctggt gctggcccct gacgacagaa

36603660

gctacaagag ccagtacctg aacaacggcc ctcagcggat cggccggaag tataagaaag gctacaagag ccagtacctg aacaacggcc ctcagcggat cggccggaag tataagaaag

37203720

tgcggttcat ggcctacacc gacgagacat tcaagaccag agaggccatc cagcacgaga tgcggttcat ggcctacacc gacgagacat tcaagaccag agaggccatc cagcacgaga

37803780

gcggaattct gggccctctg ctgtatggcg aagtgggcga tacactgctg atcatcttca gcggaattct gggccctctg ctgtatggcg aagtgggcga tacactgctg atcatcttca

38403840

agaaccaggc cagcagaccc tacaacatct accctcacgg catcaccgat gtgcggcccc agaaccaggc cagcagaccc tacaacatct accctcacgg catcaccgat gtgcggcccc

39003900

tgtattctag aaggctgccc aagggcgtga agcacctgaa ggacttccct atcctgcctg tgtattctag aaggctgccc aagggcgtga agcacctgaa ggacttccct atcctgcctg

39603960

gcgagatttt caagtacaag tggaccgtga ccgtggaaga tggccccacc aagagcgacc gcgagatttt caagtacaag tggaccgtga ccgtggaaga tggccccacc aagagcgacc

40204020

ctagatgtct gacacggtac tacagcagct tcgtgaacat ggaacgcgac ctggccagcg ctagatgtct gacacggtac tacagcagct tcgtgaacat ggaacgcgac ctggccagcg

40804080

gcctgattgg acctctgctg atctgctaca aagaaagcgt ggaccagcgg ggcaaccaga gcctgattgg acctctgctg atctgctaca aagaaagcgt ggaccagcgg ggcaaccaga

41404140

tcatgagcga caagcggaac gtgatcctgt ttagcgtgtt cgatgagaac cggtcctggt tcatgagcga caagcggaac gtgatcctgt ttagcgtgtt cgatgagaac cggtcctggt

42004200

atctgaccga gaacatccag cggtttctgc ccaatcctgc cggggtgcaa ctggaagatc atctgaccga gaacatccag cggtttctgc ccaatcctgc cggggtgcaa ctggaagatc

42604260

ctgagttcca ggcaagcaac atcatgcact ccatcaatgg ctatgtgttc gacagcctgc ctgagttcca ggcaagcaac atcatgcact ccatcaatgg ctatgtgttc gacagcctgc

43204320

agctgagcgt gtgcctgcac gaagtggcct actggtacat cctgagcatt ggcgcccaga agctgagcgt gtgcctgcac gaagtggcct actggtacat cctgagcatt ggcgcccaga

43804380

ccgacttcct gtccgtgttc tttagcggct acaccttcaa gcacaagatg gtgtacgagg ccgacttcct gtccgtgttc tttagcggct acaccttcaa gcacaagatg gtgtacgagg

44404440

ataccctgac actgttccca ttcagcggcg agacagtgtt catgagcatg gaaaaccccg ataccctgac actgttccca ttcagcggcg agacagtgtt catgagcatg gaaaaccccg

45004500

gcctgtggat tctgggctgt cacaacagcg acttccggaa cagaggcatg acagccctgc gcctgtggat tctgggctgt cacaacagcg acttccggaa cagaggcatg acagccctgc

45604560

tgaaggtgtc cagctgcgac aagaacaccg gcgactacta cgaggacagc tatgaggaca tgaaggtgtc cagctgcgac aagaacaccg gcgactacta cgaggacagc tatgaggaca

46204620

tcagcgccta cctgctgagc aagaacaatg ccatcgagcc tcggagcttc agccagaatc tcagcgccta cctgctgagc aagaacaatg ccatcgagcc tcggagcttc agccagaatc

46804680

ctcctgtgct gaagcggcac cagcgcgaga tcaccagaac aaccctgcag agcgaccaag ctcctgtgct gaagcggcac cagcgcgaga tcaccagaac aaccctgcag agcgaccaag

47404740

aggaaatcga ttacgacgac accatcagcg tcgagatgaa gaaagaagat ttcgacatct aggaaatcga ttacgacgac accatcagcg tcgagatgaa gaaagaagat ttcgacatct

48004800

acgacgagga cgagaatcag agccccagaa gctttcagaa aaagacccgg cactacttca acgacgagga cgagaatcag agccccagaa gctttcagaa aaagacccgg cactacttca

48604860

ttgccgccgt cgagagactg tgggactacg gcatgtctag cagccctcac gtgctgagaa ttgccgccgt cgagagactg tgggactacg gcatgtctag cagccctcac gtgctgagaa

49204920

atagagccca gagcggcagc gtgccccagt tcaagaaagt ggtgttccaa gagttcaccg atagagccca gagcggcagc gtgccccagt tcaagaaagt ggtgttccaa gagttcaccg

49804980

acggcagctt cacccagcca ctgtatagag gcgagctgaa cgagcatctg ggcctgctgg acggcagctt cacccagcca ctgtatagag gcgagctgaa cgagcatctg ggcctgctgg

50405040

gcccttatat cagagccgaa gtggaagata acatcatggt caccttccgg aatcaggcta gcccttatat cagagccgaa gtggaagata acatcatggt caccttccgg aatcaggcta

51005100

gccggcctta cagcttctac agctccctga tcagctacga agaggaccag agacagggcg gccggcctta cagcttctac agctccctga tcagctacga agaggaccag agacaggcg

51605160

ctgagcccag aaagaacttc gtgaagccca acgagactaa gacctacttt tggaaggtgc ctgagcccag aaagaacttc gtgaagccca acgagactaa gacctacttt tggaaggtgc

52205220

agcaccacat ggcccctaca aaggacgagt tcgactgcaa agcctgggcc tacttctccg agcaccacat ggcccctaca aaggacgagt tcgactgcaa agcctgggcc tacttctccg

52805280

atgtggatct ggaaaaggac gtgcacagcg ggctcatcgg accactgctt gtgtgccaca atgtggatct ggaaaaggac gtgcacagcg ggctcatcgg accactgctt gtgtgccaca

53405340

ccaacacact gaaccccgct cacggcagac aagtgacagt gcaagagttc gccctgttct ccaacacact gaaccccgct cacggcagac aagtgacagt gcaagagttc gccctgttct

54005400

tcaccatctt cgacgaaaca aagagctggt acttcaccga gaatatggaa cggaactgca tcaccatctt cgacgaaaca aagagctggt acttcaccga gaatatggaa cggaactgca

54605460

gagccccttg caacatccag atggaagatc ccaccttcaa agagaactac cggttccacg gagccccttg caacatccag atggaagatc ccaccttcaa agagaactac cggttccacg

55205520

ccatcaacgg ctacatcatg gacacactgc ccggcctggt tatggcccag gatcagagaa ccatcaacgg ctacatcatg gacacactgc ccggcctggt tatggcccag gatcagagaa

55805580

tccggtggta tctgctgtcc atgggctcca acgagaatat ccacagcatc cacttcagcg tccggtggta tctgctgtcc atgggctcca acgagaatat ccacagcatc cacttcagcg

56405640

gccacgtgtt caccgtgcgg aaaaaagaag agtacaaaat ggccctgtac aatctgtacc gccacgtgtt caccgtgcgg aaaaaagaag agtacaaaat ggccctgtac aatctgtacc

57005700

ctggggtgtt cgaaaccgtg gaaatgctgc cttccaaggc cggcatttgg agagtggaat ctggggtgtt cgaaaccgtg gaaatgctgc cttccaaggc cggcatttgg agagtggaat

57605760

gtctgattgg agagcacctc cacgccggaa tgagcaccct gtttctggtg tacagcaaca gtctgattgg agagcacctc cacgccggaa tgagcaccct gtttctggtg tacagcaaca

58205820

agtgtcagac ccctctcggc atggcctctg gacacatcag agacttccag atcaccgcct agtgtcagac ccctctcggc atggcctctg gacacatcag agacttccag atcaccgcct

58805880

ctggccagta cggacagtgg gctcctaaac tggctcggct gcactacagc ggcagcatca ctggccagta cggacagtgg gctcctaaac tggctcggct gcactacagc ggcagcatca

59405940

atgcctggtc caccaaagag cccttcagct ggatcaaggt ggacctgctg gctcccatga atgcctggtc caccaaagag cccttcagct ggatcaaggt ggacctgctg gctcccatga

60006000

tcatccacgg aatcaagacc cagggcgcca gacagaagtt cagcagcctg tacatcagcc tcatccacgg aatcaagacc cagggcgcca gacagaagtt cagcagcctg tacatcagcc

60606060

agttcatcat catgtacagc ctggacggca agaagtggca gacctacaga ggcaacagca agttcatcat catgtacagc ctggacggca agaagtggca gacctacaga ggcaacagca

61206120

ccggcacact catggtgttc ttcggcaacg tggactccag cggcattaag cacaacatct ccggcacact catggtgttc ttcggcaacg tggactccag cggcattaag cacaacatct

61806180

tcaaccctcc aatcattgcc cggtacatcc ggctgcaccc cacacactac agcatccggt tcaaccctcc aatcattgcc cggtacatcc ggctgcaccc cacacactac agcatccggt

62406240

ctaccctgag aatggaactg atgggctgcg acctgaacag ctgctctatg cccctcggaa ctaccctgag aatggaactg atgggctgcg acctgaacag ctgctctatg cccctcggaa

63006300

tggaaagcaa ggccatcagc gacgcccaga tcacagccag cagctacttc accaacatgt tggaaagcaa ggccatcagc gacgcccaga tcacagccag cagctacttc accaacatgt

63606360

tcgccacttg gagcccctcc aaggctagac tgcatctgca gggcagaagc aacgcttgga tcgccacttg gagcccctcc aaggctagac tgcatctgca gggcagaagc aacgcttgga

64206420

ggccccaagt gaacaacccc aaagagtggc tgcaggttga ctttcaaaag accatgaaag ggccccaagt gaacaacccc aaagagtggc tgcaggttga ctttcaaaag accatgaaag

64806480

tgaccggcgt gaccacacag ggcgtcaagt ctctgctgac ctctatgtac gtgaaagagt tgaccggcgt gaccacacag ggcgtcaagt ctctgctgac ctctatgtac gtgaaagagt

65406540

tcctgatctc cagcagccag gacggccatc agtggaccct gtttttccag aacggcaaag tcctgatctc cagcagccag gacggccatc agtggaccct gtttttccag aacggcaaag

66006600

tgaaagtgtt ccagggcaat caggacagct tcacacccgt ggtcaattct ctggaccctc tgaaagtgtt cccaggcaat caggacagct tcacacccgt ggtcaattct ctggaccctc

66606660

cactgctgac cagatacctg cggattcacc ctcagtcttg ggtgcaccag atcgctctgc cactgctgac cagatacctg cggattcacc ctcagtcttg ggtgcaccag atcgctctgc

67206720

ggatggaagt gctgggctgt gaagctcagg acctctacta gttaattaag agcatcttac ggatggaagt gctgggctgt gaagctcagg acctctacta gttaattaag agcatcttac

67806780

cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa

68406840

taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg

69006900

tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt

69606960

taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc

70207020

tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg

70807080

tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt

71407140

gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac

72007200

tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc

72607260

gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt

73207320

gctgggcact gataattccg tggtgttgtc atcgattcca taaagtagga aacactacac gctgggcact gataattccg tggtgttgtc atcgattcca taaagtagga aacactacac

73807380

gattccataa agtaggaaac actacatcac tccataaagt aggaaacact acagttaact gattccataa agtaggaaac actacatcac tccataaagt aggaaacact acagttaact

74407440

gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg

75007500

gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg

75607560

agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg

76207620

gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcggcgcg ccgcatggct gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcggcgcg ccgcatggct

76807680

acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt

77407740

gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa

78007800

ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggtcg ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggtcg

78607860

acgctagcag ctgatgcata gcatgcggta ccgggagatg ggggaggcta actgaaacac acgctagcag ctgatgcata gcatgcggta ccgggagatg ggggaggcta actgaaacac

79207920

ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa ggaagggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa

79807980

cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct

80408040

gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca

81008100

ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc

81608160

cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg

82208220

cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca

82808280

gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat

83408340

ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg

84008400

agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc

84608460

ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat

85208520

aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca

85808580

gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg

86408640

actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg

87008700

gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag

87608760

cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt

88208820

aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag

88808880

ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg

89408940

ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct

90009000

ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat

90609060

ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc

91209120

aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac

91809180

gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat

92409240

atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg

93009300

gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac

93609360

gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca

94209420

taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat

94809480

tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt

95409540

tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt

96009600

ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa

96609660

taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg

97209720

ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg

97809780

gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag

98409840

gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga

99009900

cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct

99609960

ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc

1002010020

tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg

1008010080

gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc

1014010140

tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca

1020010200

ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag

1026010260

ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct

1032010320

ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc

1038010380

accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga

1044010440

tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca

1050010500

cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat

1056010560

taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac

1062010620

caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt

1068010680

gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt

1074010740

gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag

1080010800

ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct

1086010860

attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt

1092010920

gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc

1098010980

tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt

1104011040

agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg

1110011100

gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg

1116011160

actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct

1122011220

tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc

1128011280

attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt

1134011340

tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt

1140011400

tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg

1146011460

aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat

1152011520

tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg

1158011580

cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc

1164011640

gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc

1170011700

ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag

1176011760

agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc

1182011820

gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa

1188011880

gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg

1194011940

aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt

1200012000

gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacaggc

1206012060

gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt

1212012120

aataacgaag agatgacaga aaaattttca ttctgtgaca gagaa aataacgaag agatgacaga aaaattttca ttctgtgaca gagaa

1216512165

<210> 201<210> 201

<211> 11512<211> 11512

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 201<400> 201

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60 60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120 120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180 180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240 240

atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg

300 300

cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag

360 360

cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc

420 420

cgccatgcta cttatcgcgg ccgcaggctc agaggcacac aggagtttct gggctcaccc cgccatgcta cttatcgcgg ccgcaggctc agaggcacac aggagtttct gggctcaccc

480 480

tgcccccttc caacccctca gttcccatcc tccagcagct gtttgtgtgc tgcctctgaa tgcccccttc caacccctca gttcccatcc tccagcagct gtttgtgtgc tgcctctgaa

540 540

gtccacactg aacaaacttc agcctactca tgtccctaaa atgggcaaac attgcaagca gtccacactg aacaaacttc agcctactca tgtccctaaa atgggcaaac attgcaagca

600 600

gcaaacagca aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag gcaaacagca aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag

660 660

agacctctct gggcccatgc cacctccaac atccactcga ccccttggaa tttcggtgga agacctctct gggcccatgc cacctccaac atccactcga ccccttggaa tttcggtgga

720 720

gaggagcaga ggttgtcctg gcgtggttta ggtagtgtga gagggtccgg gttcaaaacc gaggagcaga ggttgtcctg gcgtggttta ggtagtgtga gagggtccgg gttcaaaacc

780 780

acttgctggg tggggagtcg tcagtaagtg gctatgcccc gaccccgaag cctgtttccc acttgctggg tggggagtcg tcagtaagtg gctatgcccc gaccccgaag cctgtttccc

840 840

catctgtaca atggaaatga taaagacgcc catctgatag ggtttttgtg gcaaataaac catctgtaca atggaaatga taaagacgcc catctgatag ggtttttgtg gcaaataaac

900 900

atttggtttt tttgttttgt tttgttttgt tttttgagat ggaggtttgc tctgtcgccc atttggtttt tttgttttgt tttgttttgt tttttgagat ggaggtttgc tctgtcgccc

960 960

aggctggagt gcagtgacac aatctcatct caccacaacc ttcccctgcc tcagcctccc aggctggagt gcagtgacac aatctcatct caccacaacc ttcccctgcc tcagcctccc

10201020

aagtagctgg gattacaagc atgtgccacc acacctggct aattttctat ttttagtaga aagtagctgg gattacaagc atgtgccacc acacctggct aattttctat ttttagtaga

10801080

gacgggtttc tccatgttgg tcagcctcag cctcccaagt aactgggatt acaggcctgt gacgggtttc tccatgttgg tcagcctcag cctcccaagt aactgggatt acaggcctgt

11401140

gccaccacac ccggctaatt ttttctattt ttgacaggga cggggtttca ccatgttggt gccaccacac ccggctaatt ttttctattt ttgacaggga cggggtttca ccatgttggt

12001200

caggctggtc tagaggtacc ggatcttgct accagtggaa cagccactaa ggattctgca caggctggtc tagaggtacc ggatcttgct accagtggaa cagccactaa ggattctgca

12601260

gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc

13201320

cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt

13801380

aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac

14401440

tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg

15001500

gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac

15601560

gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatcc gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatcc

16201620

ggactctaag gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat ggactctaag gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat

16801680

tgtttctctc ttttagattc caacctttgg aactgagttt aaaccgcagc caccatgcag tgtttctctc ttttagattc caacctttgg aactgagttt aaaccgcagc caccatgcag

17401740

atcgagctgt ctacctgctt cttcctgtgc ctgctgcggt tctgcttcag cgccaccaga atcgagctgt ctacctgctt cttcctgtgc ctgctgcggt tctgcttcag cgccaccaga

18001800

agatattacc tgggcgccgt ggaactgagc tgggactaca tgcagtctga cctgggagag agatattacc tgggcgccgt ggaactgagc tgggactaca tgcagtctga cctggggagag

18601860

ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga gcttcccctt caacacctcc ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga gcttcccctt caacacctcc

19201920

gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc acctgttcaa tatcgccaag gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc acctgttcaa tatcgccaag

19801980

cctcggcctc cttggatggg actgctggga cctacaattc aggccgaggt gtacgacacc cctcggcctc cttggatggg actgctggga cctacaattc aggccgaggt gtacgacacc

20402040

gtggtcatca ccctgaagaa catggccagc catcctgtgt ctctgcacgc cgtgggagtg gtggtcatca ccctgaagaa catggccagc catcctgtgt ctctgcacgc cgtgggagtg

21002100

tcttattgga aggcttctga gggcgccgag tacgacgatc agacaagcca gagagagaaa tcttattgga aggcttctga gggcgccgag tacgacgatc agacaagcca gagagagaaa

21602160

gaggacgaca aggttttccc tggcggcagc cacacctatg tctggcaggt cctgaaagaa gaggacgaca aggttttccc tggcggcagc cacacctatg tctggcaggt cctgaaagaa

22202220

aacggcccta tggcctccga tcctctgtgc ctgacataca gctacctgag ccacgtggac aacggcccta tggcctccga tcctctgtgc ctgacataca gctacctgag ccacgtggac

22802280

ctggtcaagg acctgaattc tggcctgatc ggagccctgc tcgtgtgtag agaaggcagc ctggtcaagg acctgaattc tggcctgatc ggagccctgc tcgtgtgtag agaaggcagc

23402340

ctggccaaag agaaaaccca gacactgcac aagttcatcc tgctgttcgc cgtgttcgac ctggccaaag agaaaaccca gacactgcac aagttcatcc tgctgttcgc cgtgttcgac

24002400

gagggcaaga gctggcacag cgagacaaag aacagcctga tgcaggacag ggatgccgcc gagggcaaga gctggcacag cgagacaaag aacagcctga tgcaggacag ggatgccgcc

24602460

tctgctagag cttggcctaa gatgcacacc gtgaacggct acgtgaacag aagcctgcct tctgctagag cttggcctaa gatgcacacc gtgaacggct acgtgaacag aagcctgcct

25202520

ggactgatcg gctgccacag aaagtccgtg tactggcacg tgatcggcat gggcacaaca ggactgatcg gctgccacag aaagtccgtg tactggcacg tgatcggcat gggcacaaca

25802580

cctgaggtgc acagcatctt tctggaaggc cacaccttcc tcgtgcggaa ccacagacag cctgaggtgc acagcatctt tctggaaggc cacaccttcc tcgtgcggaa ccacagacag

26402640

gccagcctgg aaatcagccc tatcaccttc ctgaccgctc agaccctgct gatggatctg gccagcctgg aaatcagccc tatcaccttc ctgaccgctc agaccctgct gatggatctg

27002700

ggccagtttc tgctgttctg ccacatcagc tcccaccagc acgatggcat ggaagcctac ggccagtttc tgctgttctg ccacatcagc tcccaccagc acgatggcat ggaagcctac

27602760

gtgaaggtgg acagctgccc cgaagaaccc cagctgcgga tgaagaacaa cgaggaagcc gtgaaggtgg acagctgccc cgaagaaccc cagctgcgga tgaagaacaa cgaggaagcc

28202820

gaggactacg acgacgacct gaccgactct gagatggacg tcgtcagatt cgacgacgat gaggactacg acgacgacct gaccgactct gagatggacg tcgtcagatt cgacgacgat

28802880

aacagcccca gcttcatcca gatcagaagc gtggccaaga agcaccccaa gacctgggtg aacagcccca gcttcatcca gatcagaagc gtggccaaga agcaccccaa gacctgggtg

29402940

cactatatcg ccgccgagga agaggactgg gattacgctc ctctggtgct ggcccctgac cactatatcg ccgccgagga agaggactgg gattacgctc ctctggtgct ggcccctgac

30003000

gacagaagct acaagagcca gtacctgaac aacggccctc agcggatcgg ccggaagtat gacagaagct acaagagcca gtacctgaac aacggccctc agcggatcgg ccggaagtat

30603060

aagaaagtgc ggttcatggc ctacaccgac gagacattca agaccagaga ggccatccag aagaaagtgc ggttcatggc ctacaccgac gagacattca agaccagaga ggccatccag

31203120

cacgagagcg gaattctggg ccctctgctg tatggcgaag tgggcgatac actgctgatc cacgagagcg gaattctggg ccctctgctg tatggcgaag tgggcgatac actgctgatc

31803180

atcttcaaga accaggccag cagaccctac aacatctacc ctcacggcat caccgatgtg atcttcaaga accaggccag cagaccctac aacatctacc ctcacggcat caccgatgtg

32403240

cggcccctgt attctagaag gctgcccaag ggcgtgaagc acctgaagga cttccctatc cggcccctgt attctagaag gctgcccaag ggcgtgaagc acctgaagga cttccctatc

33003300

ctgcctggcg agattttcaa gtacaagtgg accgtgaccg tggaagatgg ccccaccaag ctgcctggcg agattttcaa gtacaagtgg accgtgaccg tggaagatgg ccccaccaag

33603360

agcgacccta gatgtctgac acggtactac agcagcttcg tgaacatgga acgcgacctg agcgacccta gatgtctgac acggtactac agcagcttcg tgaacatgga acgcgacctg

34203420

gccagcggcc tgattggacc tctgctgatc tgctacaaag aaagcgtgga ccagcggggc gccagcggcc tgattggacc tctgctgatc tgctacaaag aaagcgtgga ccagcggggc

34803480

aaccagatca tgagcgacaa gcggaacgtg atcctgttta gcgtgttcga tgagaaccgg aaccagatca tgagcgacaa gcggaacgtg atcctgttta gcgtgttcga tgagaaccgg

35403540

tcctggtatc tgaccgagaa catccagcgg tttctgccca atcctgccgg ggtgcaactg tcctggtatc tgaccgagaa catccagcgg tttctgccca atcctgccgg ggtgcaactg

36003600

gaagatcctg agttccaggc aagcaacatc atgcactcca tcaatggcta tgtgttcgac gaagatcctg agttccaggc aagcaacatc atgcactcca tcaatggcta tgtgttcgac

36603660

agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact ggtacatcct gagcattggc agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact ggtacatcct gagcattggc

37203720

gcccagaccg acttcctgtc cgtgttcttt agcggctaca ccttcaagca caagatggtg gcccagaccg acttcctgtc cgtgttcttt agcggctaca ccttcaagca caagatggtg

37803780

tacgaggata ccctgacact gttcccattc agcggcgaga cagtgttcat gagcatggaa tacgaggata ccctgacact gttcccattc agcggcgaga cagtgttcat gagcatggaa

38403840

aaccccggcc tgtggattct gggctgtcac aacagcgact tccggaacag aggcatgaca aaccccggcc tgtggattct gggctgtcac aacagcgact tccggaacag aggcatgaca

39003900

gccctgctga aggtgtccag ctgcgacaag aacaccggcg actactacga ggacagctat gccctgctga aggtgtccag ctgcgacaag aacaccggcg actactacga ggacagctat

39603960

gaggacatca gcgcctacct gctgagcaag aacaatgcca tcgagcctcg gagcttcagc gaggacatca gcgcctacct gctgagcaag aacaatgcca tcgagcctcg gagcttcagc

40204020

cagaatcctc ctgtgctgaa gcggcaccag cgcgagatca ccagaacaac cctgcagagc cagaatcctc ctgtgctgaa gcggcaccag cgcgagatca ccagaacaac cctgcagagc

40804080

gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc

41404140

gacatctacg acgaggacga gaatcagagc cccagaagct ttcagaaaaa gacccggcac gacatctacg acgaggacga gaatcagagc cccagaagct ttcagaaaaa gacccggcac

42004200

tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg

42604260

ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag

43204320

ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc

43804380

ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat

44404440

caggctagcc ggccttacag cttctacagc tccctgatca gctacgaaga ggaccagaga caggctagcc ggccttacag cttctacagc tccctgatca gctacgaaga ggaccagaga

45004500

cagggcgctg agcccagaaa gaacttcgtg aagcccaacg agactaagac ctacttttgg cagggcgctg agcccagaaa gaacttcgtg aagcccaacg agactaagac ctacttttgg

45604560

aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac

46204620

ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg

46804680

tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc

47404740

ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg

48004800

aactgcagag ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg aactgcagag ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg

48604860

ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat

49204920

cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac

49804980

ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat

50405040

ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga

51005100

gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac

51605160

agcaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc agcaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc

52205220

accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctacagcggc accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctacagcggc

52805280

agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct

53405340

cccatgatca tccacggaat caagacccag ggcgccagac agaagttcag cagcctgtac cccatgatca tccacggaat caagacccag ggcgccagac agaagttcag cagcctgtac

54005400

atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacagaggc atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacagaggc

54605460

aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac

55205520

aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc

55805580

atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc

56405640

ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc ctcggaatgg aaagcaaggc catcagcgac gccgatca cagccagcag ctacttcacc

57005700

aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac

57605760

gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc

58205820

atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg

58805880

aaagagttcc tgatctccag cagccaggac ggccatcagt ggaccctgtt tttccagaac aaagagttcc tgatctccag cagccaggac ggccatcagt ggaccctgtt tttccagaac

59405940

ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg

60006000

gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc

60606060

gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc

61206120

atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa

61806180

atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta

62406240

gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg

63006300

ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact

63606360

atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg

64206420

cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag

64806480

aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa

65406540

cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc

66006600

ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacaggg

66606660

ctaggttgct gggcactgat aattccgtgg tgttgtcatc gattccataa agtaggaaac ctaggttgct gggcactgat aattccgtgg tgttgtcatc gattccataa agtaggaaac

67206720

actacacgat tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca actacacgat tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca

67806780

gttaactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gttaactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt

68406840

gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca

69006900

ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga

69606960

ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cggcgcgccg ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cggcgcgccg

70207020

catggctacg tagataagta gcatggcggg ttaatcatta actacacctg caggaggaac catggctacg tagataagta gcatggcggg ttaatcatta actacacctg caggaggaac

70807080

ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc

71407140

gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg

72007200

caggtcgacg ctagcagctg atgcatagca tgcggtaccg ggagatgggg gaggctaact caggtcgacg ctagcagctg atgcatagca tgcggtaccg ggagatgggg gaggctaact

72607260

gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag

73207320

aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg

73807380

gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg tttcttcctt gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg tttcttcctt

74407440

ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc

75007500

ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact atagctagag ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact atagctagag

75607560

tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac cacttcatcc tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac cacttcatcc

76207620

ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc ctgaagccag ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc ctgaagccag

76807680

ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa tgcctgacga ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa tgcctgacga

77407740

tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc ctcgacttcg tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc ctcgacttcg

78007800

ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc acgaacccag ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc acgaacccag

78607860

ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg ctcacgcaac ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg ctcacgcaac

79207920

tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt tttcatggct tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt tttcatggct

79807980

tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca agcgcgttac tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca agcgcgttac

80408040

gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca gcaacgatgt gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca gcaacgatgt

81008100

tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcatcattcg tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcatcattcg

81608160

cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg atcttttcgg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg atcttttcgg

82208220

tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg attacctcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg attacctcgg

82808280

gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag aagcggttgt gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag aagcggttgt

83408340

tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg agatctatat tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg agatctatat

84008400

ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg cgctcatcaa ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg cgctcatcaa

84608460

tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc aagcagatta tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc aagcagatta

85208520

cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagtgatgca cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagtgatgca

85808580

ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga tcggcttccc ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga tcggcttccc

86408640

ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt accatgccct ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt accatgccct

87008700

tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga agagtttgct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga agagtttgct

87608760

ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga tttcagttta ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga tttcagttta

88208820

caactattct gtctagttta agactttatt gtcatagttt agatctattt tgttcagttt caactattct gtctagttta agactttatt gtcatagttt agatctattt tgttcagttt

88808880

aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta ctcaaccgta aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta ctcaaccgta

89408940

accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca gatgcgtaag accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca gatgcgtaag

90009000

gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt

90609060

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga

91209120

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg cccaggaaccg

91809180

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa

92409240

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt

93009300

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct

93609360

gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct

94209420

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc

94809480

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt

95409540

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc

96009600

tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat

96609660

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa

97209720

acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa

97809780

aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga

98409840

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct

99009900

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga

99609960

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc

1002010020

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg

1008010080

ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat

1014010140

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat

1020010200

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg

1026010260

caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc

1032010320

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa

1038010380

agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc

1044010440

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt

1050010500

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag

1056010560

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt

1062010620

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag

1068010680

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac

1074010740

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc

1080010800

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca

1086010860

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg

1092010920

ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt

1098010980

aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg

1104011040

caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg

1110011100

gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta

1116011160

tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg

1122011220

ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa

1128011280

gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct

1134011340

ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct

1140011400

acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc agtcaattac acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc agtcaattac

1146011460

aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag aa aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag aa

1151211512

<210> 202<210> 202

<211> 10563<211> 10563

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 202<400> 202

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60 60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120 120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180 180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240 240

atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg

300 300

cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag

360 360

cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc

420 420

cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac

480 480

cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca

540 540

catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt

600 600

aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc

660 660

agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag agcttggcag ggatcagcag cctgggttgg aaggagggg tataaaagcc ccttcaccag

720 720

gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg

780 780

ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg

840 840

ttggtttaaa ccgcagccac catgcagatc gagctgtcta cctgcttctt cctgtgcctg ttggtttaaa ccgcagccac catgcagatc gagctgtcta cctgcttctt cctgtgcctg

900 900

ctgcggttct gcttcagcgc caccagaaga tattacctgg gcgccgtgga actgagctgg ctgcggttct gcttcagcgc caccagaaga tattacctgg gcgccgtgga actgagctgg

960 960

gactacatgc agtctgacct gggagagctg cccgtggacg ctagatttcc tccaagagtg gactacatgc agtctgacct gggagagctg cccgtggacg ctagatttcc tccaagagtg

10201020

cccaagagct tccccttcaa cacctccgtg gtgtacaaga aaaccctgtt cgtggaattc cccaagagct tccccttcaa cacctccgtg gtgtacaaga aaaccctgtt cgtggaattc

10801080

accgaccacc tgttcaatat cgccaagcct cggcctcctt ggatgggact gctgggacct accgaccacc tgttcaatat cgccaagcct cggcctcctt ggatgggact gctgggacct

11401140

acaattcagg ccgaggtgta cgacaccgtg gtcatcaccc tgaagaacat ggccagccat acaattcagg ccgaggtgta cgacaccgtg gtcatcaccc tgaagaacat ggccagccat

12001200

cctgtgtctc tgcacgccgt gggagtgtct tattggaagg cttctgaggg cgccgagtac cctgtgtctc tgcacgccgt gggagtgtct tattggaagg cttctgaggg cgccgagtac

12601260

gacgatcaga caagccagag agagaaagag gacgacaagg ttttccctgg cggcagccac gacgatcaga caagccagag agagaaagag gacgacaagg ttttccctgg cggcagccac

13201320

acctatgtct ggcaggtcct gaaagaaaac ggccctatgg cctccgatcc tctgtgcctg acctatgtct ggcaggtcct gaaagaaaac ggccctatgg cctccgatcc tctgtgcctg

13801380

acatacagct acctgagcca cgtggacctg gtcaaggacc tgaattctgg cctgatcgga acatacagct acctgagcca cgtggacctg gtcaaggacc tgaattctgg cctgatcgga

14401440

gccctgctcg tgtgtagaga aggcagcctg gccaaagaga aaacccagac actgcacaag gccctgctcg tgtgtagaga aggcagcctg gccaaagaga aaacccagac actgcacaag

15001500

ttcatcctgc tgttcgccgt gttcgacgag ggcaagagct ggcacagcga gacaaagaac ttcatcctgc tgttcgccgt gttcgacgag ggcaagagct ggcacagcga gacaaagaac

15601560

agcctgatgc aggacaggga tgccgcctct gctagagctt ggcctaagat gcacaccgtg agcctgatgc aggacagga tgccgcctct gctagagctt ggcctaagat gcacaccgtg

16201620

aacggctacg tgaacagaag cctgcctgga ctgatcggct gccacagaaa gtccgtgtac aacggctacg tgaacagaag cctgcctgga ctgatcggct gccacagaaa gtccgtgtac

16801680

tggcacgtga tcggcatggg cacaacacct gaggtgcaca gcatctttct ggaaggccac tggcacgtga tcggcatggg cacaacacct gaggtgcaca gcatctttct ggaaggccac

17401740

accttcctcg tgcggaacca cagacaggcc agcctggaaa tcagccctat caccttcctg accttcctcg tgcggaacca cagacaggcc agcctggaaa tcagccctat caccttcctg

18001800

accgctcaga ccctgctgat ggatctgggc cagtttctgc tgttctgcca catcagctcc accgctcaga ccctgctgat ggatctgggc cagtttctgc tgttctgcca catcagctcc

18601860

caccagcacg atggcatgga agcctacgtg aaggtggaca gctgccccga agaaccccag caccagcacg atggcatgga agcctacgtg aaggtggaca gctgccccga agaaccccag

19201920

ctgcggatga agaacaacga ggaagccgag gactacgacg acgacctgac cgactctgag ctgcggatga agaacaacga ggaagccgag gactacgacg acgacctgac cgactctgag

19801980

atggacgtcg tcagattcga cgacgataac agccccagct tcatccagat cagaagcgtg atggacgtcg tcagattcga cgacgataac agccccagct tcatccagat cagaagcgtg

20402040

gccaagaagc accccaagac ctgggtgcac tatatcgccg ccgaggaaga ggactgggat gccaagaagc accccaagac ctgggtgcac tatatcgccg ccgaggaaga ggactgggat

21002100

tacgctcctc tggtgctggc ccctgacgac agaagctaca agagccagta cctgaacaac tacgctcctc tggtgctggc ccctgacgac agaagctaca agagccagta cctgaacaac

21602160

ggccctcagc ggatcggccg gaagtataag aaagtgcggt tcatggccta caccgacgag ggccctcagc ggatcggccg gaagtataag aaagtgcggt tcatggccta caccgacgag

22202220

acattcaaga ccagagaggc catccagcac gagagcggaa ttctgggccc tctgctgtat acattcaaga ccagagaggc catccagcac gagagcggaa ttctgggccc tctgctgtat

22802280

ggcgaagtgg gcgatacact gctgatcatc ttcaagaacc aggccagcag accctacaac ggcgaagtgg gcgatacact gctgatcatc ttcaagaacc aggccagcag accctacaac

23402340

atctaccctc acggcatcac cgatgtgcgg cccctgtatt ctagaaggct gcccaagggc atctaccctc acggcatcac cgatgtgcgg cccctgtatt ctagaaggct gcccaagggc

24002400

gtgaagcacc tgaaggactt ccctatcctg cctggcgaga ttttcaagta caagtggacc gtgaagcacc tgaaggactt ccctatcctg cctggcgaga ttttcaagta caagtggacc

24602460

gtgaccgtgg aagatggccc caccaagagc gaccctagat gtctgacacg gtactacagc gtgaccgtgg aagatggccc caccaagagc gaccctagat gtctgacacg gtactacagc

25202520

agcttcgtga acatggaacg cgacctggcc agcggcctga ttggacctct gctgatctgc agcttcgtga acatggaacg cgacctggcc agcggcctga ttggacctct gctgatctgc

25802580

tacaaagaaa gcgtggacca gcggggcaac cagatcatga gcgacaagcg gaacgtgatc tacaaagaaa gcgtggacca gcggggcaac cagatcatga gcgacaagcg gaacgtgatc

26402640

ctgtttagcg tgttcgatga gaaccggtcc tggtatctga ccgagaacat ccagcggttt ctgtttagcg tgttcgatga gaaccggtcc tggtatctga ccgagaacat ccagcggttt

27002700

ctgcccaatc ctgccggggt gcaactggaa gatcctgagt tccaggcaag caacatcatg ctgcccaatc ctgccggggt gcaactggaa gatcctgagt tccaggcaag caacatcatg

27602760

cactccatca atggctatgt gttcgacagc ctgcagctga gcgtgtgcct gcacgaagtg cactccatca atggctatgt gttcgacagc ctgcagctga gcgtgtgcct gcacgaagtg

28202820

gcctactggt acatcctgag cattggcgcc cagaccgact tcctgtccgt gttctttagc gcctactggt acatcctgag cattggcgcc cagaccgact tcctgtccgt gttctttagc

28802880

ggctacacct tcaagcacaa gatggtgtac gaggataccc tgacactgtt cccattcagc ggctacacct tcaagcacaa gatggtgtac gaggataccc tgacactgtt cccattcagc

29402940

ggcgagacag tgttcatgag catggaaaac cccggcctgt ggattctggg ctgtcacaac ggcgagacag tgttcatgag catggaaaac cccggcctgt ggattctggg ctgtcacaac

30003000

agcgacttcc ggaacagagg catgacagcc ctgctgaagg tgtccagctg cgacaagaac agcgacttcc ggaacagagg catgacagcc ctgctgaagg tgtccagctg cgacaagaac

30603060

accggcgact actacgagga cagctatgag gacatcagcg cctacctgct gagcaagaac accggcgact actacgagga cagctatgag gacatcagcg cctacctgct gagcaagaac

31203120

aatgccatcg agcctcggag cttcagccag aatcctcctg tgctgaagcg gcaccagcgc aatgccatcg agcctcggag cttcagccag aatcctcctg tgctgaagcg gcaccagcgc

31803180

gagatcacca gaacaaccct gcagagcgac caagaggaaa tcgattacga cgacaccatc gagatcacca gaacaaccct gcagagcgac caagaggaaa tcgattacga cgacaccatc

32403240

agcgtcgaga tgaagaaaga agatttcgac atctacgacg aggacgagaa tcagagcccc agcgtcgaga tgaagaaaga agatttcgac atctacgacg aggacgagaa tcagagcccc

33003300

agaagctttc agaaaaagac ccggcactac ttcattgccg ccgtcgagag actgtgggac agaagctttc agaaaaagac ccggcactac ttcattgccg ccgtcgagag actgtgggac

33603360

tacggcatgt ctagcagccc tcacgtgctg agaaatagag cccagagcgg cagcgtgccc tacggcatgt ctagcagccc tcacgtgctg agaaatagag cccagagcgg cagcgtgccc

34203420

cagttcaaga aagtggtgtt ccaagagttc accgacggca gcttcaccca gccactgtat cagttcaaga aagtggtgtt ccaagagttc accgacggca gcttcaccca gccactgtat

34803480

agaggcgagc tgaacgagca tctgggcctg ctgggccctt atatcagagc cgaagtggaa agaggcgagc tgaacgagca tctgggcctg ctgggccctt atatcagagc cgaagtggaa

35403540

gataacatca tggtcacctt ccggaatcag gctagccggc cttacagctt ctacagctcc gataacatca tggtcacctt ccggaatcag gctagccggc cttacagctt ctacagctcc

36003600

ctgatcagct acgaagagga ccagagacag ggcgctgagc ccagaaagaa cttcgtgaag ctgatcagct acgaagagga ccagagacag ggcgctgagc ccagaaagaa cttcgtgaag

36603660

cccaacgaga ctaagaccta cttttggaag gtgcagcacc acatggcccc tacaaaggac cccaacgaga ctaagaccta cttttggaag gtgcagcacc acatggcccc tacaaaggac

37203720

gagttcgact gcaaagcctg ggcctacttc tccgatgtgg atctggaaaa ggacgtgcac gagttcgact gcaaagcctg ggcctacttc tccgatgtgg atctggaaaa ggacgtgcac

37803780

agcgggctca tcggaccact gcttgtgtgc cacaccaaca cactgaaccc cgctcacggc agcgggctca tcggaccact gcttgtgtgc cacaccaaca cactgaaccc cgctcacggc

38403840

agacaagtga cagtgcaaga gttcgccctg ttcttcacca tcttcgacga aacaaagagc agacaagtga cagtgcaaga gttcgccctg ttcttcacca tcttcgacga aacaaagagc

39003900

tggtacttca ccgagaatat ggaacggaac tgcagagccc cttgcaacat ccagatggaa tggtacttca ccgagaatat ggaacggaac tgcagagccc cttgcaacat ccagatggaa

39603960

gatcccacct tcaaagagaa ctaccggttc cacgccatca acggctacat catggacaca gatcccacct tcaaagagaa ctaccggttc cacgccatca acggctacat catggacaca

40204020

ctgcccggcc tggttatggc ccaggatcag agaatccggt ggtatctgct gtccatgggc ctgcccggcc tggttatggc ccaggatcag agaatccggt ggtatctgct gtccatgggc

40804080

tccaacgaga atatccacag catccacttc agcggccacg tgttcaccgt gcggaaaaaa tccaacgaga atatccacag catccacttc agcggccacg tgttcaccgt gcggaaaaaa

41404140

gaagagtaca aaatggccct gtacaatctg taccctgggg tgttcgaaac cgtggaaatg gaagagtaca aaatggccct gtacaatctg taccctgggg tgttcgaaac cgtggaaatg

42004200

ctgccttcca aggccggcat ttggagagtg gaatgtctga ttggagagca cctccacgcc ctgccttcca aggccggcat ttggagagtg gaatgtctga ttggagagca cctccacgcc

42604260

ggaatgagca ccctgtttct ggtgtacagc aacaagtgtc agacccctct cggcatggcc ggaatgagca ccctgtttct ggtgtacagc aacaagtgtc agacccctct cggcatggcc

43204320

tctggacaca tcagagactt ccagatcacc gcctctggcc agtacggaca gtgggctcct tctggacaca tcagagactt cgagatcacc gcctctggcc agtacggaca gtgggctcct

43804380

aaactggctc ggctgcacta cagcggcagc atcaatgcct ggtccaccaa agagcccttc aaactggctc ggctgcacta cagcggcagc atcaatgcct ggtccaccaa agagcccttc

44404440

agctggatca aggtggacct gctggctccc atgatcatcc acggaatcaa gacccagggc agctggatca aggtggacct gctggctccc atgatcatcc acggaatcaa gacccagggc

45004500

gccagacaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac gccagacaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac

45604560

ggcaagaagt ggcagaccta cagaggcaac agcaccggca cactcatggt gttcttcggc ggcaagaagt ggcagaccta cagaggcaac agcaccggca cactcatggt gttcttcggc

46204620

aacgtggact ccagcggcat taagcacaac atcttcaacc ctccaatcat tgcccggtac aacgtggact ccagcggcat taagcacaac atcttcaacc ctccaatcat tgcccggtac

46804680

atccggctgc accccacaca ctacagcatc cggtctaccc tgagaatgga actgatgggc atccggctgc accccacaca ctacagcatc cggtctaccc tgagaatgga actgatgggc

47404740

tgcgacctga acagctgctc tatgcccctc ggaatggaaa gcaaggccat cagcgacgcc tgcgacctga acagctgctc tatgcccctc ggaatggaaa gcaaggccat cagcgacgcc

48004800

cagatcacag ccagcagcta cttcaccaac atgttcgcca cttggagccc ctccaaggct cagatcacag ccagcagcta cttcaccaac atgttcgcca cttggagccc ctccaaggct

48604860

agactgcatc tgcagggcag aagcaacgct tggaggcccc aagtgaacaa ccccaaagag agactgcatc tgcagggcag aagcaacgct tggaggcccc aagtgaacaa ccccaaagag

49204920

tggctgcagg ttgactttca aaagaccatg aaagtgaccg gcgtgaccac acagggcgtc tggctgcagg ttgactttca aaagaccatg aaagtgaccg gcgtgaccac acagggcgtc

49804980

aagtctctgc tgacctctat gtacgtgaaa gagttcctga tctccagcag ccaggacggc aagtctctgc tgacctctat gtacgtgaaa gagttcctga tctccagcag ccaggacggc

50405040

catcagtgga ccctgttttt ccagaacggc aaagtgaaag tgttccaggg caatcaggac catcagtgga ccctgttttt ccagaacggc aaagtgaaag tgttccaggg caatcaggac

51005100

agcttcacac ccgtggtcaa ttctctggac cctccactgc tgaccagata cctgcggatt agcttcacac ccgtggtcaa ttctctggac cctccactgc tgaccagata cctgcggatt

51605160

caccctcagt cttgggtgca ccagatcgct ctgcggatgg aagtgctggg ctgtgaagct caccctcagt cttgggtgca ccagatcgct ctgcggatgg aagtgctggg ctgtgaagct

52205220

caggacctct actagttaat taagagcatc ttaccgccat ttattcccat atttgttctg caggacctct actagttaat taagagcatc ttaccgccat ttattcccat atttgttctg

52805280

tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt

53405340

tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta

54005400

agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt

54605460

gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg

55205520

ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt

55805580

ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg

56405640

tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc

57005700

aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg

57605760

cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt

58205820

tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga

58805880

ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt ccctggaagg tgccactccc actngtccttt cctaataaaa tgaggaaatt gcatcgcatt

59405940

gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg

60006000

attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg

60606060

gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct

61206120

agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc

61806180

aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg

62406240

ggcgcgcctc gagccatggt gctagcagct gatgcatagc atgcggtacc gggagatggg ggcgcgcctc gagccatggt gctagcagct gatgcatagc atgcggtacc gggagatggg

63006300

ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa

63606360

taaaaagaca gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg taaaaagaca gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg

64206420

tcccagggct ggcactctgt cgatacccca ccgagacccc attgggacca atacgcccgc tcccagggct ggcactctgt cgatacccca ccgagacccc attgggacca atacgcccgc

64806480

gtttcttcct tttccccacc ccaaccccca agttcgggtg aaggcccagg gctcgcagcc gtttcttcct tttccccacc ccaaccccca agttcgggtg aaggcccagg gctcgcagcc

65406540

aacgtcgggg cggcaagccc tgccatagcc actacgggta cgtaggccaa ccactagaac aacgtcgggg cggcaagccc tgccatagcc actacgggta cgtaggccaa ccactagaac

66006600

tatagctaga gtcctgggcg aacaaacgat gctcgccttc cagaaaaccg aggatgcgaa tatagctaga gtcctgggcg aacaaacgat gctcgccttc cagaaaaccg aggatgcgaa

66606660

ccacttcatc cggggtcagc accaccggca agcgccgcga cggccgaggt ctaccgatct ccacttcatc cggggtcagc accaccggca agcgccgcga cggccgaggt ctaccgatct

67206720

cctgaagcca gggcagatcc gtgcacagca ccttgccgta gaagaacagc aaggccgcca cctgaagcca gggcagatcc gtgcacagca ccttgccgta gaagaacagc aaggccgcca

67806780

atgcctgacg atgcgtggag accgaaacct tgcgctcgtt cgccagccag gacagaaatg atgcctgacg atgcgtggag accgaaacct tgcgctcgtt cgccagccag gacagaaatg

68406840

cctcgacttc gctgctgccc aaggttgccg ggtgacgcac accgtggaaa cggatgaagg cctcgacttc gctgctgccc aaggttgccg ggtgacgcac accgtggaaa cggatgaagg

69006900

cacgaaccca gttgacataa gcctgttcgg ttcgtaaact gtaatgcaag tagcgtatgc cacgaaccca gttgacataa gcctgttcgg ttcgtaaact gtaatgcaag tagcgtatgc

69606960

gctcacgcaa ctggtccaga accttgaccg aacgcagcgg tggtaacggc gcagtggcgg gctcacgcaa ctggtccaga accttgaccg aacgcagcgg tggtaacggc gcagtggcgg

70207020

ttttcatggc ttgttatgac tgtttttttg tacagtctat gcctcgggca tccaagcagc ttttcatggc ttgttatgac tgtttttttg tacagtctat gcctcgggca tccaagcagc

70807080

aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat gttacgcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat gttacgcagc

71407140

agcaacgatg ttacgcagca gggcagtcgc cctaaaacaa agttaggtgg ctcaagtatg agcaacgatg ttacgcagca gggcagtcgc cctaaaacaa agttaggtgg ctcaagtatg

72007200

ggcatcattc gcacatgtag gctcggccct gaccaagtca aatccatgcg ggctgctctt ggcatcattc gcacatgtag gctcggccct gaccaagtca aatccatgcg ggctgctctt

72607260

gatcttttcg gtcgtgagtt cggagacgta gccacctact cccaacatca gccggactcc gatcttttcg gtcgtgagtt cggagacgta gccacctact cccaacatca gccggactcc

73207320

gattacctcg ggaacttgct ccgtagtaag acattcatcg cgcttgctgc cttcgaccaa gattacctcg ggaacttgct ccgtagtaag acattcatcg cgcttgctgc cttcgaccaa

73807380

gaagcggttg ttggcgctct cgcggcttac gttctgccca ggtttgagca gccgcgtagt gaagcggttg ttggcgctct cgcggcttac gttctgccca ggtttgagca gccgcgtagt

74407440

gagatctata tctatgatct cgcagtctcc ggcgagcacc ggaggcaggg cattgccacc gagatctata tctatgatct cgcagtctcc ggcgagcacc ggaggcaggg cattgccacc

75007500

gcgctcatca atctcctcaa gcatgaggcc aacgcgcttg gtgcttatgt gatctacgtg gcgctcatca atctcctcaa gcatgaggcc aacgcgcttg gtgcttatgt gatctacgtg

75607560

caagcagatt acggtgacga tcccgcagtg gctctctata caaagttggg catacgggaa caagcagatt acggtgacga tcccgcagtg gctctctata caaagttggg catacgggaa

76207620

gaagtgatgc actttgatat cgacccaagt accgccacct aacaattcgt tcaagccgag gaagtgatgc actttgatat cgacccaagt accgccacct aacaattcgt tcaagccgag

76807680

atcggcttcc cggccgcgga gttgttcggt aaattgtcac aacgccgcga atatagtctt atcggcttcc cggccgcgga gttgttcggt aaattgtcac aacgccgcga atatagtctt

77407740

taccatgccc ttggccacgc ccctctttaa tacgacgggc aatttgcact tcagaaaatg taccatgccc ttggccacgc ccctctttaa tacgacgggc aatttgcact tcagaaaatg

78007800

aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat aactggactg aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat aactggactg

78607860

atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt tagatctatt atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt tagatctatt

79207920

ttgttcagtt taagacttta ttgtccgccc acacccgctt acgcagggca tccatttatt ttgttcagtt taagacttta ttgtccgccc acacccgctt acgcagggca tccatttatt

79807980

actcaaccgt aaccgatttt gccaggttac gcggctggtc tgcggtgtga aataccgcac actcaaccgt aaccgatttt gccaggttac gcggctggtc tgcggtgtga aataccgcac

80408040

agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg

81008100

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg

81608160

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag

82208220

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac

82808280

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga

83408340

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt

84008400

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc

84608460

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc

85208520

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta

85808580

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat

86408640

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca

87008700

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct

87608760

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt

88208820

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct

88808880

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc

89408940

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa

90009000

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta

90609060

tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc

91209120

ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat

91809180

ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta

92409240

tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt

93009300

aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt

93609360

ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg

94209420

ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc

94809480

gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc

95409540

gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg

96009600

cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga

96609660

actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta

97209720

ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct

97809780

tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag

98409840

ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga

99009900

agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat

99609960

aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgaaat tgtaaacgtt aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgaaat tgtaaacgtt

1002010020

aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag

1008010080

gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt

1014010140

gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga

1020010200

aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg

1026010260

gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct

1032010320

tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc

1038010380

gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt

1044010440

aatgcgccgc tacagggcgc gtcccattcg ccattcaggc tgcaaataag cgttgatatt aatgcgccgc tacagggcgc gtcccattcg ccattcaggc tgcaaataag cgttgatatt

1050010500

cagtcaatta caaacattaa taacgaagag atgacagaaa aattttcatt ctgtgacaga cagtcaatta caaacattaa taacgaagag atgacagaaa aattttcatt ctgtgacaga

1056010560

gaa gaa

1056310563

<210> 203<210> 203

<211> 9871<211> 9871

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 203<400> 203

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gagtttgctg cttgcaatgt ttgcccattt tagggtggac atctacgtag ccatgctcta gagtttgctg cttgcaatgt ttgcccattt tagggtggac

240 240

acaggacgct gtggtttctg agccaggggg cgactcagat cccagccagt ggacttagcc acaggacgct gtggtttctg agccagggg cgactcagat cccagccagt ggacttagcc

300 300

cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc

360 360

gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct

420 420

tcaggcacca ccactgacct gggacagtga atcgccacca tgcagattga gctgagcacc tcaggcacca ccactgacct gggacagtga atcgccacca tgcagattga gctgagcacc

480 480

tgcttcttcc tgtgcctgct gaggttctgc ttctctgcca ccaggagata ctacctgggg tgcttcttcc tgtgcctgct gaggttctgc ttctctgcca ccaggagata ctacctgggg

540 540

gctgtggagc tgagctggga ctacatgcag tctgacctgg gggagctgcc tgtggatgcc gctgtggagc tgagctggga ctacatgcag tctgacctgg gggagctgcc tgtggatgcc

600 600

aggttccccc ccagagtgcc caagagcttc cccttcaaca cctctgtggt gtacaagaag aggttccccc ccagagtgcc caagagcttc cccttcaaca cctctgtggt gtacaagaag

660 660

accctgtttg tggagttcac tgaccacctg ttcaacattg ccaagcccag gcccccctgg accctgtttg tggagttcac tgaccacctg ttcaacattg ccaagcccag gcccccctgg

720 720

atgggcctgc tgggccccac catccaggct gaggtgtatg acactgtggt gatcaccctg atgggcctgc tgggccccac catccaggct gaggtgtatg acactgtggt gatcaccctg

780 780

aagaacatgg ccagccaccc tgtgagcctg catgctgtgg gggtgagcta ctggaaggcc aagaacatgg ccagccaccc tgtgagcctg catgctgtgg gggtgagcta ctggaaggcc

840 840

tctgaggggg ctgagtatga tgaccagacc agccagaggg agaaggagga tgacaaggtg tctgaggggg ctgagtatga tgaccagacc agccagaggg agaaggagga tgacaaggtg

900 900

ttccctgggg gcagccacac ctatgtgtgg caggtgctga aggagaatgg ccccatggcc ttccctgggg gcagccacac ctatgtgtgg caggtgctga aggagaatgg ccccatggcc

960 960

tctgaccccc tgtgcctgac ctacagctac ctgagccatg tggacctggt gaaggacctg tctgaccccc tgtgcctgac ctacagctac ctgagccatg tggacctggt gaaggacctg

10201020

aactctggcc tgattggggc cctgctggtg tgcagggagg gcagcctggc caaggagaag aactctggcc tgattggggc cctgctggtg tgcagggagg gcagcctggc caaggagaag

10801080

acccagaccc tgcacaagtt catcctgctg tttgctgtgt ttgatgaggg caagagctgg acccagaccc tgcacaagtt catcctgctg tttgctgtgt ttgatgaggg caagagctgg

11401140

cactctgaaa ccaagaacag cctgatgcag gacagggatg ctgcctctgc cagggcctgg cactctgaaa ccaagaacag cctgatgcag gacagggatg ctgcctctgc cagggcctgg

12001200

cccaagatgc acactgtgaa tggctatgtg aacaggagcc tgcctggcct gattggctgc cccaagatgc acactgtgaa tggctatgtg aacaggagcc tgcctggcct gattggctgc

12601260

cacaggaagt ctgtgtactg gcatgtgatt ggcatgggca ccacccctga ggtgcacagc cacaggaagt ctgtgtactg gcatgtgatt ggcatgggca ccacccctga ggtgcacagc

13201320

atcttcctgg agggccacac cttcctggtc aggaaccaca ggcaggccag cctggagatc atcttcctgg agggccacac cttcctggtc aggaaccaca ggcaggccag cctggagatc

13801380

agccccatca ccttcctgac tgcccagacc ctgctgatgg acctgggcca gttcctgctg agccccatca ccttcctgac tgcccagacc ctgctgatgg acctgggcca gttcctgctg

14401440

ttctgccaca tcagcagcca ccagcatgat ggcatggagg cctatgtgaa ggtggacagc ttctgccaca tcagcagcca ccagcatgat ggcatggagg cctatgtgaa ggtggacagc

15001500

tgccctgagg agccccagct gaggatgaag aacaatgagg aggctgagga ctatgatgat tgccctgagg agccccagct gaggatgaag aacaatgagg aggctgagga ctatgatgat

15601560

gacctgactg actctgagat ggatgtggtg aggtttgatg atgacaacag ccccagcttc gacctgactg actctgagat ggatgtggtg aggtttgatg atgacaacag ccccagcttc

16201620

atccagatca ggtctgtggc caagaagcac cccaagacct gggtgcacta cattgctgct atccagatca ggtctgtggc caagaagcac cccaagacct gggtgcacta cattgctgct

16801680

gaggaggagg actgggacta tgcccccctg gtgctggccc ctgatgacag gagctacaag gaggaggagg actgggacta tgcccccctg gtgctggccc ctgatgacag gagctacaag

17401740

agccagtacc tgaacaatgg cccccagagg attggcagga agtacaagaa ggtcaggttc agccagtacc tgaacaatgg cccccagagg attggcagga agtacaagaa ggtcaggttc

18001800

atggcctaca ctgatgaaac cttcaagacc agggaggcca tccagcatga gtctggcatc atggcctaca ctgatgaaac cttcaagacc agggaggcca tccagcatga gtctggcatc

18601860

ctgggccccc tgctgtatgg ggaggtgggg gacaccctgc tgatcatctt caagaaccag ctgggccccc tgctgtatgg ggaggtgggg gacaccctgc tgatcatctt caagaaccag

19201920

gccagcaggc cctacaacat ctacccccat ggcatcactg atgtgaggcc cctgtacagc gccagcaggc cctacaacat ctacccccat ggcatcactg atgtgaggcc cctgtacagc

19801980

aggaggctgc ccaagggggt gaagcacctg aaggacttcc ccatcctgcc tggggagatc aggaggctgc ccaagggggt gaagcacctg aaggacttcc ccatcctgcc tggggagatc

20402040

ttcaagtaca agtggactgt gactgtggag gatggcccca ccaagtctga ccccaggtgc ttcaagtaca agtggactgt gactgtggag gatggcccca ccaagtctga ccccaggtgc

21002100

ctgaccagat actacagcag ctttgtgaac atggagaggg acctggcctc tggcctgatt ctgaccagat actacagcag ctttgtgaac atggagaggg acctggcctc tggcctgatt

21602160

ggccccctgc tgatctgcta caaggagtct gtggaccaga ggggcaacca gatcatgtct ggccccctgc tgatctgcta caaggagtct gtggaccaga ggggcaacca gatcatgtct

22202220

gacaagagga atgtgatcct gttctctgtg tttgatgaga acaggagctg gtacctgact gacaagagga atgtgatcct gttctctgtg tttgatgaga acaggagctg gtacctgact

22802280

gagaacatcc agaggttcct gcccaaccct gctggggtgc agctggagga ccctgagttc gagaacatcc agaggttcct gcccaaccct gctggggtgc agctggagga ccctgagttc

23402340

caggccagca acatcatgca cagcatcaat ggctatgtgt ttgacagcct gcagctgtct caggccagca acatcatgca cagcatcaat ggctatgtgt ttgacagcct gcagctgtct

24002400

gtgtgcctgc atgaggtggc ctactggtac atcctgagca ttggggccca gactgacttc gtgtgcctgc atgaggtggc ctactggtac atcctgagca ttggggccca gactgacttc

24602460

ctgtctgtgt tcttctctgg ctacaccttc aagcacaaga tggtgtatga ggacaccctg ctgtctgtgt tcttctctgg ctacaccttc aagcacaaga tggtgtatga ggacaccctg

25202520

accctgttcc ccttctctgg ggagactgtg ttcatgagca tggagaaccc tggcctgtgg accctgttcc ccttctctgg ggagactgtg ttcatgagca tggagaaccc tggcctgtgg

25802580

attctgggct gccacaactc tgacttcagg aacaggggca tgactgccct gctgaaagtc attctgggct gccacaactc tgacttcagg aacaggggca tgactgccct gctgaaagtc

26402640

tccagctgtg acaagaacac tggggactac tatgaggaca gctatgagga catctctgcc tccagctgtg acaagaacac tggggactac tatgaggaca gctatgagga catctctgcc

27002700

tacctgctga gcaagaacaa tgccattgag cccaggagct tcagccagaa ccccccagtg tacctgctga gcaagaacaa tgccattgag cccaggagct tcagccagaa ccccccagtg

27602760

ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt

28202820

gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag

28802880

gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt cattgctgct gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt cattgctgct

29402940

gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc

30003000

cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc

30603060

ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac

31203120

atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc

31803180

tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc

32403240

aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac

33003300

atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac

33603360

ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc

34203420

ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc

34803480

tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc

35403540

tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat

36003600

ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg

36603660

tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg

37203720

ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg

37803780

tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt

38403840

ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag

39003900

acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag

39603960

tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg

40204020

agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat

40804080

ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc

41404140

atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc

42004200

ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc

42604260

cccatcattg ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg cccatcattg ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg

43204320

aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc

43804380

aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc

44404440

tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag

45004500

gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg

45604560

gtgaccaccc agggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc gtgaccaccc aggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc

46204620

agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg

46804680

ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg

47404740

accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag

48004800

gtgctgggct gtgaggccca ggacctgtac tgaaataaaa gatctttatt ttcattagat gtgctgggct gtgaggccca ggacctgtac tgaaataaaa gatctttatt ttcattagat

48604860

ctgtgtgttg gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt ctgtgtgttg gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt

49204920

taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct

49804980

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

50405040

cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa

51005100

gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact

51605160

tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt

52205220

tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa

52805280

tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa

53405340

tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa

54005400

gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta

54605460

cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccattcc

55205520

acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat

55805580

gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt

56405640

ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact

57005700

gaatatcaac gcttatttgc agcctgaatg gcgaatggga cgcgccctgt agcggcgcat gaatatcaac gcttatttgc agcctgaatg gcgaatggga cgcgccctgt agcggcgcat

57605760

taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag

58205820

cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc

58805880

aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc aagctctaaa tcggggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc

59405940

ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt

60006000

ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa

60606060

caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg

61206120

cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat

61806180

taacgtttac aatttcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt taacgtttac aatttcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt

62406240

tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc

63006300

ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc

63606360

ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa

64206420

aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg

64806480

gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag

65406540

ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc

66006600

gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta

66606660

cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg

67206720

cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca

67806780

acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac

68406840

caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat

69006900

taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg

69606960

ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata

70207020

aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta

70807080

agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa

71407140

atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag

72007200

tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg

72607260

tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact

73207320

gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg

73807380

taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc

74407440

aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata

75007500

ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta

75607560

catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc

76207620

ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg

76807680

ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac

77407740

agcgtgagca ttgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg agcgtgagca ttgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg

78007800

taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt

78607860

atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct

79207920

cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg

79807980

ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata

80408040

accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca

81008100

gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc

81608160

tgtgcggtat ttcacaccgc agaccagccg cgtaacctgg caaaatcggt tacggttgag tgtgcggtat ttcacaccgc agaccagccg cgtaacctgg caaaatcggt tacggttgag

82208220

taataaatgg atgccctgcg taagcgggtg tgggcggaca ataaagtctt aaactgaaca taataaatgg atgccctgcg taagcgggtg tgggcggaca ataaagtctt aaactgaaca

82808280

aaatagatct aaactatgac aataaagtct taaactagac agaatagttg taaactgaaa aaatagatct aaactatgac aataaagtct taaactagac agaatagttg taaactgaaa

83408340

tcagtccagt tatgctgtga aaaagcatac tggacttttg ttatggctaa agcaaactct tcagtccagt tatgctgtga aaaagcatac tggacttttg ttatggctaa agcaaactct

84008400

tcattttctg aagtgcaaat tgcccgtcgt attaaagagg ggcgtggcca agggcatggt tcattttctg aagtgcaaat tgcccgtcgt attaaagagg ggcgtggcca agggcatggt

84608460

aaagactata ttcgcggcgt tgtgacaatt taccgaacaa ctccgcggcc gggaagccga aaagactata ttcgcggcgt tgtgacaatt taccgaacaa ctccgcggcc gggaagccga

85208520

tctcggcttg aacgaattgt taggtggcgg tacttgggtc gatatcaaag tgcatcactt tctcggcttg aacgaattgt taggtggcgg tacttgggtc gatatcaaag tgcatcactt

85808580

cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt

86408640

gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg

87008700

cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct

87608760

cactacgcgg ctgctcaaac ctgggcagaa cgtaagccgc gagagcgcca acaaccgctt cactacgcgg ctgctcaaac ctgggcagaa cgtaagccgc gagagcgcca acaaccgctt

88208820

cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat

88808880

cggagtccgg ctgatgttgg gagtaggtgg ctacgtctcc gaactcacga ccgaaaagat cggagtccgg ctgatgttgg gagtaggtgg ctacgtctcc gaactcacga ccgaaaagat

89408940

caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc

90009000

ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc

90609060

tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct

91209120

tgctgcttgg atgcccgagg catagactgt acaaaaaaac agtcataaca agccatgaaa tgctgcttgg atgcccgagg catagactgt acaaaaaaac agtcataaca agccatgaaa

91809180

accgccactg cgccgttacc accgctgcgt tcggtcaagg ttctggacca gttgcgtgag accgccactg cgccgttacc accgctgcgt tcggtcaagg ttctggacca gttgcgtgag

92409240

cgcatacgct acttgcatta cagtttacga accgaacagg cttatgtcaa ctgggttcgt cgcatacgct acttgcatta cagtttacga accgaacagg cttatgtcaa ctgggttcgt

93009300

gccttcatcc gtttccacgg tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag gccttcatcc gtttccacgg tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag

93609360

gcatttctgt cctggctggc gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca gcatttctgt cctggctggc gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca

94209420

ttggcggcct tgctgttctt ctacggcaag gtgctgtgca cggatctgcc ctggcttcag ttggcggcct tgctgttctt ctacggcaag gtgctgtgca cggatctgcc ctggcttcag

94809480

gagatcggaa gacctcggcc gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg gagatcggaa gacctcggcc gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg

95409540

gttcgcatcc tcggttttct ggaaggcgag catcgtttgt tcgcccagga ctctagctat gttcgcatcc tcggttttct ggaaggcgag catcgtttgt tcgcccagga ctctagctat

96009600

agttctagtg gttggctacg tatactccgg aatattaata gatcatggag ataattaaaa agttctagtg gttggctacg tatactccgg aatattaata gatcatggag ataattaaaa

96609660

tgataaccat ctcgcaaata aataagtatt ttactgtttt cgtaacagtt ttgtaataaa tgataaccat ctcgcaaata aataagtatt ttactgtttt cgtaacagtt ttgtaataaa

97209720

aaaacctata aatattccgg attattcata ccgtcccacc atcgggcgcg gatctcggtc aaaacctata aatattccgg attattcata ccgtcccacc atcgggcgcg gatctcggtc

97809780

cgaaaccatg tcgtactacc atcaccatca ccatcacgat tacgatatcc caacgaccga cgaaaccatg tcgtactacc atcaccatca ccatcacgat tacgatatcc caacgaccga

98409840

aaacctgtat tttcagggcg ccatgggatc c aaacctgtat tttcagggcg ccatgggatc c

98719871

<210> 204<210> 204

<211> 9969<211> 9969

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 204<400> 204

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gagtctgtct gcacatttcg tagagcgagt gttccgatac atctacgtag ccatgctcta gagtctgtct gcacatttcg tagagcgagt gttccgatac

240 240

tctaatctcc ctaggcaagg ttcatattga cttaggttac ttattctcct tttgttgact tctaatctcc ctaggcaagg ttcatattga cttaggttac ttattctcct tttgttgact

300 300

aagtcaataa tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt aagtcaataa tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt

360 360

tggaaggagg gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc tggaaggagg gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc

420 420

tcctgctagc aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat tcctgctagc aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat

480 480

ggcccttgcg tgccttgaat tactgacact gacatccact ttttcttttt ctccacaggt ggcccttgcg tgccttgaat tactgacact gacatccact ttttcttttt ctccacaggt

540 540

ttaaacgcca ccatgcagat tgagctgagc acctgcttct tcctgtgtct gctgaggttc ttaaacgcca ccatgcagat tgagctgagc acctgcttct tcctgtgtct gctgaggttc

600 600

tgcttctctg ccaccaggag gtattacctg ggggctgtgg agctgagctg ggactatatg tgcttctctg ccaccaggag gtattacctg ggggctgtgg agctgagctg ggactatatg

660 660

cagtctgacc tgggggagct gcctgtggat gctaggttcc cccccagggt gcccaagagc cagtctgacc tgggggagct gcctgtggat gctaggttcc cccccagggt gcccaagagc

720 720

ttccccttta acacttctgt ggtgtacaag aagaccctgt ttgtggagtt cactgaccac ttccccttta acacttctgt ggtgtacaag aagaccctgt ttgtggagtt cactgaccac

780 780

ctgttcaaca ttgccaagcc caggcccccc tggatggggc tgctggggcc caccatccag ctgttcaaca ttgccaagcc caggcccccc tggatggggc tgctggggcc caccatccag

840 840

gctgaggtgt atgacactgt ggtgatcacc ctgaagaaca tggccagcca ccctgtgagc gctgaggtgt atgacactgt ggtgatcacc ctgaagaaca tggccagcca ccctgtgagc

900 900

ctgcatgctg tgggggtgag ctactggaag gcttctgagg gggctgagta tgatgaccag ctgcatgctg tgggggtgag ctactggaag gcttctgagg gggctgagta tgatgaccag

960 960

actagccaga gggagaagga ggatgacaag gtgtttcctg ggggcagcca tacctatgtg actagccaga gggagaagga ggatgacaag gtgtttcctg ggggcagcca tacctatgtg

10201020

tggcaggtgc tgaaggagaa tggccccatg gcctctgacc ccctgtgcct gacctacagc tggcaggtgc tgaaggagaa tggccccatg gcctctgacc ccctgtgcct gacctacagc

10801080

tacctgtctc atgtggacct ggtgaaggac ctgaactctg gcctgattgg ggctctgctg tacctgtctc atgtggacct ggtgaaggac ctgaactctg gcctgattgg ggctctgctg

11401140

gtgtgtaggg agggcagcct ggctaaggaa aagacccaga ccctgcataa gtttatcctg gtgtgtaggg agggcagcct ggctaaggaa aagacccaga ccctgcataa gtttatcctg

12001200

ctgtttgctg tgtttgatga gggcaagagc tggcactctg agaccaagaa cagcctgatg ctgtttgctg tgtttgatga gggcaagagc tggcactctg agaccaagaa cagcctgatg

12601260

caggataggg atgctgcctc tgccagggct tggcctaaga tgcacactgt gaatgggtat caggataggg atgctgcctc tgccagggct tggcctaaga tgcacactgt gaatgggtat

13201320

gtgaatagga gcctgcctgg cctgattggc tgccacagga agtctgtgta ctggcatgtg gtgaatagga gcctgcctgg cctgattggc tgccacagga agtctgtgta ctggcatgtg

13801380

attgggatgg gcaccacccc tgaggtccat agcatcttcc tggagggcca cactttcctg attgggatgg gcaccacccc tgaggtccat agcatcttcc tggagggcca cactttcctg

14401440

gtgaggaacc acagacaggc ctctctggag atctctccca tcaccttcct gactgctcag gtgaggaacc acagacaggc ctctctggag atctctccca tcaccttcct gactgctcag

15001500

actctgctga tggacctggg ccagttcctg ctgttttgcc atattagcag ccaccagcat actctgctga tggacctggg ccagttcctg ctgttttgcc atattagcag ccaccagcat

15601560

gatgggatgg aggcctatgt gaaggtggat agctgccctg aggagcctca gctgaggatg gatgggatgg aggcctatgt gaaggtggat agctgccctg aggagcctca gctgaggatg

16201620

aagaacaatg aggaggctga agactatgat gatgacctga ctgattctga gatggatgtg aagaacaatg aggaggctga agactatgat gatgacctga ctgattctga gatggatgtg

16801680

gtgaggtttg atgatgacaa tagccccagc ttcattcaga tcaggtctgt ggccaagaaa gtgaggtttg atgatgacaa tagccccagc ttcattcaga tcaggtctgt ggccaagaaa

17401740

caccccaaga cctgggtgca ctacattgct gctgaggaag aggactggga ctatgctccc caccccaaga cctgggtgca ctacattgct gctgaggaag aggactggga ctatgctccc

18001800

ctggtgctgg cccctgatga taggtcttat aagagccagt acctgaacaa tgggccccag ctggtgctgg cccctgatga taggtcttat aagagccagt acctgaacaa tgggccccag

18601860

aggattggca ggaagtacaa gaaggtgagg ttcatggcct acactgatga aaccttcaaa aggattggca ggaagtacaa gaaggtgagg ttcatggcct acactgatga aaccttcaaa

19201920

accagggagg ccattcagca tgagtctggc atcctgggcc ctctgctgta tggggaggtg accagggagg ccattcagca tgagtctggc atcctgggcc ctctgctgta tggggaggtg

19801980

ggggacaccc tgctgatcat cttcaagaac caggccagca ggccctacaa catctatcct ggggacaccc tgctgatcat cttcaagaac caggccagca ggccctacaa catctatcct

20402040

catggcatca ctgatgtgag gcccctgtac agcaggaggc tgcccaaggg ggtgaagcac catggcatca ctgatgtgag gcccctgtac agcaggaggc tgcccaaggg ggtgaagcac

21002100

ctgaaagact tccccatcct gcctggggag atctttaagt ataagtggac tgtgactgtg ctgaaagact tccccatcct gcctggggag atctttaagt ataagtggac tgtgactgtg

21602160

gaggatggcc ctaccaagtc tgaccccagg tgtctgacca ggtactattc tagctttgtg gaggatggcc ctaccaagtc tgaccccagg tgtctgacca ggtactattc tagctttgtg

22202220

aacatggaga gggacctggc ctctggcctg attgggcccc tgctgatctg ctacaaggag aacatggaga gggacctggc ctctggcctg attgggcccc tgctgatctg ctacaaggag

22802280

tctgtggacc agaggggcaa ccagatcatg tctgacaaga ggaatgtgat cctgttttct tctgtggacc agaggggcaa ccagatcatg tctgacaaga ggaatgtgat cctgttttct

23402340

gtgtttgatg agaataggag ctggtacctg actgagaaca tccagaggtt tctgcccaat gtgtttgatg agaataggag ctggtacctg actgagaaca tccagaggtt tctgcccaat

24002400

cctgctgggg tgcagctgga ggatcctgag ttccaggcca gcaatatcat gcatagcatc cctgctgggg tgcagctgga ggatcctgag ttccaggcca gcaatatcat gcatagcatc

24602460

aatggctatg tgtttgacag cctgcagctg tctgtgtgcc tgcatgaggt ggcctactgg aatggctatg tgtttgacag cctgcagctg tctgtgtgcc tgcatgaggt ggcctactgg

25202520

tacatcctga gcattggggc ccagactgac tttctgtctg tgttcttttc tggctatacc tacatcctga gcattggggc ccagactgac tttctgtctg tgttcttttc tggctatacc

25802580

ttcaagcaca agatggtgta tgaggatacc ctgaccctgt tccccttctc tggggagact ttcaagcaca agatggtgta tgaggatacc ctgaccctgt tccccttctc tggggagact

26402640

gtgttcatga gcatggagaa tcctgggctg tggatcctgg ggtgccacaa ctctgatttt gtgttcatga gcatggagaa tcctgggctg tggatcctgg ggtgccacaa ctctgatttt

27002700

aggaacaggg ggatgactgc cctgctgaag gtgtctagct gtgataagaa cactggggac aggaacaggg ggatgactgc cctgctgaag gtgtctagct gtgataagaa cactggggac

27602760

tactatgagg acagctatga ggacatttct gcttatctgc tgtctaagaa taatgccatt tactatgagg acagctatga ggacatttct gcttatctgc tgtctaagaa taatgccatt

28202820

gagcccagaa gcttcagcca gaatccccct gtgctgaaga gacatcagag ggagatcacc gagcccagaa gcttcagcca gaatccccct gtgctgaaga gacatcagag ggagatcacc

28802880

agaactaccc tgcagtctga tcaggaggag attgactatg atgacactat ctctgtggag agaactaccc tgcagtctga tcaggaggag attgactatg atgacactat ctctgtggag

29402940

atgaagaagg aggactttga catctatgat gaggatgaga atcagtctcc caggagcttt atgaagaagg aggactttga catctatgat gaggatgaga atcagtctcc caggagcttt

30003000

cagaagaaga ccagacatta cttcattgct gctgtggaga ggctgtggga ctatggcatg cagaagaaga ccagacatta cttcattgct gctgtggaga ggctgtggga ctatggcatg

30603060

agctctagcc ctcatgtgct gaggaacagg gcccagtctg gctctgtgcc ccagttcaag agctctagcc ctcatgtgct gaggaacagg gcccagtctg gctctgtgcc ccagttcaag

31203120

aaggtggtgt tccaggaatt cactgatggc agcttcaccc agcccctgta caggggggag aaggtggtgt tccaggaatt cactgatggc agcttcaccc agcccctgta caggggggag

31803180

ctgaatgagc acctgggcct gctggggcct tatatcaggg ctgaggtgga ggataatatt ctgaatgagc acctggggcct gctggggcct tatatcaggg ctgaggtgga ggataatatt

32403240

atggtgactt tcaggaacca ggccagcagg ccctactctt tctatagcag cctgatctct atggtgactt tcaggaacca ggccagcagg ccctactctt tctatagcag cctgatctct

33003300

tatgaggagg atcagaggca gggggctgag cctaggaaga actttgtgaa gcccaatgag tatgaggagg atcagaggca gggggctgag cctaggaaga actttgtgaa gcccaatgag

33603360

actaagacct acttctggaa ggtccagcac cacatggccc ctaccaagga tgagtttgac actaagacct acttctggaa ggtccagcac cacatggccc ctaccaagga tgagtttgac

34203420

tgcaaggcct gggcctattt ctctgatgtg gatctggaga aggatgtcca ttctgggctg tgcaaggcct gggcctattt ctctgatgtg gatctggaga aggatgtcca ttctgggctg

34803480

attggccccc tgctggtgtg ccacactaac actctgaatc ctgcccatgg caggcaggtg attggccccc tgctggtgtg ccacactaac actctgaatc ctgcccatgg caggcaggtg

35403540

actgtccagg agtttgccct gttcttcact atctttgatg agaccaagag ctggtacttt actgtccagg agtttgccct gttcttcact atctttgatg agaccaagag ctggtacttt

36003600

actgagaaca tggagaggaa ctgcagagct ccttgcaata ttcagatgga ggaccccacc actgagaaca tggagaggaa ctgcagagct ccttgcaata ttcagatgga ggaccccacc

36603660

ttcaaggaga attacaggtt ccatgccatt aatgggtaca tcatggacac cctgcctggc ttcaaggaga attacaggtt ccatgccatt aatgggtaca tcatggacac cctgcctggc

37203720

ctggtgatgg ctcaggacca gaggatcagg tggtacctgc tgagcatggg ctctaatgag ctggtgatgg ctcaggacca gaggatcagg tggtacctgc tgagcatggg ctctaatgag

37803780

aatatccaca gcatccactt ctctgggcat gtgttcactg tgaggaagaa ggaggagtac aatatccaca gcatccactt ctctgggcat gtgttcactg tgaggaagaa ggagggagtac

38403840

aagatggctc tgtataatct gtaccctggg gtgtttgaaa ctgtggagat gctgccctct aagatggctc tgtataatct gtaccctggg gtgtttgaaa ctgtggagat gctgccctct

39003900

aaggctggca tctggagggt ggagtgcctg attggggagc acctgcatgc tggcatgagc aaggctggca tctggagggt ggagtgcctg attggggagc acctgcatgc tggcatgagc

39603960

accctgttcc tggtgtacag caacaagtgc cagacccccc tgggcatggc ctctggccac accctgttcc tggtgtacag caacaagtgc cagacccccc tgggcatggc ctctggccac

40204020

atcagggact tccagatcac tgcctctggc cagtatggcc agtgggcccc caagctggcc atcagggact tccagatcac tgcctctggc cagtatggcc agtgggcccc caagctggcc

40804080

aggctgcact attctggcag catcaatgcc tggagcacca aggagccctt cagctggatc aggctgcact attctggcag catcaatgcc tggagcacca aggagccctt cagctggatc

41404140

aaggtggacc tgctggcccc catgatcatt catggcatca agacccaggg ggccaggcag aaggtggacc tgctggcccc catgatcatt catggcatca agacccaggg ggccaggcag

42004200

aagttcagct ctctgtacat ctctcagttc atcatcatgt actctctgga tgggaagaag aagttcagct ctctgtacat ctctcagttc atcatcatgt actctctgga tgggaagaag

42604260

tggcagacct acaggggcaa cagcactggc accctgatgg tgttctttgg gaatgtggac tggcagacct acaggggcaa cagcactggc accctgatgg tgttctttgg gaatgtggac

43204320

tcttctggca tcaagcacaa catcttcaat ccccccatca ttgctaggta tattaggctg tcttctggca tcaagcacaa catcttcaat ccccccatca ttgctaggta tattaggctg

43804380

catcccaccc actacagcat caggtctacc ctgaggatgg agctgatggg ctgtgacctg catcccaccc actacagcat caggtctacc ctgaggatgg agctgatggg ctgtgacctg

44404440

aactcttgca gcatgcccct gggcatggag tctaaggcca tctctgatgc ccagattact aactcttgca gcatgcccct gggcatggag tctaaggcca tctctgatgc ccagattact

45004500

gccagcagct acttcaccaa catgtttgcc acctggagcc cctctaaggc caggctgcat gccagcagct acttcaccaa catgtttgcc acctggagcc cctctaaggc caggctgcat

45604560

ctgcagggga ggagcaatgc ctggaggcct caggtgaaca accccaagga gtggctgcag ctgcagggga ggagcaatgc ctggaggcct caggtgaaca accccaagga gtggctgcag

46204620

gtggatttcc agaagaccat gaaggtgact ggggtgacca cccagggggt caagagcctg gtggatttcc agaagaccat gaaggtgact ggggtgacca cccagggggt caagagcctg

46804680

ctgaccagca tgtatgtgaa ggagttcctg atcagcagca gccaggatgg ccaccagtgg ctgaccagca tgtatgtgaa ggagttcctg atcagcagca gccaggatgg ccaccagtgg

47404740

actctgttct ttcagaatgg gaaggtgaag gtgtttcagg gcaatcagga ctctttcacc actctgttct ttcagaatgg gaaggtgaag gtgtttcagg gcaatcagga ctctttcacc

48004800

cctgtggtga acagcctgga cccccccctg ctgaccagat acctgaggat ccacccccag cctgtggtga acagcctgga cccccccctg ctgaccagat acctgaggat ccacccccag

48604860

tcttgggtgc atcagattgc cctgaggatg gaggtgctgg gctgtgaggc tcaggatctg tcttgggtgc atcagattgc cctgaggatg gaggtgctgg gctgtgaggc tcaggatctg

49204920

tactgagcgg ccgcaataaa agatcagagc tctagagatc tgtgtgttgg ttttttgtgt tactgagcgg ccgcaataaa agatcagagc tctagagatc tgtgtgttgg ttttttgtgt

49804980

tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag

50405040

gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag

51005100

gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag

51605160

ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gtactagagg ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gtactagagg

52205220

atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac

52805280

ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca

53405340

gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt

54005400

tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc

54605460

tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tccaaactat tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tccaaactat

55205520

tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc atctattttg tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc atctattttg

55805580

tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt tcccaactat tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt tcccaactat

56405640

tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa acatcctgcc tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa acatcctgcc

57005700

aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga atgaaaattt aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga atgaaaattt

57605760

ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc ttatttgcag ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc ttatttgcag

58205820

cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt

58805880

tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt

59405940

cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc

60006000

tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga

60606060

tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc

61206120

cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt

61806180

ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct

62406240

gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa tttcaggtgg gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa tttcaggtgg

63006300

cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa

63606360

tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa

64206420

gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct

64806480

tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg

65406540

tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg

66006600

ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt

66606660

atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga

67206720

cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga

67806780

attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac

68406840

gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg

69006900

ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac

69606960

gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct

70207020

agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct

70807080

gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg

71407140

gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat

72007200

ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg

72607260

tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat

73207320

tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct

73807380

catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa

74407440

gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa

75007500

aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc

75607560

gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta

76207620

gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct

76807680

gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg

77407740

atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag

78007800

cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc

78607860

cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg

79207920

agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt

79807980

tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg

80408040

gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca

81008100

catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg

81608160

agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc

82208220

ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag

82808280

accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat gccctgcgta accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat gccctgcgta

83408340

agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa actatgacaa agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa actatgacaa

84008400

taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta tgctgtgaaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta tgctgtgaaa

84608460

aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa gtgcaaattg aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa gtgcaaattg

85208520

cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt cgcggcgttg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt cgcggcgttg

85808580

tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgaattgtta tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgaattgtta

86408640

ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc ccaactttgt ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc ccaactttgt

87008700

atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca cataagcacc atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca cataagcacc

87608760

aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cctgcctccg aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cctgcctccg

88208820

gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct gctcaaacct gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct gctcaaacct

88808880

gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg cagcaagcgc gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg cagcaagcgc

89408940

gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct gatgttggga gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct gatgttggga

90009000

gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gcatggattt gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gcatggattt

90609060

gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc cacctaactt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc cacctaactt

91209120

tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca tcgttgctgc tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca tcgttgctgc

91809180

tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat gcccgaggca tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat gcccgaggca

92409240

tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg ccgttaccac tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg ccgttaccac

93009300

cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ttgcattaca cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ttgcattaca

93609360

gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttccacggtg gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttccacggtg

94209420

tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc tggctggcga tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc tggctggcga

94809480

acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg ctgttcttct acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg ctgttcttct

95409540

acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga cctcggccgt acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga cctcggccgt

96009600

cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg

96609660

aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt tggctacgta aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt tggctacgta

97209720

tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa

97809780

taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tattccggat taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tattccggat

98409840

tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc gtactaccat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc gtactaccat

99009900

caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt tcagggcgcc caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt tcagggcgcc

99609960

atgggatcc atgggatcc

99699969

<210> 205<210> 205

<211> 10063<211> 10063

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 205<400> 205

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gaggaaccat tgccaccttc agggggaggc tgctggtgaa atctacgtag ccatgctcta gaggaaccat tgccaccttc agggggaggc tgctggtgaa

240 240

tattaaccaa gatcacccca gttaccggag gagcaaacag ggactaagtt cacacgcgtg tattaaccaa gatcacccca gttaccggag gagcaaacag ggactaagtt cacacgcgtg

300 300

gtaccgtctg tctgcacatt tcgtagagcg agtgttccga tactctaatc tccctaggca gtaccgtctg tctgcacatt tcgtagagcg agtgttccga tactctaatc tccctaggca

360 360

aggttcatat ttgtgtaggt tacttattct ccttttgttg actaagtcaa taatcagaat aggttcatat ttgtgtaggt tacttattct ccttttgttg actaagtcaa taatcagaat

420 420

cagcaggttt ggagtcagct tggcagggat cagcagcctg ggttggaagg agggggtata cagcaggttt ggagtcagct tggcagggat cagcagcctg ggttggaagg aggggtata

480 480

aaagcccctt caccaggaga agccgtcaca cagatccaca agctcctgaa gaggtaaggg aaagcccctt caccaggaga agccgtcaca cagatccaca agctcctgaa gaggtaaggg

540 540

tttaagttat cgttagttcg tgcaccatta atgtttaatt acctggagca cctgcctgaa tttaagttat cgttagttcg tgcaccatta atgtttaatt acctggagca cctgcctgaa

600 600

atcatttttt tttcaggttg gctagtatgc agatcgagct ctccacctgc ttctttctgt atcatttttt tttcaggttg gctagtatgc agatcgagct ctccacctgc ttctttctgt

660 660

gcctgttgag attctgcttc agcgccacca ggagatacta cctgggggct gtggagctga gcctgttgag attctgcttc agcgccacca ggagatacta cctggggggct gtggagctga

720 720

gctgggacta catgcagtct gacctggggg agctgcctgt ggatgccagg ttccccccca gctgggacta catgcagtct gacctggggg agctgcctgt ggatgccagg ttccccccca

780 780

gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta caagaagacc ctgtttgtgg gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta caagaagacc ctgtttgtgg

840 840

agttcactga ccacctgttc aacattgcca agcccaggcc cccctggatg ggcctgctgg agttcactga ccacctgttc aacattgcca agcccaggcc cccctggatg ggcctgctgg

900 900

gccccaccat ccaggctgag gtgtatgaca ctgtggtgat caccctgaag aacatggcca gccccaccat ccaggctgag gtgtatgaca ctgtggtgat caccctgaag aacatggcca

960 960

gccaccctgt gagcctgcat gctgtggggg tgagctactg gaaggcctct gagggggctg gccaccctgt gagcctgcat gctgtggggg tgagctactg gaaggcctct gagggggctg

10201020

agtatgatga ccagaccagc cagagggaga aggaggatga caaggtgttc cctgggggca agtatgatga ccagaccagc cagagggaga aggaggatga caaggtgttc cctgggggca

10801080

gccacaccta tgtgtggcag gtgctgaagg agaatggccc catggcctct gaccccctgt gccacaccta tgtgtggcag gtgctgaagg agaatggccc catggcctct gaccccctgt

11401140

gcctgaccta cagctacctg agccatgtgg acctggtgaa ggacctgaac tctggcctga gcctgaccta cagctacctg agccatgtgg acctggtgaa ggacctgaac tctggcctga

12001200

ttggggccct gctggtgtgc agggagggca gcctggccaa ggagaagacc cagaccctgc ttggggccct gctggtgtgc agggagggca gcctggccaa ggagaagacc cagaccctgc

12601260

acaagttcat cctgctgttt gctgtgtttg atgagggcaa gagctggcac tctgaaacca acaagttcat cctgctgttt gctgtgtttg atgagggcaa gagctggcac tctgaaacca

13201320

agaacagcct gatgcaggac agggatgctg cctctgccag ggcctggccc aagatgcaca agaacagcct gatgcaggac agggatgctg cctctgccag ggcctggccc aagatgcaca

13801380

ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat tggctgccac aggaagtctg ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat tggctgccac aggaagtctg

14401440

tgtactggca tgtgattggc atgggcacca cccctgaggt gcacagcatc ttcctggagg tgtactggca tgtgattggc atgggcacca cccctgaggt gcacagcatc ttcctggagg

15001500

gccacacctt cctggtcagg aaccacaggc aggccagcct ggagatcagc cccatcacct gccacacctt cctggtcagg aaccacaggc aggccagcct ggagatcagc cccatcacct

15601560

tcctgactgc ccagaccctg ctgatggacc tgggccagtt cctgctgttc tgccacatca tcctgactgc ccagaccctg ctgatggacc tgggccagtt cctgctgttc tgccacatca

16201620

gcagccacca gcatgatggc atggaggcct atgtgaaggt ggacagctgc cctgaggagc gcagccacca gcatgatggc atggaggcct atgtgaaggt ggacagctgc cctgaggagc

16801680

cccagctgag gatgaagaac aatgaggagg ctgaggacta tgatgatgac ctgactgact cccagctgag gatgaagaac aatgaggagg ctgaggacta tgatgatgac ctgactgact

17401740

ctgagatgga tgtggtgagg tttgatgatg acaacagccc cagcttcatc cagatcaggt ctgagatgga tgtggtgagg tttgatgatg acaacagccc cagcttcatc cagatcaggt

18001800

ctgtggccaa gaagcacccc aagacctggg tgcactacat tgctgctgag gaggaggact ctgtggccaa gaagcacccc aagacctggg tgcactacat tgctgctgag gaggaggact

18601860

gggactatgc ccccctggtg ctggcccctg atgacaggag ctacaagagc cagtacctga gggactatgc ccccctggtg ctggcccctg atgacaggag ctacaagagc cagtacctga

19201920

acaatggccc ccagaggatt ggcaggaagt acaagaaggt caggttcatg gcctacactg acaatggccc ccagaggatt ggcaggaagt acaagaaggt caggttcatg gcctacactg

19801980

atgaaacctt caagaccagg gaggccatcc agcatgagtc tggcatcctg ggccccctgc atgaaacctt caagaccagg gaggccatcc agcatgagtc tggcatcctg ggccccctgc

20402040

tgtatgggga ggtgggggac accctgctga tcatcttcaa gaaccaggcc agcaggccct tgtatgggga ggtgggggac accctgctga tcatcttcaa gaaccaggcc agcaggccct

21002100

acaacatcta cccccatggc atcactgatg tgaggcccct gtacagcagg aggctgccca acaacatcta cccccatggc atcactgatg tgaggcccct gtacagcagg aggctgccca

21602160

agggggtgaa gcacctgaag gacttcccca tcctgcctgg ggagatcttc aagtacaagt aggggggtgaa gcacctgaag gacttcccca tcctgcctgg ggagatcttc aagtacaagt

22202220

ggactgtgac tgtggaggat ggccccacca agtctgaccc caggtgcctg accagatact ggactgtgac tgtggaggat ggccccacca agtctgaccc caggtgcctg accagatact

22802280

acagcagctt tgtgaacatg gagagggacc tggcctctgg cctgattggc cccctgctga acagcagctt tgtgaacatg gagagggacc tggcctctgg cctgattggc cccctgctga

23402340

tctgctacaa ggagtctgtg gaccagaggg gcaaccagat catgtctgac aagaggaatg tctgctacaa ggagtctgtg gaccagagg gcaaccagat catgtctgac aagaggaatg

24002400

tgatcctgtt ctctgtgttt gatgagaaca ggagctggta cctgactgag aacatccaga tgatcctgtt ctctgtgttt gatgagaaca ggagctggta cctgactgag aacatccaga

24602460

ggttcctgcc caaccctgct ggggtgcagc tggaggaccc tgagttccag gccagcaaca ggttcctgcc caaccctgct ggggtgcagc tggaggaccc tgagttccag gccagcaaca

25202520

tcatgcacag catcaatggc tatgtgtttg acagcctgca gctgtctgtg tgcctgcatg tcatgcacag catcaatggc tatgtgtttg acagcctgca gctgtctgtg tgcctgcatg

25802580

aggtggccta ctggtacatc ctgagcattg gggcccagac tgacttcctg tctgtgttct aggtggccta ctggtacatc ctgagcattg gggcccagac tgacttcctg tctgtgttct

26402640

tctctggcta caccttcaag cacaagatgg tgtatgagga caccctgacc ctgttcccct tctctggcta caccttcaag cacaagatgg tgtatgagga caccctgacc ctgttcccct

27002700

tctctgggga gactgtgttc atgagcatgg agaaccctgg cctgtggatt ctgggctgcc tctctgggga gactgtgttc atgagcatgg agaaccctgg cctgtggatt ctgggctgcc

27602760

acaactctga cttcaggaac aggggcatga ctgccctgct gaaagtctcc agctgtgaca acaactctga cttcaggaac aggggcatga ctgccctgct gaaagtctcc agctgtgaca

28202820

agaacactgg ggactactat gaggacagct atgaggacat ctctgcctac ctgctgagca agaacactgg ggactactat gaggacagct atgaggacat ctctgcctac ctgctgagca

28802880

agaacaatgc cattgagccc aggagcttca gccagaatcc acccgtcctt aagcgccatc agaacaatgc cattgagccc aggagcttca gccagaatcc acccgtcctt aagcgccatc

29402940

agcgcgagat caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca agcgcgagat caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca

30003000

ccatctctgt ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga ccatctctgt ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga

30603060

gccccaggag cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gccccaggag cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt

31203120

gggactatgg catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg gggactatgg catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg

31803180

tgccccagtt caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgccccagtt caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc

32403240

tgtacagagg ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tgtacagagg ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg

33003300

tggaggacaa catcatggtg accttcagga accaggccag caggccctac agcttctaca tggaggacaa catcatggtg accttcagga accaggccag caggccctac agcttctaca

33603360

gcagcctgat cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg gcagcctgat cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg

34203420

tgaagcccaa tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca tgaagcccaa tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca

34803480

aggatgagtt tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg aggatgagtt tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg

35403540

tgcactctgg cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc tgcactctgg cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc

36003600

atggcaggca ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca atggcaggca ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca

36603660

agagctggta cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga agagctggta cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga

37203720

tggaggaccc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg tggaggaccc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg

37803780

acaccctgcc tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca acaccctgcc tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca

38403840

tgggcagcaa tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga tgggcagcaa tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga

39003900

agaaggagga gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agaaggagga gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg

39603960

agatgctgcc cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc agatgctgcc cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc

40204020

atgctggcat gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca atgctggcat gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca

40804080

tggcctctgg ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg tggcctctgg ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg

41404140

cccccaagct ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc cccccaagct ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc

42004200

ccttcagctg gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc ccttcagctg gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc

42604260

agggggccag gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc aggggggccag gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc

43204320

tggatggcaa gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct tggatggcaa gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct

43804380

ttggcaatgt ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca ttggcaatgt ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca

44404440

gatacatcag gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga gatacatcag gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga

45004500

tgggctgtga cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg tgggctgtga cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg

45604560

atgcccagat cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca atgccgat cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca

46204620

aggccaggct gcatctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggccaggct gcatctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca

46804680

aggagtggct gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg aggagtggct gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg

47404740

gggtgaagag cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg gggtgaagag cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg

48004800

atggccacca gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc atggccacca gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc

48604860

aggacagctt cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga aggacagctt cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga

49204920

ggattcaccc ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg ggattcaccc ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg

49804980

aggcccagga cctgtactga ggatccaata aaatatcttt attttcatta catctgtgtg aggcccagga cctgtactga ggatccaata aaatatcttt attttcatta catctgtgtg

50405040

ttggtttttt gtgtgttttc ctgtaacgat cgggtctaga gcatggctac gtagataagt ttggtttttt gtgtgttttc ctgtaacgat cgggtctaga gcatggctac gtagataagt

51005100

agcatggcgg gttaatcatt aactacacct gcaggaggaa cccctagtga tggagttggc agcatggcgg gttaatcatt aactacacct gcaggaggaa cccctagtga tggagttggc

51605160

cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg

52205220

cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggggcgc gcctcgaggc cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggggcgc gcctcgaggc

52805280

atgcggtacc aagcttgtcg agaagtacta gaggatcata atcagccata ccacatttgt atgcggtacc aagcttgtcg agaagtacta gaggatcata atcagccata ccacatttgt

53405340

agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat

54005400

gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa

54605460

tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc

55205520

caaactcatc aatgtatctt atcatgtctg gatctgatca ctgatatcgc ctaggagatc caaactcatc aatgtatctt atcatgtctg gatctgatca ctgatatcgc ctaggagatc

55805580

cgaaccagat aagtgaaatc tagttccaaa ctattttgtc atttttaatt ttcgtattag cgaaccagat aagtgaaatc tagttccaaa ctattttgtc atttttaatt ttcgtattag

56405640

cttacgacgc tacacccagt tcccatctat tttgtcactc ttccctaaat aatccttaaa cttacgacgc tacacccagt tcccatctat tttgtcactc ttccctaaat aatccttaaa

57005700

aactccattt ccacccctcc cagttcccaa ctattttgtc cgcccacagc ggggcatttt aactccattt ccacccctcc cagttcccaa ctattttgtc cgcccacagc ggggcatttt

57605760

tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc atgtgacaaa ccgtcatctt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc atgtgacaaa ccgtcatctt

58205820

cggctacttt ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt cggctacttt ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt

58805880

ttgtaattga ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct ttgtaattga ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct

59405940

gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg

60006000

ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg

60606060

gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac

61206120

ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct

61806180

gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt

62406240

tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt

63006300

tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt

63606360

ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa

64206420

cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac

64806480

cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg

65406540

tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc

66006600

tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg

66606660

atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga

67206720

gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc

67806780

aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag

68406840

aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga

69006900

gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg

69606960

cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga

70207020

atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt

70807080

tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact

71407140

ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt

72007200

ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg

72607260

ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta

73207320

tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac

73807380

tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta

74407440

aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt

75007500

tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt

75607560

tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt

76207620

gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc

76807680

agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg

77407740

tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg

78007800

ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt

78607860

cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac

79207920

tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg

79807980

acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg

80408040

gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat

81008100

ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt

81608160

tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg

82208220

attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa

82808280

cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc

83408340

tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg

84008400

gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc

84608460

ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt

85208520

tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct

85808580

aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc

86408640

caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg

87008700

ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa

87608760

agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac

88208820

cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga

88808880

gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat

89408940

agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc

90009000

caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt

90609060

tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac

91209120

gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg

91809180

tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg

92409240

taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg

93009300

gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa

93609360

caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac

94209420

cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc

94809480

aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc

95409540

agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg

96009600

catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg

96609660

ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc

97209720

ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag

97809780

gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa tagatcatgg gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa tagatcatgg

98409840

agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag

99009900

ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ccatcgggcg ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ccatcgggcg

99609960

cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg attacgatat cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg attacgatat

1002010020

cccaacgacc gaaaacctgt attttcaggg cgccatggga tcc cccaacgacc gaaaacctgt attttcaggg cgccatggga tcc

1006310063

<210> 206<210> 206

<211> 11668<211> 11668

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 206<400> 206

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg

240 240

cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt

300 300

ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc cccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc

360 360

aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag

420 420

acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga

480 480

ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac

540 540

ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca

600 600

tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat

660 660

ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag

720 720

gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa

780 780

gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga

840 840

cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc

900 900

caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca

960 960

ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt

10201020

gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc

10801080

tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa

11401140

gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc

12001200

agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt

12601260

taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga

13201320

ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg

13801380

actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg

14401440

tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatc tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatc

15001500

gagctgtcta cctgcttctt cctgtgcctg ctgcggttct gcttcagcgc caccagaaga gagctgtcta cctgcttctt cctgtgcctg ctgcggttct gcttcagcgc caccagaaga

15601560

tattacctgg gcgccgtgga actgagctgg gactacatgc agtctgacct gggagagctg tattacctgg gcgccgtgga actgagctgg gactacatgc agtctgacct gggagagctg

16201620

cccgtggacg ctagatttcc tccaagagtg cccaagagct tccccttcaa cacctccgtg cccgtggacg ctagatttcc tccaagagtg cccaagagct tccccttcaa cacctccgtg

16801680

gtgtacaaga aaaccctgtt cgtggaattc accgaccacc tgttcaatat cgccaagcct gtgtacaaga aaaccctgtt cgtggaattc accgaccacc tgttcaatat cgccaagcct

17401740

cggcctcctt ggatgggact gctgggacct acaattcagg ccgaggtgta cgacaccgtg cggcctcctt ggatgggact gctgggacct acaattcagg ccgaggtgta cgacaccgtg

18001800

gtcatcaccc tgaagaacat ggccagccat cctgtgtctc tgcacgccgt gggagtgtct gtcatcaccc tgaagaacat ggccagccat cctgtgtctc tgcacgccgt gggagtgtct

18601860

tattggaagg cttctgaggg cgccgagtac gacgatcaga caagccagag agagaaagag tattggaagg cttctgaggg cgccgagtac gacgatcaga caagccagag agagaaagag

19201920

gacgacaagg ttttccctgg cggcagccac acctatgtct ggcaggtcct gaaagaaaac gacgacaagg ttttccctgg cggcagccac acctatgtct ggcaggtcct gaaagaaaac

19801980

ggccctatgg cctccgatcc tctgtgcctg acatacagct acctgagcca cgtggacctg ggccctatgg cctccgatcc tctgtgcctg acatacagct acctgagcca cgtggacctg

20402040

gtcaaggacc tgaattctgg cctgatcgga gccctgctcg tgtgtagaga aggcagcctg gtcaaggacc tgaattctgg cctgatcgga gccctgctcg tgtgtagaga aggcagcctg

21002100

gccaaagaga aaacccagac actgcacaag ttcatcctgc tgttcgccgt gttcgacgag gccaaagaga aaacccagac actgcacaag ttcatcctgc tgttcgccgt gttcgacgag

21602160

ggcaagagct ggcacagcga gacaaagaac agcctgatgc aggacaggga tgccgcctct ggcaagagct ggcacagcga gacaaagaac agcctgatgc aggacagga tgccgcctct

22202220

gctagagctt ggcctaagat gcacaccgtg aacggctacg tgaacagaag cctgcctgga gctagagctt ggcctaagat gcacaccgtg aacggctacg tgaacagaag cctgcctgga

22802280

ctgatcggct gccacagaaa gtccgtgtac tggcacgtga tcggcatggg cacaacacct ctgatcggct gccacagaaa gtccgtgtac tggcacgtga tcggcatggg cacaacacct

23402340

gaggtgcaca gcatctttct ggaaggccac accttcctcg tgcggaacca cagacaggcc gaggtgcaca gcatctttct ggaaggccac accttcctcg tgcggaacca cagacaggcc

24002400

agcctggaaa tcagccctat caccttcctg accgctcaga ccctgctgat ggatctgggc agcctggaaa tcagccctat caccttcctg accgctcaga ccctgctgat ggatctgggc

24602460

cagtttctgc tgttctgcca catcagctcc caccagcacg atggcatgga agcctacgtg cagtttctgc tgttctgcca catcagctcc caccagcacg atggcatgga agcctacgtg

25202520

aaggtggaca gctgccccga agaaccccag ctgcggatga agaacaacga ggaagccgag aaggtggaca gctgccccga agaaccccag ctgcggatga agaacaacga ggaagccgag

25802580

gactacgacg acgacctgac cgactctgag atggacgtcg tcagattcga cgacgataac gactacgacg acgacctgac cgactctgag atggacgtcg tcagattcga cgacgataac

26402640

agccccagct tcatccagat cagaagcgtg gccaagaagc accccaagac ctgggtgcac agccccagct tcatccagat cagaagcgtg gccaagaagc accccaagac ctgggtgcac

27002700

tatatcgccg ccgaggaaga ggactgggat tacgctcctc tggtgctggc ccctgacgac tatatcgccg ccgaggaaga ggactgggat tacgctcctc tggtgctggc ccctgacgac

27602760

agaagctaca agagccagta cctgaacaac ggccctcagc ggatcggccg gaagtataag agaagctaca agagccagta cctgaacaac ggccctcagc ggatcggccg gaagtataag

28202820

aaagtgcggt tcatggccta caccgacgag acattcaaga ccagagaggc catccagcac aaagtgcggt tcatggccta caccgacgag acattcaaga ccagagaggc catccagcac

28802880

gagagcggaa ttctgggccc tctgctgtat ggcgaagtgg gcgatacact gctgatcatc gagagcggaa ttctgggccc tctgctgtat ggcgaagtgg gcgatacact gctgatcatc

29402940

ttcaagaacc aggccagcag accctacaac atctaccctc acggcatcac cgatgtgcgg ttcaagaacc aggccagcag accctacaac atctaccctc acggcatcac cgatgtgcgg

30003000

cccctgtatt ctagaaggct gcccaagggc gtgaagcacc tgaaggactt ccctatcctg cccctgtatt ctagaaggct gcccaagggc gtgaagcacc tgaaggactt ccctatcctg

30603060

cctggcgaga ttttcaagta caagtggacc gtgaccgtgg aagatggccc caccaagagc cctggcgaga ttttcaagta caagtggacc gtgaccgtgg aagatggccc caccaagagc

31203120

gaccctagat gtctgacacg gtactacagc agcttcgtga acatggaacg cgacctggcc gaccctagat gtctgacacg gtactacagc agcttcgtga acatggaacg cgacctggcc

31803180

agcggcctga ttggacctct gctgatctgc tacaaagaaa gcgtggacca gcggggcaac agcggcctga ttggacctct gctgatctgc tacaaagaaa gcgtggacca gcggggcaac

32403240

cagatcatga gcgacaagcg gaacgtgatc ctgtttagcg tgttcgatga gaaccggtcc cagatcatga gcgacaagcg gaacgtgatc ctgtttagcg tgttcgatga gaaccggtcc

33003300

tggtatctga ccgagaacat ccagcggttt ctgcccaatc ctgccggggt gcaactggaa tggtatctga ccgagaacat ccagcggttt ctgcccaatc ctgccggggt gcaactggaa

33603360

gatcctgagt tccaggcaag caacatcatg cactccatca atggctatgt gttcgacagc gatcctgagt tccaggcaag caacatcatg cactccatca atggctatgt gttcgacagc

34203420

ctgcagctga gcgtgtgcct gcacgaagtg gcctactggt acatcctgag cattggcgcc ctgcagctga gcgtgtgcct gcacgaagtg gcctactggt acatcctgag cattggcgcc

34803480

cagaccgact tcctgtccgt gttctttagc ggctacacct tcaagcacaa gatggtgtac cagaccgact tcctgtccgt gttctttagc ggctacacct tcaagcacaa gatggtgtac

35403540

gaggataccc tgacactgtt cccattcagc ggcgagacag tgttcatgag catggaaaac gaggataccc tgacactgtt cccattcagc ggcgagacag tgttcatgag catggaaaac

36003600

cccggcctgt ggattctggg ctgtcacaac agcgacttcc ggaacagagg catgacagcc cccggcctgt ggattctggg ctgtcacaac agcgacttcc ggaacagagg catgacagcc

36603660

ctgctgaagg tgtccagctg cgacaagaac accggcgact actacgagga cagctatgag ctgctgaagg tgtccagctg cgacaagaac accggcgact actacgagga cagctatgag

37203720

gacatcagcg cctacctgct gagcaagaac aatgccatcg agcctcggag cttcagccag gacatcagcg cctacctgct gagcaagaac aatgccatcg agcctcggag cttcagccag

37803780

aatcctcctg tgctgaagcg gcaccagcgc gagatcacca gaacaaccct gcagagcgac aatcctcctg tgctgaagcg gcaccagcgc gagatcacca gaacaaccct gcagagcgac

38403840

caagaggaaa tcgattacga cgacaccatc agcgtcgaga tgaagaaaga agatttcgac caagaggaaa tcgattacga cgacaccatc agcgtcgaga tgaagaaaga agatttcgac

39003900

atctacgacg aggacgagaa tcagagcccc agaagctttc agaaaaagac ccggcactac atctacgacg aggacgagaa tcagagcccc agaagctttc agaaaaagac ccggcactac

39603960

ttcattgccg ccgtcgagag actgtgggac tacggcatgt ctagcagccc tcacgtgctg ttcattgccg ccgtcgagag actgtgggac tacggcatgt ctagcagccc tcacgtgctg

40204020

agaaatagag cccagagcgg cagcgtgccc cagttcaaga aagtggtgtt ccaagagttc agaaatagag cccagagcgg cagcgtgccc cagttcaaga aagtggtgtt ccaagagttc

40804080

accgacggca gcttcaccca gccactgtat agaggcgagc tgaacgagca tctgggcctg accgacggca gcttcaccca gccactgtat agaggcgagc tgaacgagca tctgggcctg

41404140

ctgggccctt atatcagagc cgaagtggaa gataacatca tggtcacctt ccggaatcag ctgggccctt atatcagagc cgaagtggaa gataacatca tggtcacctt ccggaatcag

42004200

gctagccggc cttacagctt ctacagctcc ctgatcagct acgaagagga ccagagacag gctagccggc cttacagctt ctacagctcc ctgatcagct acgaagagga ccagagacag

42604260

ggcgctgagc ccagaaagaa cttcgtgaag cccaacgaga ctaagaccta cttttggaag ggcgctgagc ccagaaagaa cttcgtgaag cccaacgaga ctaagaccta cttttggaag

43204320

gtgcagcacc acatggcccc tacaaaggac gagttcgact gcaaagcctg ggcctacttc gtgcagcacc acatggcccc tacaaaggac gagttcgact gcaaagcctg ggcctacttc

43804380

tccgatgtgg atctggaaaa ggacgtgcac agcgggctca tcggaccact gcttgtgtgc tccgatgtgg atctggaaaa ggacgtgcac agcgggctca tcggaccact gcttgtgtgc

44404440

cacaccaaca cactgaaccc cgctcacggc agacaagtga cagtgcaaga gttcgccctg cacaccaaca cactgaaccc cgctcacggc agacaagtga cagtgcaaga gttcgccctg

45004500

ttcttcacca tcttcgacga aacaaagagc tggtacttca ccgagaatat ggaacggaac ttcttcacca tcttcgacga aacaaagagc tggtacttca ccgagaatat ggaacggaac

45604560

tgcagagccc cttgcaacat ccagatggaa gatcccacct tcaaagagaa ctaccggttc tgcagagccc cttgcaacat ccagatggaa gatcccacct tcaaagagaa ctaccggttc

46204620

cacgccatca acggctacat catggacaca ctgcccggcc tggttatggc ccaggatcag cacgccatca acggctacat catggacaca ctgcccggcc tggttatggc ccaggatcag

46804680

agaatccggt ggtatctgct gtccatgggc tccaacgaga atatccacag catccacttc agaatccggt ggtatctgct gtccatgggc tccaacgaga atatccacag catccacttc

47404740

agcggccacg tgttcaccgt gcggaaaaaa gaagagtaca aaatggccct gtacaatctg agcggccacg tgttcaccgt gcggaaaaaa gaagagtaca aaatggccct gtacaatctg

48004800

taccctgggg tgttcgaaac cgtggaaatg ctgccttcca aggccggcat ttggagagtg taccctgggg tgttcgaaac cgtggaaatg ctgccttcca aggccggcat ttggagagtg

48604860

gaatgtctga ttggagagca cctccacgcc ggaatgagca ccctgtttct ggtgtacagc gaatgtctga ttggagagca cctccacgcc ggaatgagca ccctgtttct ggtgtacagc

49204920

aacaagtgtc agacccctct cggcatggcc tctggacaca tcagagactt ccagatcacc aacaagtgtc agacccctct cggcatggcc tctggacaca tcagagactt cgagatcacc

49804980

gcctctggcc agtacggaca gtgggctcct aaactggctc ggctgcacta cagcggcagc gcctctggcc agtacggaca gtgggctcct aaactggctc ggctgcacta cagcggcagc

50405040

atcaatgcct ggtccaccaa agagcccttc agctggatca aggtggacct gctggctccc atcaatgcct ggtccaccaa agagcccttc agctggatca aggtggacct gctggctccc

51005100

atgatcatcc acggaatcaa gacccagggc gccagacaga agttcagcag cctgtacatc atgatcatcc acggaatcaa gacccagggc gccagacaga agttcagcag cctgtacatc

51605160

agccagttca tcatcatgta cagcctggac ggcaagaagt ggcagaccta cagaggcaac agccagttca tcatcatgta cagcctggac ggcaagaagt ggcagaccta cagaggcaac

52205220

agcaccggca cactcatggt gttcttcggc aacgtggact ccagcggcat taagcacaac agcaccggca cactcatggt gttcttcggc aacgtggact ccagcggcat taagcacaac

52805280

atcttcaacc ctccaatcat tgcccggtac atccggctgc accccacaca ctacagcatc atcttcaacc ctccaatcat tgcccggtac atccggctgc accccacaca ctacagcatc

53405340

cggtctaccc tgagaatgga actgatgggc tgcgacctga acagctgctc tatgcccctc cggtctaccc tgagaatgga actgatgggc tgcgacctga acagctgctc tatgcccctc

54005400

ggaatggaaa gcaaggccat cagcgacgcc cagatcacag ccagcagcta cttcaccaac ggaatggaaa gcaaggccat cagcgacgcc cagatcacag ccagcagcta cttcaccaac

54605460

atgttcgcca cttggagccc ctccaaggct agactgcatc tgcagggcag aagcaacgct atgttcgcca cttggagccc ctccaaggct agactgcatc tgcagggcag aagcaacgct

55205520

tggaggcccc aagtgaacaa ccccaaagag tggctgcagg ttgactttca aaagaccatg tggaggcccc aagtgaacaa ccccaaagag tggctgcagg ttgactttca aaagaccatg

55805580

aaagtgaccg gcgtgaccac acagggcgtc aagtctctgc tgacctctat gtacgtgaaa aaagtgaccg gcgtgaccac acagggcgtc aagtctctgc tgacctctat gtacgtgaaa

56405640

gagttcctga tctccagcag ccaggacggc catcagtgga ccctgttttt ccagaacggc gagttcctga tctccagcag ccaggacggc catcagtgga ccctgttttt ccagaacggc

57005700

aaagtgaaag tgttccaggg caatcaggac agcttcacac ccgtggtcaa ttctctggac aaagtgaaag tgttccaggg caatcaggac agcttcacac ccgtggtcaa ttctctggac

57605760

cctccactgc tgaccagata cctgcggatt caccctcagt cttgggtgca ccagatcgct cctccactgc tgaccagata cctgcggatt caccctcagt cttgggtgca ccagatcgct

58205820

ctgcggatgg aagtgctggg ctgtgaagct caggacctct actagttaat taagagcatc ctgcggatgg aagtgctggg ctgtgaagct caggacctct actagttaat taagagcatc

58805880

ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg

59405940

ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt

60006000

caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc

60606060

ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg

61206120

ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt

61806180

cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg

62406240

agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc

63006300

ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc

63606360

tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta

64206420

ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg

64806480

ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt

65406540

cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg

66006600

gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg

66606660

atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa

67206720

tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg

67806780

cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag

68406840

tgagcgagcg agcgcgcagc tgcctgcagg ggcgcgcctc gaggcatgcg gtaccaagct tgagcgagcg agcgcgcagc tgcctgcagg ggcgcgcctc gaggcatgcg gtaccaagct

69006900

tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc

69606960

tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt

70207020

tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt

70807080

cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt

71407140

atcttatcat gtctggatct gatcactgat atcgcctagg agatccgaac cagataagtg atcttatcat gtctggatct gatcactgat atcgcctagg agatccgaac cagataagtg

72007200

aaatctagtt ccaaactatt ttgtcatttt taattttcgt attagcttac gacgctacac aaatctagtt ccaaactatt ttgtcatttt taattttcgt attagcttac gacgctacac

72607260

ccagttccca tctattttgt cactcttccc taaataatcc ttaaaaactc catttccacc ccagttccca tctattttgt cactcttccc taaataatcc ttaaaaactc catttccacc

73207320

cctcccagtt cccaactatt ttgtccgccc acagcggggc atttttcttc ctgttatgtt cctcccagtt cccaactatt ttgtccgccc acagcggggc atttttcttc ctgttatgtt

73807380

tttaatcaaa catcctgcca actccatgtg acaaaccgtc atcttcggct actttttctc tttaatcaaa catcctgcca actccatgtg acaaaccgtc atcttcggct actttttctc

74407440

tgtcacagaa tgaaaatttt tctgtcatct cttcgttatt aatgtttgta attgactgaa tgtcacagaa tgaaaatttt tctgtcatct cttcgttatt aatgtttgta attgactgaa

75007500

tatcaacgct tatttgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa tatcaacgct tatttgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa

75607560

gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc

76207620

ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag

76807680

ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca

77407740

aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc

78007800

gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa

78607860

cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct

79207920

attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa

79807980

cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat

80408040

ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc

81008100

aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct

81608160

tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag

82208220

atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta

82808280

agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc

83408340

tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca

84008400

tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg

84608460

atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg

85208520

ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca

85808580

tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa

86408640

acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa

87008700

ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata

87608760

aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat

88208820

ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc

88808880

cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata

89408940

gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt

90009000

actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga

90609060

agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag

91209120

cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa

91809180

tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag

92409240

agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg

93009300

tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat

93609360

acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta

94209420

ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg

94809480

gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc

95409540

gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa

96009600

gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc

96609660

tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt

97209720

caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct

97809780

tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc

98409840

gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg

99009900

agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt

99609960

gcggtatttc acaccgcaga ccagccgcgt aacctggcaa aatcggttac ggttgagtaa gcggtatttc acaccgcaga ccagccgcgt aacctggcaa aatcggttac ggttgagtaa

1002010020

taaatggatg ccctgcgtaa gcgggtgtgg gcggacaata aagtcttaaa ctgaacaaaa taaatggatg ccctgcgtaa gcgggtgtgg gcggacaata aagtcttaaa ctgaacaaaa

1008010080

tagatctaaa ctatgacaat aaagtcttaa actagacaga atagttgtaa actgaaatca tagatctaaa ctatgacaat aaagtcttaa actagacaga atagttgtaa actgaaatca

1014010140

gtccagttat gctgtgaaaa agcatactgg acttttgtta tggctaaagc aaactcttca gtccagttat gctgtgaaaa agcatactgg acttttgtta tggctaaagc aaactcttca

1020010200

ttttctgaag tgcaaattgc ccgtcgtatt aaagaggggc gtggccaagg gcatggtaaa ttttctgaag tgcaaattgc ccgtcgtatt aaagaggggc gtggccaagg gcatggtaaa

1026010260

gactatattc gcggcgttgt gacaatttac cgaacaactc cgcggccggg aagccgatct gactatattc gcggcgttgt gacaatttac cgaacaactc cgcggccggg aagccgatct

1032010320

cggcttgaac gaattgttag gtggcggtac ttgggtcgat atcaaagtgc atcacttctt cggcttgaac gaattgttag gtggcggtac ttgggtcgat atcaaagtgc atcacttctt

1038010380

cccgtatgcc caactttgta tagagagcca ctgcgggatc gtcaccgtaa tctgcttgca cccgtatgcc caactttgta tagagagcca ctgcgggatc gtcaccgtaa tctgcttgca

1044010440

cgtagatcac ataagcacca agcgcgttgg cctcatgctt gaggagattg atgagcgcgg cgtagatcac ataagcacca agcgcgttgg cctcatgctt gaggagattg atgagcgcgg

1050010500

tggcaatgcc ctgcctccgg tgctcgccgg agactgcgag atcatagata tagatctcac tggcaatgcc ctgcctccgg tgctcgccgg agactgcgag atcatagata tagatctcac

1056010560

tacgcggctg ctcaaacctg ggcagaacgt aagccgcgag agcgccaaca accgcttctt tacgcggctg ctcaaacctg ggcagaacgt aagccgcgag agcgccaaca accgcttctt

1062010620

ggtcgaaggc agcaagcgcg atgaatgtct tactacggag caagttcccg aggtaatcgg ggtcgaaggc agcaagcgcg atgaatgtct tactacggag caagttcccg aggtaatcgg

1068010680

agtccggctg atgttgggag taggtggcta cgtctccgaa ctcacgaccg aaaagatcaa agtccggctg atgttgggag taggtggcta cgtctccgaa ctcacgaccg aaaagatcaa

1074010740

gagcagcccg catggatttg acttggtcag ggccgagcct acatgtgcga atgatgccca gagcagcccg catggatttg acttggtcag ggccgagcct acatgtgcga atgatgccca

1080010800

tacttgagcc acctaacttt gttttagggc gactgccctg ctgcgtaaca tcgttgctgc tacttgagcc acctaacttt gttttagggc gactgccctg ctgcgtaaca tcgttgctgc

1086010860

tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta acgcgcttgc tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta acgcgcttgc

1092010920

tgcttggatg cccgaggcat agactgtaca aaaaaacagt cataacaagc catgaaaacc tgcttggatg cccgaggcat agactgtaca aaaaaacagt cataacaagc catgaaaacc

1098010980

gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt gcgtgagcgc gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt gcgtgagcgc

1104011040

atacgctact tgcattacag tttacgaacc gaacaggctt atgtcaactg ggttcgtgcc atacgctact tgcattacag tttacgaacc gaacaggctt atgtcaactg ggttcgtgcc

1110011100

ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga agtcgaggca ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga agtcgaggca

1116011160

tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg tcaggcattg tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg tcaggcattg

1122011220

gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg gcttcaggag gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg gcttcaggag

1128011280

atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga tgaagtggtt atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga tgaagtggtt

1134011340

cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccaggactc tagctatagt cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccaggactc tagctatagt

1140011400

tctagtggtt ggctacgtat actccggaat attaatagat catggagata attaaaatga tctagtggtt ggctacgtat actccggaat attaatagat catggagata attaaaatga

1146011460

taaccatctc gcaaataaat aagtatttta ctgttttcgt aacagttttg taataaaaaa taaccatctc gcaaataaat aagtatttta ctgttttcgt aacagttttg taataaaaaa

1152011520

acctataaat attccggatt attcataccg tcccaccatc gggcgcggat ctcggtccga acctataaat attccggatt attcataccg tcccaccatc gggcgcggat ctcggtccga

1158011580

aaccatgtcg tactaccatc accatcacca tcacgattac gatatcccaa cgaccgaaaa aaccatgtcg tactaccatc accatcacca tcacgattac gatatcccaa cgaccgaaaa

1164011640

cctgtatttt cagggcgcca tgggatcc cctgtatttt cagggcgcca tgggatcc

1166811668

<210> 207<210> 207

<211> 11719<211> 11719

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 207<400> 207

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg

240 240

cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt

300 300

ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc cccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc

360 360

aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag

420 420

acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga

480 480

ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac

540 540

ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca

600 600

tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat

660 660

ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag

720 720

gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa

780 780

gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga

840 840

cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc

900 900

caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca

960 960

ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt

10201020

gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc

10801080

tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa

11401140

gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc

12001200

agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt

12601260

taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga

13201320

ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg

13801380

actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg

14401440

tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt

15001500

gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga

15601560

tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg

16201620

cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg

16801680

gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc

17401740

aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg

18001800

gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc

18601860

tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag

19201920

gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat

19801980

ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg

20402040

gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg

21002100

gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag

21602160

ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacagga tgctgcctct

22202220

gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc

22802280

ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct

23402340

gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc

24002400

agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc

24602460

cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg

25202520

aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag

25802580

gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac

26402640

agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac

27002700

tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac

27602760

aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag

28202820

aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat

28802880

gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc

29402940

ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg

30003000

cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg

30603060

cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct

31203120

gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc

31803180

tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac

32403240

cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc

33003300

tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag

33603360

gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc

34203420

ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc

34803480

cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat

35403540

gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac

36003600

cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc

36603660

ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag

37203720

gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag

37803780

aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca

38403840

gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga cccaggagg

39003900

attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac

39603960

gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct

40204020

gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg

40804080

gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc

41404140

agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc

42004200

tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg

42604260

ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag

43204320

cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac

43804380

cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg

44404440

gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac

45004500

accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc accctgaacc ctgcccatgg caggcaggtg actngtgcagg agtttgccct gttcttcacc

45604560

atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc

46204620

ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc

46804680

aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg

47404740

tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat

48004800

gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg

48604860

gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg

49204920

attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc

49804980

cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc

50405040

cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc

51005100

tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc

51605160

catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc catggcatca agacccagg ggccaggcag aagttcagca gcctgtacat cagccagttc

52205220

atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc

52805280

accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac

53405340

ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc

54005400

ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag

54605460

agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc

55205520

acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc

55805580

caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact

56405640

ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg

57005700

atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag

57605760

gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg

58205820

ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg

58805880

gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca

59405940

tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa

60006000

caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat

60606060

tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc

61206120

aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt

61806180

ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg

62406240

ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc

63006300

ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct

63606360

ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg

64206420

ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg

64806480

gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc

65406540

cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa

66006600

atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg

66606660

ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg

67206720

gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact

67806780

acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc

68406840

gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc

69006900

gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa

69606960

gtactagagg atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa gtactagagg atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa

70207020

cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt

70807080

gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa

71407140

agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca

72007200

tgtctggatc tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tgtctggatc tgatcactga tatcgcctag gagatccgaa cgataagt gaaatctagt

72607260

tccaaactat tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc tccaaactat tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc

73207320

atctattttg tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt atctattttg tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt

73807380

tcccaactat tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa tcccaactat tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa

74407440

acatcctgcc aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga acatcctgcc aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga

75007500

atgaaaattt ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc atgaaaattt ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc

75607560

ttatttgcag cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg ttatttgcag cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg

76207620

gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt

76807680

tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc

77407740

gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg

78007800

attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga attagggtga tggttcacgt agtggggccat cgccctgata gacggttttt cgccctttga

78607860

cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc

79207920

ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa

79807980

aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa

80408040

tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa

81008100

tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt

81608160

gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg

82208220

cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag

82808280

atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg

83408340

agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg

84008400

gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt

84608460

ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga

85208520

cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac

85808580

ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc

86408640

atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc

87008700

gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac

87608760

tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag

88208820

gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg

88808880

gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta

89408940

tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg

90009000

ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata

90609060

tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt

91209120

ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc

91809180

ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct

92409240

tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa

93009300

ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag

93609360

tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc

94209420

tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg

94809480

actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca

95409540

cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt

96009600

gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg

96609660

tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc

97209720

ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc

97809780

ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc

98409840

cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg

99009900

cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga

99609960

gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt

1002010020

cacaccgcag accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat cacaccgcag accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat

1008010080

gccctgcgta agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa gccctgcgta agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa

1014010140

actatgacaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta actatgacaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta

1020010200

tgctgtgaaa aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa tgctgtgaaa aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa

1026010260

gtgcaaattg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt gtgcaaattg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt

1032010320

cgcggcgttg tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgcggcgttg tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa

1038010380

cgaattgtta ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc cgaattgtta ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc

1044010440

ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca

1050010500

cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc

1056010560

cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct

1062010620

gctcaaacct gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg gctcaaacct gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg

1068010680

cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct

1074010740

gatgttggga gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gatgttggga gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc

1080010800

gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc

1086010860

cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca

1092010920

tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat

1098010980

gcccgaggca tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg gcccgaggca tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg

1104011040

ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac

1110011100

ttgcattaca gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttgcattaca gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt

1116011160

ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc

1122011220

tggctggcga acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg tggctggcga acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg

1128011280

ctgttcttct acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga ctgttcttct acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga

1134011340

cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc

1140011400

ggttttctgg aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt ggttttctgg aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt

1146011460

tggctacgta tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct tggctacgta tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct

1152011520

cgcaaataaa taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa cgcaaataaa taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa

1158011580

tattccggat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc tattccggat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc

1164011640

gtactaccat caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt gtactaccat caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt

1170011700

tcagggcgcc atgggatcc tcagggcgcc atgggatcc

1171911719

<210> 208<210> 208

<211> 11796<211> 11796

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 208<400> 208

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg

240 240

cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt

300 300

ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc cccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc

360 360

aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag

420 420

acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga

480 480

ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac

540 540

ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca

600 600

tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat

660 660

ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag

720 720

gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa

780 780

gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga

840 840

cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc

900 900

caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca

960 960

ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt

10201020

gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc

10801080

tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa

11401140

gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc

12001200

agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt

12601260

taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga

13201320

ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg

13801380

actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg

14401440

tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt

15001500

gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga

15601560

tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg

16201620

cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg

16801680

gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc

17401740

aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg

18001800

gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc

18601860

tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag

19201920

gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat

19801980

ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg

20402040

gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg

21002100

gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag

21602160

ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacagga tgctgcctct

22202220

gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc

22802280

ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct

23402340

gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc

24002400

agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc

24602460

cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg

25202520

aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag

25802580

gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac

26402640

agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac

27002700

tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac

27602760

aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag

28202820

aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat

28802880

gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc

29402940

ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg

30003000

cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg

30603060

cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct

31203120

gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc

31803180

tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac

32403240

cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc

33003300

tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag

33603360

gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc

34203420

ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc

34803480

cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat

35403540

gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac

36003600

cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc

36603660

ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag

37203720

gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag

37803780

aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca

38403840

gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga cccaggagg

39003900

attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac

39603960

gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct

40204020

gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg

40804080

gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc

41404140

agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc

42004200

tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg

42604260

ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag

43204320

cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac

43804380

cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg

44404440

gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac

45004500

accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc accctgaacc ctgcccatgg caggcaggtg actngtgcagg agtttgccct gttcttcacc

45604560

atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc

46204620

ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc

46804680

aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg

47404740

tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat

48004800

gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg

48604860

gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg

49204920

attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc

49804980

cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc

50405040

cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc

51005100

tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc

51605160

catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc catggcatca agacccagg ggccaggcag aagttcagca gcctgtacat cagccagttc

52205220

atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc

52805280

accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac

53405340

ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc

54005400

ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag

54605460

agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc

55205520

acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc

55805580

caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact

56405640

ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg

57005700

atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag

57605760

gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg

58205820

ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg

58805880

gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca

59405940

tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa

60006000

caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat

60606060

tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc

61206120

aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt

61806180

ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg

62406240

ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc

63006300

ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct

63606360

ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg

64206420

ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg

64806480

gcactgataa ttccgtggtg ttgtctccat aaagtaggaa acactacacg attccataaa gcactgataa ttccgtggtg ttgtctccat aaagtaggaa acactacacg attccataaa

65406540

gtaggaaaca ctacatcact ccataaagta ggaaacacta catgtgcctt ctagttgcca gtaggaaaca ctacatcact ccataaagta ggaaacacta catgtgcctt ctagttgcca

66006600

gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac

66606660

tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat

67206720

tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca

67806780

tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg

68406840

cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc

69006900

tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc

69606960

ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt

70207020

accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt tgtagaggtt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt tgtagaggtt

70807080

ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca

71407140

attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc

72007200

acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc

72607260

atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag atccgaacca atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag atccgaacca

73207320

gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga

73807380

cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca

74407440

tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat ttttcttcct tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat ttttcttcct

75007500

gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat cttcggctac gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat cttcggctac

75607560

tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa tgtttgtaat

76207620

tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg

76807680

cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc

77407740

cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc

78007800

ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct

78607860

cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac

79207920

ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac

79807980

tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat

80408040

ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa

81008100

aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg gaacccctat aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg gaacccctat

81608160

ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata

82208220

aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct

82808280

tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa

83408340

agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa

84008400

cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt

84608460

taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg

85208520

tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca

85808580

tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa

86408640

cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt

87008700

gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc

87608760

cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa

88208820

actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga

88808880

ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc

89408940

tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga

90009000

tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga

90609060

acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga

91209120

ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat

91809180

ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt

92409240

ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct

93009300

gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc

93609360

ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc

94209420

aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc

94809480

gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc

95409540

gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg

96009600

aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata

96609660

cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta

97209720

tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc

97809780

ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg

98409840

atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt

99009900

cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt

99609960

ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga

1002010020

gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac

1008010080

gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa tcggttacgg gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa tcggttacgg

1014010140

ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact

1020010200

gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat agttgtaaac gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat agttgtaaac

1026010260

tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg gctaaagcaa tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg gctaaagcaa

1032010320

actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt ggccaagggc actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt ggccaagggc

1038010380

atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg cggccgggaa atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg cggccgggaa

1044010440

gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat caaagtgcat gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat caaagtgcat

1050010500

cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc

1056010560

tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga ggagattgat tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga ggagattgat

1062010620

gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat catagatata gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat catagatata

1068010680

gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag cgccaacaac gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag cgccaacaac

1074010740

cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag

1080010800

gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact cacgaccgaa gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact cacgaccgaa

1086010860

aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac atgtgcgaat aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac atgtgcgaat

1092010920

gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaacatc gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaacatc

1098010980

gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac

1104011040

gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca

1110011100

tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc

1116011160

gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gtcaactggg gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gtcaactggg

1122011220

ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc agcagcgaag ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc agcagcgaag

1128011280

tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc

1134011340

aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat ctgccctggc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat ctgccctggc

1140011400

ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg

1146011460

aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc caggactcta aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc caggactcta

1152011520

gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca tggagataat gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca tggagataat

1158011580

taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa cagttttgta taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa cagttttgta

1164011640

ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg gcgcggatct ataaaaaaac ctataaatat tccggattat tcataccgtc cccacatcgg gcgcggatct

1170011700

cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga tatcccaacg cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga tatcccaacg

1176011760

accgaaaacc tgtattttca gggcgccatg ggatcc accgaaaacc tgtattttca gggcgccatg ggatcc

1179611796

<210> 209<210> 209

<211> 10795<211> 10795

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 209<400> 209

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240 240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300 300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360 360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420 420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480 480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540 540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600 600

ggtttaaacg ccgccaccat gcagatcgag ctgtctacct gcttcttcct gtgcctgctg ggtttaaacg ccgccaccat gcagatcgag ctgtctacct gcttcttcct gtgcctgctg

660 660

cggttctgct tcagcgccac cagaagatat tacctgggcg ccgtggaact gagctgggac cggttctgct tcagcgccac cagaagatat tacctgggcg ccgtggaact gagctgggac

720 720

tacatgcagt ctgacctggg agagctgccc gtggacgcta gatttcctcc aagagtgccc tacatgcagt ctgacctggg agagctgccc gtggacgcta gatttcctcc aagagtgccc

780 780

aagagcttcc ccttcaacac ctccgtggtg tacaagaaaa ccctgttcgt ggaattcacc aagagcttcc ccttcaacac ctccgtggtg tacaagaaaa ccctgttcgt ggaattcacc

840 840

gaccacctgt tcaatatcgc caagcctcgg cctccttgga tgggactgct gggacctaca gaccacctgt tcaatatcgc caagcctcgg cctccttgga tgggactgct gggacctaca

900 900

attcaggccg aggtgtacga caccgtggtc atcaccctga agaacatggc cagccatcct attcaggccg aggtgtacga caccgtggtc atcaccctga agaacatggc cagccatcct

960 960

gtgtctctgc acgccgtggg agtgtcttat tggaaggctt ctgagggcgc cgagtacgac gtgtctctgc acgccgtggg agtgtcttat tggaaggctt ctgagggcgc cgagtacgac

10201020

gatcagacaa gccagagaga gaaagaggac gacaaggttt tccctggcgg cagccacacc gatcagacaa gccagagaga gaaagaggac gacaaggttt tccctggcgg cagccacacc

10801080

tatgtctggc aggtcctgaa agaaaacggc cctatggcct ccgatcctct gtgcctgaca tatgtctggc aggtcctgaa agaaaacggc cctatggcct ccgatcctct gtgcctgaca

11401140

tacagctacc tgagccacgt ggacctggtc aaggacctga attctggcct gatcggagcc tacagctacc tgagccacgt ggacctggtc aaggacctga attctggcct gatcggagcc

12001200

ctgctcgtgt gtagagaagg cagcctggcc aaagagaaaa cccagacact gcacaagttc ctgctcgtgt gtagagaagg cagcctggcc aaagagaaaa cccagacact gcacaagttc

12601260

atcctgctgt tcgccgtgtt cgacgagggc aagagctggc acagcgagac aaagaacagc atcctgctgt tcgccgtgtt cgacgagggc aagagctggc acagcgagac aaagaacagc

13201320

ctgatgcagg acagggatgc cgcctctgct agagcttggc ctaagatgca caccgtgaac ctgatgcagg acagggatgc cgcctctgct agagcttggc ctaagatgca caccgtgaac

13801380

ggctacgtga acagaagcct gcctggactg atcggctgcc acagaaagtc cgtgtactgg ggctacgtga acagaagcct gcctggactg atcggctgcc acagaaagtc cgtgtactgg

14401440

cacgtgatcg gcatgggcac aacacctgag gtgcacagca tctttctgga aggccacacc cacgtgatcg gcatgggcac aacacctgag gtgcacagca tctttctgga aggccacacc

15001500

ttcctcgtgc ggaaccacag acaggccagc ctggaaatca gccctatcac cttcctgacc ttcctcgtgc ggaaccacag acaggccagc ctggaaatca gccctatcac cttcctgacc

15601560

gctcagaccc tgctgatgga tctgggccag tttctgctgt tctgccacat cagctcccac gctcagaccc tgctgatgga tctgggccag tttctgctgt tctgccacat cagctcccac

16201620

cagcacgatg gcatggaagc ctacgtgaag gtggacagct gccccgaaga accccagctg cagcacgatg gcatggaagc ctacgtgaag gtggacagct gccccgaaga accccagctg

16801680

cggatgaaga acaacgagga agccgaggac tacgacgacg acctgaccga ctctgagatg cggatgaaga acaacgagga agccgaggac tacgacgacg acctgaccga ctctgagatg

17401740

gacgtcgtca gattcgacga cgataacagc cccagcttca tccagatcag aagcgtggcc gacgtcgtca gattcgacga cgataacagc cccagcttca tccagatcag aagcgtggcc

18001800

aagaagcacc ccaagacctg ggtgcactat atcgccgccg aggaagagga ctgggattac aagaagcacc ccaagacctg ggtgcactat atcgccgccg aggaagagga ctgggattac

18601860

gctcctctgg tgctggcccc tgacgacaga agctacaaga gccagtacct gaacaacggc gctcctctgg tgctggcccc tgacgacaga agctacaaga gccagtacct gaacaacggc

19201920

cctcagcgga tcggccggaa gtataagaaa gtgcggttca tggcctacac cgacgagaca cctcagcgga tcggccggaa gtataagaaa gtgcggttca tggcctacac cgacgagaca

19801980

ttcaagacca gagaggccat ccagcacgag agcggaattc tgggccctct gctgtatggc ttcaagacca gagaggccat ccagcacgag agcggaattc tgggccctct gctgtatggc

20402040

gaagtgggcg atacactgct gatcatcttc aagaaccagg ccagcagacc ctacaacatc gaagtgggcg atacactgct gatcatcttc aagaaccagg ccagcagacc ctacaacatc

21002100

taccctcacg gcatcaccga tgtgcggccc ctgtattcta gaaggctgcc caagggcgtg taccctcacg gcatcaccga tgtgcggccc ctgtattcta gaaggctgcc caagggcgtg

21602160

aagcacctga aggacttccc tatcctgcct ggcgagattt tcaagtacaa gtggaccgtg aagcacctga aggacttccc tatcctgcct ggcgagattt tcaagtacaa gtggaccgtg

22202220

accgtggaag atggccccac caagagcgac cctagatgtc tgacacggta ctacagcagc accgtggaag atggccccac caagagcgac cctagatgtc tgacacggta ctacagcagc

22802280

ttcgtgaaca tggaacgcga cctggccagc ggcctgattg gacctctgct gatctgctac ttcgtgaaca tggaacgcga cctggccagc ggcctgattg gacctctgct gatctgctac

23402340

aaagaaagcg tggaccagcg gggcaaccag atcatgagcg acaagcggaa cgtgatcctg aaagaaagcg tggaccagcg gggcaaccag atcatgagcg acaagcggaa cgtgatcctg

24002400

tttagcgtgt tcgatgagaa ccggtcctgg tatctgaccg agaacatcca gcggtttctg tttagcgtgt tcgatgagaa ccggtcctgg tatctgaccg agaacatcca gcggtttctg

24602460

cccaatcctg ccggggtgca actggaagat cctgagttcc aggcaagcaa catcatgcac cccaatcctg ccggggtgca actggaagat cctgagttcc aggcaagcaa catcatgcac

25202520

tccatcaatg gctatgtgtt cgacagcctg cagctgagcg tgtgcctgca cgaagtggcc tccatcaatg gctatgtgtt cgacagcctg cagctgagcg tgtgcctgca cgaagtggcc

25802580

tactggtaca tcctgagcat tggcgcccag accgacttcc tgtccgtgtt ctttagcggc tactggtaca tcctgagcat tggcgcccag accgacttcc tgtccgtgtt ctttagcggc

26402640

tacaccttca agcacaagat ggtgtacgag gataccctga cactgttccc attcagcggc tacaccttca agcacaagat ggtgtacgag gataccctga cactgttccc attcagcggc

27002700

gagacagtgt tcatgagcat ggaaaacccc ggcctgtgga ttctgggctg tcacaacagc gagacagtgt tcatgagcat ggaaaacccc ggcctgtgga ttctgggctg tcacaacagc

27602760

gacttccgga acagaggcat gacagccctg ctgaaggtgt ccagctgcga caagaacacc gacttccgga acagaggcat gacagccctg ctgaaggtgt ccagctgcga caagaacacc

28202820

ggcgactact acgaggacag ctatgaggac atcagcgcct acctgctgag caagaacaat ggcgactact acgaggacag ctatgaggac atcagcgcct acctgctgag caagaacaat

28802880

gccatcgagc ctcggagctt cagccagaat cctcctgtgc tgaagcggca ccagcgcgag gccatcgagc ctcggagctt cagccagaat cctcctgtgc tgaagcggca ccagcgcgag

29402940

atcaccagaa caaccctgca gagcgaccaa gaggaaatcg attacgacga caccatcagc atcaccagaa caaccctgca gagcgaccaa gaggaaatcg attacgacga caccatcagc

30003000

gtcgagatga agaaagaaga tttcgacatc tacgacgagg acgagaatca gagccccaga gtcgagatga agaaagaaga tttcgacatc tacgacgagg acgagaatca gagccccaga

30603060

agctttcaga aaaagacccg gcactacttc attgccgccg tcgagagact gtgggactac agctttcaga aaaagacccg gcactacttc attgccgccg tcgagagact gtgggactac

31203120

ggcatgtcta gcagccctca cgtgctgaga aatagagccc agagcggcag cgtgccccag ggcatgtcta gcagccctca cgtgctgaga aatagagccc agagcggcag cgtgccccag

31803180

ttcaagaaag tggtgttcca agagttcacc gacggcagct tcacccagcc actgtataga ttcaagaaag tggtgttcca agagttcacc gacggcagct tcacccagcc actgtataga

32403240

ggcgagctga acgagcatct gggcctgctg ggcccttata tcagagccga agtggaagat ggcgagctga acgagcatct gggcctgctg ggcccttata tcagagccga agtggaagat

33003300

aacatcatgg tcaccttccg gaatcaggct agccggcctt acagcttcta cagctccctg aacatcatgg tcaccttccg gaatcaggct agccggcctt acagcttcta cagctccctg

33603360

atcagctacg aagaggacca gagacagggc gctgagccca gaaagaactt cgtgaagccc atcagctacg aagaggacca gagacagggc gctgagccca gaaagaactt cgtgaagccc

34203420

aacgagacta agacctactt ttggaaggtg cagcaccaca tggcccctac aaaggacgag aacgagacta agacctactt ttggaaggtg cagcaccaca tggcccctac aaaggacgag

34803480

ttcgactgca aagcctgggc ctacttctcc gatgtggatc tggaaaagga cgtgcacagc ttcgactgca aagcctgggc ctacttctcc gatgtggatc tggaaaagga cgtgcacagc

35403540

gggctcatcg gaccactgct tgtgtgccac accaacacac tgaaccccgc tcacggcaga gggctcatcg gaccactgct tgtgtgccac accaacacac tgaaccccgc tcacggcaga

36003600

caagtgacag tgcaagagtt cgccctgttc ttcaccatct tcgacgaaac aaagagctgg caagtgacag tgcaagagtt cgccctgttc ttcaccatct tcgacgaaac aaagagctgg

36603660

tacttcaccg agaatatgga acggaactgc agagcccctt gcaacatcca gatggaagat tacttcaccg agaatatgga acggaactgc agagcccctt gcaacatcca gatggaagat

37203720

cccaccttca aagagaacta ccggttccac gccatcaacg gctacatcat ggacacactg cccaccttca aagagaacta ccggttccac gccatcaacg gctacatcat ggacacactg

37803780

cccggcctgg ttatggccca ggatcagaga atccggtggt atctgctgtc catgggctcc cccggcctgg ttatggccca ggatcagaga atccggtggt atctgctgtc catgggctcc

38403840

aacgagaata tccacagcat ccacttcagc ggccacgtgt tcaccgtgcg gaaaaaagaa aacgagaata tccacagcat ccacttcagc ggccacgtgt tcaccgtgcg gaaaaaagaa

39003900

gagtacaaaa tggccctgta caatctgtac cctggggtgt tcgaaaccgt ggaaatgctg gagtacaaaa tggccctgta caatctgtac cctggggtgt tcgaaaccgt ggaaatgctg

39603960

ccttccaagg ccggcatttg gagagtggaa tgtctgattg gagagcacct ccacgccgga ccttccaagg ccggcatttg gagagtggaa tgtctgattg gagagcacct ccacgccgga

40204020

atgagcaccc tgtttctggt gtacagcaac aagtgtcaga cccctctcgg catggcctct atgagcaccc tgtttctggt gtacagcaac aagtgtcaga cccctctcgg catggcctct

40804080

ggacacatca gagacttcca gatcaccgcc tctggccagt acggacagtg ggctcctaaa ggacacatca gagacttcca gatcaccgcc tctggccagt acggacagtg ggctcctaaa

41404140

ctggctcggc tgcactacag cggcagcatc aatgcctggt ccaccaaaga gcccttcagc ctggctcggc tgcactacag cggcagcatc aatgcctggt ccaccaaaga gcccttcagc

42004200

tggatcaagg tggacctgct ggctcccatg atcatccacg gaatcaagac ccagggcgcc tggatcaagg tggacctgct ggctccatg atcatccacg gaatcaagac ccagggcgcc

42604260

agacagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc agacagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc

43204320

aagaagtggc agacctacag aggcaacagc accggcacac tcatggtgtt cttcggcaac aagaagtggc agacctacag aggcaacagc accggcacac tcatggtgtt cttcggcaac

43804380

gtggactcca gcggcattaa gcacaacatc ttcaaccctc caatcattgc ccggtacatc gtggactcca gcggcattaa gcacaacatc ttcaaccctc caatcattgc ccggtacatc

44404440

cggctgcacc ccacacacta cagcatccgg tctaccctga gaatggaact gatgggctgc cggctgcacc ccacacacta cagcatccgg tctaccctga gaatggaact gatgggctgc

45004500

gacctgaaca gctgctctat gcccctcgga atggaaagca aggccatcag cgacgcccag gacctgaaca gctgctctat gcccctcgga atggaaagca aggccatcag cgacgcccag

45604560

atcacagcca gcagctactt caccaacatg ttcgccactt ggagcccctc caaggctaga atcacagcca gcagctactt caccaacatg ttcgccactt ggagcccctc caaggctaga

46204620

ctgcatctgc agggcagaag caacgcttgg aggccccaag tgaacaaccc caaagagtgg ctgcatctgc agggcagaag caacgcttgg aggccccaag tgaacaaccc caaagagtgg

46804680

ctgcaggttg actttcaaaa gaccatgaaa gtgaccggcg tgaccacaca gggcgtcaag ctgcaggttg actttcaaaa gaccatgaaa gtgaccggcg tgaccacaca gggcgtcaag

47404740

tctctgctga cctctatgta cgtgaaagag ttcctgatct ccagcagcca ggacggccat tctctgctga cctctatgta cgtgaaagag ttcctgatct ccagcagcca ggacggccat

48004800

cagtggaccc tgtttttcca gaacggcaaa gtgaaagtgt tccagggcaa tcaggacagc cagtggaccc tgtttttcca gaacggcaaa gtgaaagtgt tccagggcaa tcaggacagc

48604860

ttcacacccg tggtcaattc tctggaccct ccactgctga ccagatacct gcggattcac ttcacacccg tggtcaattc tctggaccct ccactgctga cgagatacct gcggattcac

49204920

cctcagtctt gggtgcacca gatcgctctg cggatggaag tgctgggctg tgaagctcag cctcagtctt gggtgcacca gatcgctctg cggatggaag tgctgggctg tgaagctcag

49804980

gacctctact agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt gacctctact agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt

50405040

ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac

51005100

atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga

51605160

aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg

52205220

aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt

52805280

tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata

53405340

aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg

54005400

tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac

54605460

tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct

55205520

gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt

55805580

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc

56405640

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc

57005700

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt

57605760

gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct

58205820

acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt

58805880

gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa

59405940

ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc

60006000

gcgcctcgag gcatgcggta ccaagcttgt cgagaagtac tagaggatca taatcagcca gcgcctcgag gcatgcggta ccaagcttgt cgagaagtac tagaggatca taatcagcca

60606060

taccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct taccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct

61206120

gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta

61806180

caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag

62406240

ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgat cactgatatc ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgat cactgatatc

63006300

gcctaggaga tccgaaccag ataagtgaaa tctagttcca aactattttg tcatttttaa gcctaggaga tccgaaccag ataagtgaaa tctagttcca aactattttg tcatttttaa

63606360

ttttcgtatt agcttacgac gctacaccca gttcccatct attttgtcac tcttccctaa ttttcgtatt agcttacgac gctacaccca gttcccatct attttgtcac tcttccctaa

64206420

ataatcctta aaaactccat ttccacccct cccagttccc aactattttg tccgcccaca ataatcctta aaaactccat ttccacccct cccagttccc aactattttg tccgcccaca

64806480

gcggggcatt tttcttcctg ttatgttttt aatcaaacat cctgccaact ccatgtgaca gcggggcatt tttcttcctg ttatgttttt aatcaaacat cctgccaact ccatgtgaca

65406540

aaccgtcatc ttcggctact ttttctctgt cacagaatga aaatttttct gtcatctctt aaccgtcatc ttcggctact ttttctctgt cacagaatga aaatttttct gtcatctctt

66006600

cgttattaat gtttgtaatt gactgaatat caacgcttat ttgcagcctg aatggcgaat cgttattaat gtttgtaatt gactgaatat caacgcttat ttgcagcctg aatggcgaat

66606660

gggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga gggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga

67206720

ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg

67806780

ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat

68406840

ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg

69006900

ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata

69606960

gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt

70207020

tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat

70807080

ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa

71407140

atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca

72007200

tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc

72607260

aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc

73207320

acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt

73807380

acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt

74407440

ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg

75007500

ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact

75607560

caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg

76207620

ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga

76807680

aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg

77407740

aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa

78007800

tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac

78607860

aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc

79207920

cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca

79807980

ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga

80408040

gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta

81008100

agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc

81608160

atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc

82208220

cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt

82808280

cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac

83408340

cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct

84008400

tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact

84608460

tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg

85208520

ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata

85808580

aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga

86408640

cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag

87008700

ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggag cgcacgaggg

87608760

agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac

88208820

ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca

88808880

acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg

89408940

cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc

90009000

gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga

90609060

tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcagacca gccgcgtaac tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcagacca gccgcgtaac

91209120

ctggcaaaat cggttacggt tgagtaataa atggatgccc tgcgtaagcg ggtgtgggcg ctggcaaaat cggttacggt tgagtaataa atggatgccc tgcgtaagcg ggtgtgggcg

91809180

gacaataaag tcttaaactg aacaaaatag atctaaacta tgacaataaa gtcttaaact gacaataaag tcttaaactg aacaaaatag atctaaacta tgacaataaa gtcttaaact

92409240

agacagaata gttgtaaact gaaatcagtc cagttatgct gtgaaaaagc atactggact agacagaata gttgtaaact gaaatcagtc cagttatgct gtgaaaaagc atactggact

93009300

tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc aaattgcccg tcgtattaaa tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc aaattgcccg tcgtattaaa

93609360

gaggggcgtg gccaagggca tggtaaagac tatattcgcg gcgttgtgac aatttaccga gaggggcgtg gccaagggca tggtaaagac tatattcgcg gcgttgtgac aatttaccga

94209420

acaactccgc ggccgggaag ccgatctcgg cttgaacgaa ttgttaggtg gcggtacttg acaactccgc ggccgggaag ccgatctcgg cttgaacgaa ttgttaggtg gcggtacttg

94809480

ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg

95409540

cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct

96009600

catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga

96609660

ctgcgagatc atagatatag atctcactac gcggctgctc aaacctgggc agaacgtaag ctgcgagatc atagatatag atctcactac gcggctgctc aaacctgggc agaacgtaag

97209720

ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac

97809780

tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt

98409840

ctccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc ctccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc

99009900

cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac

99609960

tgccctgctg cgtaacatcg ttgctgctgc gtaacatcgt tgctgctcca taacatcaaa tgccctgctg cgtaacatcg ttgctgctgc gtaacatcgt tgctgctcca taacatcaaa

1002010020

catcgaccca cggcgtaacg cgcttgctgc ttggatgccc gaggcataga ctgtacaaaa catcgaccca cggcgtaacg cgcttgctgc ttggatgccc gaggcataga ctgtacaaaa

1008010080

aaacagtcat aacaagccat gaaaaccgcc actgcgccgt taccaccgct gcgttcggtc aaacagtcat aacaagccat gaaaaccgcc actgcgccgt taccaccgct gcgttcggtc

1014010140

aaggttctgg accagttgcg tgagcgcata cgctacttgc attacagttt acgaaccgaa aaggttctgg accagttgcg tgagcgcata cgctacttgc attacagttt acgaaccgaa

1020010200

caggcttatg tcaactgggt tcgtgccttc atccgtttcc acggtgtgcg tcacccggca caggcttatg tcaactgggt tcgtgccttc atccgtttcc acggtgtgcg tcacccggca

1026010260

accttgggca gcagcgaagt cgaggcattt ctgtcctggc tggcgaacga gcgcaaggtt accttgggca gcagcgaagt cgaggcattt ctgtcctggc tggcgaacga gcgcaaggtt

1032010320

tcggtctcca cgcatcgtca ggcattggcg gccttgctgt tcttctacgg caaggtgctg tcggtctcca cgcatcgtca ggcattggcg gccttgctgt tcttctacgg caaggtgctg

1038010380

tgcacggatc tgccctggct tcaggagatc ggaagacctc ggccgtcgcg gcgcttgccg tgcacggatc tgccctggct tcaggagatc ggaagacctc ggccgtcgcg gcgcttgccg

1044010440

gtggtgctga ccccggatga agtggttcgc atcctcggtt ttctggaagg cgagcatcgt gtggtgctga ccccggatga agtggttcgc atcctcggtt ttctggaagg cgagcatcgt

1050010500

ttgttcgccc aggactctag ctatagttct agtggttggc tacgtatact ccggaatatt ttgttcgccc aggactctag ctatagttct agtggttggc tacgtatact ccggaatatt

1056010560

aatagatcat ggagataatt aaaatgataa ccatctcgca aataaataag tattttactg aatagatcat ggagataatt aaaatgataa ccatctcgca aataaataag tattttactg

1062010620

ttttcgtaac agttttgtaa taaaaaaacc tataaatatt ccggattatt cataccgtcc ttttcgtaac agttttgtaa taaaaaaacc tataaatatt ccggattatt cataccgtcc

1068010680

caccatcggg cgcggatctc ggtccgaaac catgtcgtac taccatcacc atcaccatca caccatcggg cgcggatctc ggtccgaaac catgtcgtac taccatcacc atcaccatca

1074010740

cgattacgat atcccaacga ccgaaaacct gtattttcag ggcgccatgg gatcc cgattacgat atcccaacga ccgaaaacct gtattttcag ggcgccatgg gatcc

1079510795

<210> 210<210> 210

<211> 10846<211> 10846

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 210<400> 210

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240 240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300 300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360 360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420 420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480 480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540 540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600 600

ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg

660 660

aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac

720 720

tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc

780 780

aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact

840 840

gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc

900 900

atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct

960 960

gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat

10201020

gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc

10801080

tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc

11401140

tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc

12001200

ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc

12601260

atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc

13201320

ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat

13801380

ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg

14401440

catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc

15001500

ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact

15601560

gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac

16201620

cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg

16801680

aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg

17401740

gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc

18001800

aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat

18601860

gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc

19201920

ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc

19801980

ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg

20402040

gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc

21002100

tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg

21602160

aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg

22202220

actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc

22802280

tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac

23402340

aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg

24002400

ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg

24602460

cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac

25202520

agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc

25802580

tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc

26402640

tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg

27002700

gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct

27602760

gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact

28202820

ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat

28802880

gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc

29402940

agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg

30003000

accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg

30603060

aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag

31203120

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc

31803180

agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag

32403240

gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg

33003300

aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg

33603360

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat

34203420

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc

34803480

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc

35403540

aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt

36003600

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact

36603660

gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact

37203720

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc

37803780

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg

38403840

gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac

39003900

atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag

39603960

atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag

40204020

gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc

40804080

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc

41404140

agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg

42004200

ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag

42604260

gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag

43204320

ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg

43804380

cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc

44404440

tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac

45004500

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac

45604560

agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc

46204620

agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg

46804680

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg

47404740

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg

48004800

accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc

48604860

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct

49204920

gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc

49804980

tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac

50405040

tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt tgattaatta agagcatctt accgccatt attcccatat ttgttctgtt tttcttgatt

51005100

tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg

51605160

gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc

52205220

gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga

52805280

ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc

53405340

tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt

54005400

tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg

54605460

tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg

55205520

ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc

55805580

gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt

56405640

ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg

57005700

ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt

57605760

gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca

58205820

atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata

58805880

agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt

59405940

ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg

60006000

acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga

60606060

ggcatgcggt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt ggcatgcggt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt

61206120

tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa

61806180

aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag

62406240

caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt

63006300

gtccaaactc atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag gtccaaactc atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag

63606360

atccgaacca gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat atccgaacca gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat

64206420

tagcttacga cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt tagcttacga cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt

64806480

aaaaactcca tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat aaaaactcca tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat

65406540

ttttcttcct gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat ttttcttcct gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat

66006600

cttcggctac tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa cttcggctac tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa

66606660

tgtttgtaat tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc tgtttgtaat tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc

67206720

cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac

67806780

ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg

68406840

ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt

69006900

tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc

69606960

cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct

70207020

tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga

70807080

ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga

71407140

attttaacaa aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg attttaacaa aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg

72007200

gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat

72607260

aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc

73207320

gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa

73807380

cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac

74407440

tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga

75007500

tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag

75607560

agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca

76207620

cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca

76807680

tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa

77407740

ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc

78007800

tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa

78607860

cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag

79207920

actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct

79807980

ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac

80408040

tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa

81008100

ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt

81608160

aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat

82208220

ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg

82808280

agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc

83408340

ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg

84008400

tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag

84608460

cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact

85208520

ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg

85808580

gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc

86408640

ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg

87008700

aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg

87608760

cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag

88208820

ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc

88808880

gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct

89408940

ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc

90009000

ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc

90609060

gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt

91209120

ttctccttac gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa ttctccttac gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa

91809180

tcggttacgg ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa tcggttacgg ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa

92409240

gtcttaaact gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat gtcttaaact gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat

93009300

agttgtaaac tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg agttgtaaac tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg

93609360

gctaaagcaa actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt gctaaagcaa actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt

94209420

ggccaagggc atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg ggccaagggc atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg

94809480

cggccgggaa gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat cggccgggaa gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat

95409540

caaagtgcat cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caaagtgcat cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt

96009600

caccgtaatc tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga caccgtaatc tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga

96609660

ggagattgat gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat ggagattgat gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat

97209720

catagatata gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag catagatata gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag

97809780

cgccaacaac cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca cgccaacaac cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca

98409840

agttcccgag gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact agttcccgag gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact

99009900

cacgaccgaa aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac cacgaccgaa aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac

99609960

atgtgcgaat gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct atgtgcgaat gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct

1002010020

gcgtaacatc gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc gcgtaacatc gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc

1008010080

acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca

1014010140

taacaagcca tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg taacaagcca tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg

1020010200

gaccagttgc gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gaccagttgc gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat

1026010260

gtcaactggg ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc gtcaactggg ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc

1032010320

agcagcgaag tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc agcagcgaag tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc

1038010380

acgcatcgtc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat acgcatcgtc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat

1044010440

ctgccctggc ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg ctgccctggc ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg

1050010500

accccggatg aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc accccggatg aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc

1056010560

caggactcta gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca caggactcta gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca

1062010620

tggagataat taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa tggagataat taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa

1068010680

cagttttgta ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg cagttttgta ataaaaaaac ctataaatat tccggattat tcataccgtc caccatcgg

1074010740

gcgcggatct cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga gcgcggatct cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga

1080010800

tatcccaacg accgaaaacc tgtattttca gggcgccatg ggatcc tatcccaacg accgaaaacc tgtattttca gggcgccatg ggatcc

1084610846

<210> 211<210> 211

<211> 10923<211> 10923

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 211<400> 211

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240 240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300 300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360 360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420 420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480 480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540 540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600 600

ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg

660 660

aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac

720 720

tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc

780 780

aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact

840 840

gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc

900 900

atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct

960 960

gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat

10201020

gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc

10801080

tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc

11401140

tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc

12001200

ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc

12601260

atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc

13201320

ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat

13801380

ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg

14401440

catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc

15001500

ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact

15601560

gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac

16201620

cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg

16801680

aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg

17401740

gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc

18001800

aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat

18601860

gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc

19201920

ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc

19801980

ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg

20402040

gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc

21002100

tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg

21602160

aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg

22202220

actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc

22802280

tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac

23402340

aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg

24002400

ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg

24602460

cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac

25202520

agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc

25802580

tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc

26402640

tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg

27002700

gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct

27602760

gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact

28202820

ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat

28802880

gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc

29402940

agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg

30003000

accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg

30603060

aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag

31203120

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc

31803180

agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag

32403240

gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg

33003300

aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg

33603360

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat

34203420

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc

34803480

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc

35403540

aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt

36003600

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact

36603660

gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact

37203720

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc

37803780

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg

38403840

gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac

39003900

atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag

39603960

atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag

40204020

gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc

40804080

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc

41404140

agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg

42004200

ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag

42604260

gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag

43204320

ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg

43804380

cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc

44404440

tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac

45004500

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac

45604560

agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc

46204620

agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg

46804680

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg

47404740

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg

48004800

accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc

48604860

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct

49204920

gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc

49804980

tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac

50405040

tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt tgattaatta agagcatctt accgccatt attcccatat ttgttctgtt tttcttgatt

51005100

tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg

51605160

gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc

52205220

gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga

52805280

ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc

53405340

tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt

54005400

tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg

54605460

tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg

55205520

ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc

55805580

gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctccataaa gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctccataaa

56405640

gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca taaagtagga gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca taaagtagga

57005700

aacactacat gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc aacactacat gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc

57605760

cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc

58205820

gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg

58805880

ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga

59405940

gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa

60006000

cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg

60606060

cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct

61206120

gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata

61806180

atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc

62406240

ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat

63006300

aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg

63606360

cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca

64206420

ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc

64806480

atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc

65406540

ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc

66006600

cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc

66606660

atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt

67206720

catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa

67806780

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg

68406840

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc

69006900

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg

69606960

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc

70207020

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt

70807080

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc

71407140

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta

72007200

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt

72607260

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta

73207320

tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat

73807380

gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt

74407440

ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg

75007500

agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga

75607560

agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg

76207620

tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt

76807680

tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg

77407740

cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg

78007800

aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga

78607860

tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc

79207920

tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc

79807980

ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc

80408040

ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg

81008100

cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac

81608160

gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc

82208220

actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt

82808280

aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac

83408340

caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa

84008400

aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc

84608460

accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt

85208520

aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg

85808580

ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc

86408640

agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt

87008700

accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga

87608760

gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct

88208820

tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg

88808880

cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca

89408940

cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa

90009000

cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt

90609060

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga

91209120

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga

91809180

gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc

92409240

cgcgtaacct ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg cgcgtaacct ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg

93009300

tgtgggcgga caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt tgtgggcgga caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt

93609360

cttaaactag acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat cttaaactag acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat

94209420

actggacttt tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc actggacttt tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc

94809480

gtattaaaga ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa gtattaaaga ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa

95409540

tttaccgaac aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc tttaccgaac aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc

96009600

ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag

96609660

agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc

97209720

gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc

97809780

gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag

98409840

aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa

99009900

tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt

99609960

ggctacgtct ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg ggctacgtct ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg

1002010020

gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt

1008010080

agggcgactg ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata agggcgactg ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata

1014010140

acatcaaaca tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact acatcaaaca tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact

1020010200

gtacaaaaaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gtacaaaaaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc

1026010260

gttcggtcaa ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gttcggtcaa ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac

1032010320

gaaccgaaca ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc gaaccgaaca ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc

1038010380

acccggcaac cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc acccggcaac cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc

1044010440

gcaaggtttc ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca gcaaggtttc ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca

1050010500

aggtgctgtg cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc aggtgctgtg cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc

1056010560

gcttgccggt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg gcttgccggt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg

1062010620

agcatcgttt gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc agcatcgttt gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc

1068010680

ggaatattaa tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ggaatattaa tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta

1074010740

ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca

1080010800

taccgtccca ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat taccgtccca ccatcggggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat

1086010860

caccatcacg attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga caccatcacg attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga

1092010920

tcc tcc

1092310923

<210> 212<210> 212

<211> 12404<211> 12404

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 212<400> 212

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gagcggccgc tcaatattgg ccattagcca tattattcat atctacgtag ccatgctcta gagcggccgc tcaatattgg ccattagcca tattattcat

240 240

tggttatata gcataaatca atattggcta ttggccattg catacgttgt atctatatca tggttatata gcataaatca atattggcta ttggccattg catacgttgt atctatatca

300 300

taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc attgattatt taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc attgattatt

360 360

gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt

420 420

ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc

480 480

attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg

540 540

tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat

600 600

gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca

660 660

gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat

720 720

taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc

780 780

acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg

840 840

gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg

900 900

gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag

960 960

gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac

10201020

gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac

10801080

tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt

11401140

agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc

12001200

tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc

12601260

gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg

13201320

cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc

13801380

ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtggggggggt

14401440

gagcaggggg tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga gagcagggg tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga

15001500

gttgctgagc acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gttgctgagc acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc

15601560

gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg

16201620

gccggggagg gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gccggggagg gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc

16801680

gcggcgagcc gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct gcggcgagcc gcagccattg ccttttatgg taatcgtgcg agaggcgca gggacttcct

17401740

ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg

18001800

cgcggggcga agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg cgcggggcga agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg

18601860

tcgccgcgcc gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tcgccgcgcc gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc

19201920

tgccttcggg ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcggctct tgccttcggg ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcggctct

19801980

agagcctctg ctaaccatgt tttagccttc ttctttttcc tacagctcct gggcaacgtg agagcctctg ctaaccatgt tttagccttc ttctttttcc tacagctcct gggcaacgtg

20402040

ctggttattg tgctgtctca tcatttgtcg acagaattcc tcgaagatcc gaaggggttc ctggttattg tgctgtctca tcatttgtcg acagaattcc tcgaagatcc gaaggggttc

21002100

aagcttggca ttccggtact gttggtaaag ccagtttaaa cgccgccacc atgcagatcg aagcttggca ttccggtact gttggtaaag ccagtttaaa cgccgccacc atgcagatcg

21602160

agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc accagaagat agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc accagagat

22202220

attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg ggagagctgc attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg ggagagctgc

22802280

ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac acctccgtgg ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac acctccgtgg

23402340

tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc gccaagcctc tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc gccaagcctc

24002400

ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gacaccgtgg ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gacaccgtgg

24602460

tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg ggagtgtctt tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg ggagtgtctt

25202520

attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga gagaaagagg attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga gagaaagagg

25802580

acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg aaagaaaacg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg aaagaaaacg

26402640

gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac gtggacctgg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac gtggacctgg

27002700

tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa ggcagcctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa ggcagcctgg

27602760

ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ttcgacgagg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ttcgacgagg

28202820

gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat gccgcctctg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat gccgcctctg

28802880

ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc ctgcctggac ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc ctgcctggac

29402940

tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc acaacacctg tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc acaacacctg

30003000

aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac agacaggcca aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac agacaggcca

30603060

gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg gatctgggcc gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg gatctgggcc

31203120

agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gcctacgtga agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gcctacgtga

31803180

aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gaagccgagg aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gaagccgagg

32403240

actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gacgataaca actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gacgataaca

33003300

gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc tgggtgcact gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc tgggtgcact

33603360

atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc cctgacgaca atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc cctgacgaca

34203420

gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg aagtataaga gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg aagtataaga

34803480

aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc atccagcacg aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc atccagcacg

35403540

agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg ctgatcatct agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg ctgatcatct

36003600

tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc gatgtgcggc tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc gatgtgcggc

36603660

ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc cctatcctgc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc cctatcctgc

37203720

ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc accaagagcg ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc accaagagcg

37803780

accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc gacctggcca accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc gacctggcca

38403840

gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag cggggcaacc gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag cggggcaacc

39003900

agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag aaccggtcct agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag aaccggtcct

39603960

ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg caactggaag ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg caactggaag

40204020

atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg ttcgacagcc atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg ttcgacagcc

40804080

tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc attggcgccc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc attggcgccc

41404140

agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag atggtgtacg agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag atggtgtacg

42004200

aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggaaaacc aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggaaaacc

42604260

ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atgacagccc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atgacagccc

43204320

tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac agctatgagg tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac agctatgagg

43804380

acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc ttcagccaga acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc ttcagccaga

44404440

atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg cagagcgacc atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg cagagcgacc

45004500

aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa gatttcgaca aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa gatttcgaca

45604560

tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc cggcactact tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc cggcactact

46204620

tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cacgtgctga tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cacgtgctga

46804680

gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caagagttca gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caagagttca

47404740

ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat ctgggcctgc ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat ctgggcctgc

48004800

tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc cggaatcagg tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc cggaatcagg

48604860

ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cagagacagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cagagacagg

49204920

gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac ttttggaagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac ttttggaagg

49804980

tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg gcctacttct tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg gcctacttct

50405040

ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg cttgtgtgcc ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg cttgtgtgcc

51005100

acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag ttcgccctgt acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag ttcgccctgt

51605160

tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg gaacggaact tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg gaacggaact

52205220

gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac taccggttcc gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac taccggttcc

52805280

acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc caggatcaga acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc caggatcaga

53405340

gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc atccacttca gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc atccacttca

54005400

gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg tacaatctgt gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg tacaatctgt

54605460

accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tggagagtgg accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tggagagtgg

55205520

aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg gtgtacagca aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg gtgtacagca

55805580

acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc cagatcaccg acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc cagatcaccg

56405640

cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac agcggcagca cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac agcggcagca

57005700

tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggctccca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggctccca

57605760

tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc ctgtacatca tgatcatcca cggaatcaag acccagggcg cgacagaa gttcagcagc ctgtacatca

58205820

gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac agaggcaaca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac agaggcaaca

58805880

gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt aagcacaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt aagcacaaca

59405940

tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac tacagcatcc tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac tacagcatcc

60006000

ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct atgcccctcg ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct atgcccctcg

60606060

gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca

61206120

tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga agcaacgctt tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga agcaacgctt

61806180

ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa aagaccatga ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa aagaccatga

62406240

aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg tacgtgaaag aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg tacgtgaaag

63006300

agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc cagaacggca agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc cagaacggca

63606360

aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat tctctggacc aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat tctctggacc

64206420

ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac cagatcgctc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac cagatcgctc

64806480

tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctagttaatt aagagcatct tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctagttaatt aagagcatct

65406540

taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt

66006600

taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc

66606660

aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc

67206720

tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt

67806780

tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc

68406840

ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga

69006900

gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc

69606960

cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct

70207020

cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag

70807080

gttgctgggc actgataatt ccgtggtgtt gtctccataa agtaggaaac actacacgat gttgctgggc actgataatt ccgtggtgtt gtctccataa agtaggaaac actacacgat

71407140

tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca tgtgccttct tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca tgtgccttct

72007200

agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc

72607260

actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt

73207320

cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat

73807380

agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag

74407440

tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg

75007500

ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac

75607560

gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg

76207620

catgcggtac caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg catgcggtac caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg

76807680

tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa

77407740

tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca

78007800

atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt

78607860

ccaaactcat caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccaaactcat caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat

79207920

ccgaaccaga taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta ccgaaccaga taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta

79807980

gcttacgacg ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa gcttacgacg ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa

80408040

aaactccatt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt aaactccatt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt

81008100

ttcttcctgt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct ttcttcctgt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct

81608160

tcggctactt tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tcggctactt tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg

82208220

tttgtaattg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tttgtaattg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc

82808280

tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt

83408340

gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc

84008400

ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta

84608460

cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc

85208520

tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg

85808580

ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt

86408640

ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat

87008700

tttaacaaaa tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga tttaacaaaa tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga

87608760

acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa

88208820

ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt

88808880

gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg

89408940

ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg

90009000

gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg

90609060

agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag

91209120

caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca

91809180

gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg

92409240

agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc

93009300

gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg

93609360

aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg

94209420

ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac

94809480

tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg

95409540

tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg

96009600

gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact

96609660

atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa

97209720

ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt

97809780

aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag

98409840

ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct

99009900

ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt

99609960

tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg

1002010020

cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct

1008010080

gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc

1014010140

gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg

1020010200

tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa

1026010260

ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg

1032010320

gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccagga

1038010380

ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga

1044010440

tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt

1050010500

ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct

1056010560

gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga

1062010620

acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt

1068010680

ctccttacgc atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ctccttacgc atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc

1074010740

ggttacggtt gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt ggttacggtt gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt

1080010800

cttaaactga acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag cttaaactga acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag

1086010860

ttgtaaactg aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc ttgtaaactg aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc

1092010920

taaagcaaac tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg taaagcaaac tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg

1098010980

ccaagggcat ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg ccaagggcat ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg

1104011040

gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca

1110011100

aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca

1116011160

ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg

1122011220

agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca

1128011280

tagatataga tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg tagatataga tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg

1134011340

ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag

1140011400

ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca

1146011460

cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat

1152011520

gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc

1158011580

gtaacatcgt tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac gtaacatcgt tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac

1164011640

ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata

1170011700

acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga

1176011760

ccagttgcgt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt ccagttgcgt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt

1182011820

caactgggtt cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag caactgggtt cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag

1188011880

cagcgaagtc gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac cagcgaagtc gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac

1194011940

gcatcgtcag gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gcatcgtcag gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct

1200012000

gccctggctt caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac gccctggctt caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac

1206012060

cccggatgaa gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca cccggatgaa gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca

1212012120

ggactctagc tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg ggactctagc tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg

1218012180

gagataatta aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gagataatta aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca

1224012240

gttttgtaat aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gttttgtaat aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc

1230012300

gcggatctcg gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata gcggatctcg gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata

1236012360

tcccaacgac cgaaaacctg tattttcagg gcgccatggg atcc tcccaacgac cgaaaacctg tattttcagg gcgccatggg atcc

1240412404

<210> 213<210> 213

<211> 11356<211> 11356

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 213<400> 213

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gagagtcaat gggaaaaacc cattggagcc aagtacactg atctacgtag ccatgctcta gagagtcaat gggaaaaacc cattggagcc aagtacactg

240 240

actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc

300 300

aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt

360 360

tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actgacatgt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actgacatgt

420 420

atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt

480 480

gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccattg gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccatg

540 540

ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg

600 600

cacatacata aggtcaatag gggtgactag tggagaagag catgcttgag ggctgagtgc cacatacata aggtcaatag gggtgactag tggagaagag catgcttgag ggctgagtgc

660 660

ccctcagtgg gcagagagca catggcccac agtccctgag aagttggggg gaggggtggg ccctcagtgg gcagagagca catggcccac agtccctgag aagttggggg gaggggtggg

720 720

caattgaact ggtgcctaga gaaggtgggg cttgggtaaa ctgggaaagt gatgtggtgt caattgaact ggtgcctaga gaaggtgggg cttgggtaaa ctgggaaagt gatgtggtgt

780 780

actggctcca cctttttccc cagggtgggg gagaaccata tataagtgca gtagtctctg actggctcca cctttttccc cagggtgggg gagaaccata tataagtgca gtagtctctg

840 840

tgaacattca agcttctgcc ttctccctcc tgtgagtttg gtaagtcact gactgtctat tgaacattca agcttctgcc ttctccctcc tgtgagtttg gtaagtcact gactgtctat

900 900

gcctgggaaa gggtgggcag gagatggggc agtgcaggaa aagtggcact atgaaccctg gcctgggaaa gggtggggcag gagatggggc agtgcaggaa aagtggcact atgaaccctg

960 960

cagccctaga caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacag cagccctaga caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacag

10201020

tagcttccgt ttaaacgccg ccaccatgca gattgagctg agcacctgct tcttcctgtg tagcttccgt ttaaacgccg ccaccatgca gattgagctg agcacctgct tcttcctgtg

10801080

cctgctgagg ttctgcttct ctgccaccag gagatactac ctgggggctg tggagctgag cctgctgagg ttctgcttct ctgccaccag gagatactac ctggggggctg tggagctgag

11401140

ctgggactac atgcagtctg acctggggga gctgcctgtg gatgccaggt tcccccccag ctgggactac atgcagtctg acctggggga gctgcctgtg gatgccaggt tcccccccag

12001200

agtgcccaag agcttcccct tcaacacctc tgtggtgtac aagaagaccc tgtttgtgga agtgcccaag agcttcccct tcaacacctc tgtggtgtac aagaagaccc tgtttgtgga

12601260

gttcactgac cacctgttca acattgccaa gcccaggccc ccctggatgg gcctgctggg gttcactgac cacctgttca acattgccaa gcccaggccc ccctggatgg gcctgctggg

13201320

ccccaccatc caggctgagg tgtatgacac tgtggtgatc accctgaaga acatggccag ccccaccatc caggctgagg tgtatgacac tgtggtgatc accctgaaga acatggccag

13801380

ccaccctgtg agcctgcatg ctgtgggggt gagctactgg aaggcctctg agggggctga ccaccctgtg agcctgcatg ctgtgggggt gagctactgg aaggcctctg aggggctga

14401440

gtatgatgac cagaccagcc agagggagaa ggaggatgac aaggtgttcc ctgggggcag gtatgatgac cagaccagcc agagggagaa ggaggatgac aaggtgttcc ctggggggcag

15001500

ccacacctat gtgtggcagg tgctgaagga gaatggcccc atggcctctg accccctgtg cccacacctat gtgtggcagg tgctgaagga gaatggcccc atggcctctg accccctgtg

15601560

cctgacctac agctacctga gccatgtgga cctggtgaag gacctgaact ctggcctgat cctgacctac agctacctga gccatgtgga cctggtgaag gacctgaact ctggcctgat

16201620

tggggccctg ctggtgtgca gggagggcag cctggccaag gagaagaccc agaccctgca tggggccctg ctggtgtgca gggagggcag cctggccaag gagaagaccc agaccctgca

16801680

caagttcatc ctgctgtttg ctgtgtttga tgagggcaag agctggcact ctgaaaccaa caagttcatc ctgctgtttg ctgtgtttga tgagggcaag agctggcact ctgaaaccaa

17401740

gaacagcctg atgcaggaca gggatgctgc ctctgccagg gcctggccca agatgcacac gaacagcctg atgcaggaca gggatgctgc ctctgccagg gcctggccca agatgcacac

18001800

tgtgaatggc tatgtgaaca ggagcctgcc tggcctgatt ggctgccaca ggaagtctgt tgtgaatggc tatgtgaaca ggagcctgcc tggcctgatt ggctgccaca ggaagtctgt

18601860

gtactggcat gtgattggca tgggcaccac ccctgaggtg cacagcatct tcctggaggg gtactggcat gtgattggca tgggcaccac ccctgaggtg cacagcatct tcctggaggg

19201920

ccacaccttc ctggtcagga accacaggca ggccagcctg gagatcagcc ccatcacctt cccacaccttc ctggtcagga accacaggca ggccagcctg gagatcagcc ccatcacctt

19801980

cctgactgcc cagaccctgc tgatggacct gggccagttc ctgctgttct gccacatcag cctgactgcc cagaccctgc tgatggacct gggccagttc ctgctgttct gccacatcag

20402040

cagccaccag catgatggca tggaggccta tgtgaaggtg gacagctgcc ctgaggagcc cagccaccag catgatggca tggaggccta tgtgaaggtg gacagctgcc ctgaggagcc

21002100

ccagctgagg atgaagaaca atgaggaggc tgaggactat gatgatgacc tgactgactc ccagctgagg atgaagaaca atgaggaggc tgaggactat gatgatgacc tgactgactc

21602160

tgagatggat gtggtgaggt ttgatgatga caacagcccc agcttcatcc agatcaggtc tgagatggat gtggtgaggt ttgatgatga caacagcccc agcttcatcc agatcaggtc

22202220

tgtggccaag aagcacccca agacctgggt gcactacatt gctgctgagg aggaggactg tgtggccaag aagcacccca agacctgggt gcactacatt gctgctgagg aggaggactg

22802280

ggactatgcc cccctggtgc tggcccctga tgacaggagc tacaagagcc agtacctgaa ggactatgcc cccctggtgc tggcccctga tgacaggagc tacaagagcc agtacctgaa

23402340

caatggcccc cagaggattg gcaggaagta caagaaggtc aggttcatgg cctacactga caatggcccc cagaggattg gcaggaagta caagaaggtc aggttcatgg cctacactga

24002400

tgaaaccttc aagaccaggg aggccatcca gcatgagtct ggcatcctgg gccccctgct tgaaaccttc aagaccaggg aggccatcca gcatgagtct ggcatcctgg gccccctgct

24602460

gtatggggag gtgggggaca ccctgctgat catcttcaag aaccaggcca gcaggcccta gtatggggag gtgggggaca ccctgctgat catcttcaag aaccaggcca gcaggcccta

25202520

caacatctac ccccatggca tcactgatgt gaggcccctg tacagcagga ggctgcccaa caacatctac ccccatggca tcactgatgt gaggcccctg tacagcagga ggctgcccaa

25802580

gggggtgaag cacctgaagg acttccccat cctgcctggg gagatcttca agtacaagtg gggggtgaag cacctgaagg acttccccat cctgcctggg gagatcttca agtacaagtg

26402640

gactgtgact gtggaggatg gccccaccaa gtctgacccc aggtgcctga ccagatacta gactgtgact gtggaggatg gccccaccaa gtctgacccc aggtgcctga ccagatacta

27002700

cagcagcttt gtgaacatgg agagggacct ggcctctggc ctgattggcc ccctgctgat cagcagcttt gtgaacatgg agagggacct ggcctctggc ctgattggcc ccctgctgat

27602760

ctgctacaag gagtctgtgg accagagggg caaccagatc atgtctgaca agaggaatgt ctgctacaag gagtctgtgg accagagggg caaccagatc atgtctgaca agaggaatgt

28202820

gatcctgttc tctgtgtttg atgagaacag gagctggtac ctgactgaga acatccagag gatcctgttc tctgtgtttg atgagaacag gagctggtac ctgactgaga acatccagag

28802880

gttcctgccc aaccctgctg gggtgcagct ggaggaccct gagttccagg ccagcaacat gttcctgccc aaccctgctg gggtgcagct ggaggaccct gagttccagg ccagcaacat

29402940

catgcacagc atcaatggct atgtgtttga cagcctgcag ctgtctgtgt gcctgcatga catgcacagc atcaatggct atgtgtttga cagcctgcag ctgtctgtgt gcctgcatga

30003000

ggtggcctac tggtacatcc tgagcattgg ggcccagact gacttcctgt ctgtgttctt ggtggcctac tggtacatcc tgagcattgg ggcccagact gacttcctgt ctgtgttctt

30603060

ctctggctac accttcaagc acaagatggt gtatgaggac accctgaccc tgttcccctt ctctggctac accttcaagc acaagatggt gtatgaggac accctgaccc tgttcccctt

31203120

ctctggggag actgtgttca tgagcatgga gaaccctggc ctgtggattc tgggctgcca ctctggggag actgtgttca tgagcatgga gaaccctggc ctgtggattc tgggctgcca

31803180

caactctgac ttcaggaaca ggggcatgac tgccctgctg aaagtctcca gctgtgacaa caactctgac ttcaggaaca ggggcatgac tgccctgctg aaagtctcca gctgtgacaa

32403240

gaacactggg gactactatg aggacagcta tgaggacatc tctgcctacc tgctgagcaa gaacactggg gactactatg aggacagcta tgaggacatc tctgcctacc tgctgagcaa

33003300

gaacaatgcc attgagccca ggagcttcag ccagaatgcc actaatgtgt ctaacaacag gaacaatgcc attgagccca ggagcttcag ccagaatgcc actaatgtgt ctaacaacag

33603360

caacaccagc aatgacagca atgtgtctcc cccagtgctg aagaggcacc agagggagat caacaccagc aatgacagca atgtgtctcc cccagtgctg aagaggcacc agagggat

34203420

caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca ccatctctgt caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca ccatctctgt

34803480

ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga gccccaggag ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga gccccaggag

35403540

cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gggactatgg cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gggactatgg

36003600

catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg tgccccagtt catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg tgccccagtt

36603660

caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgtacagagg caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgtacagagg

37203720

ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tggaggacaa ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tggaggacaa

37803780

catcatggtg accttcagga accaggccag caggccctac agcttctaca gcagcctgat catcatggtg accttcagga accaggccag caggccctac agcttctaca gcagcctgat

38403840

cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg tgaagcccaa cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg tgaagcccaa

39003900

tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggatgagtt tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggatgagtt

39603960

tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg tgcactctgg tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg tgcactctgg

40204020

cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc atggcaggca cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc atggcaggca

40804080

ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca agagctggta ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca agagctggta

41404140

cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga tggaggaccc cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga tggaggaccc

42004200

caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg acaccctgcc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg acaccctgcc

42604260

tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca tgggcagcaa tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca tgggcagcaa

43204320

tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga agaaggagga tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga agaaggagga

43804380

gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agatgctgcc gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agatgctgcc

44404440

cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc atgctggcat cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc atgctggcat

45004500

gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggcctctgg gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggcctctgg

45604560

ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg cccccaagct ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg cccccaagct

46204620

ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc ccttcagctg ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc ccttcagctg

46804680

gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc agggggccag gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc aggggggccag

47404740

gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc tggatggcaa gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc tggatggcaa

48004800

gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct ttggcaatgt gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct ttggcaatgt

48604860

ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca gatacatcag ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca gatacatcag

49204920

gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga tgggctgtga gctgcacccc accactaca gcatcaggag caccctgagg atggagctga tgggctgtga

49804980

cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg atgcccagat cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg atgcccagat

50405040

cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca aggccaggct cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca aggccaggct

51005100

gcacctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggagtggct gcacctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggagtggct

51605160

gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg gggtgaagag gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg gggtgaagag

52205220

cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg atggccacca cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg atggccacca

52805280

gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc aggacagctt gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc aggacagctt

53405340

cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga ggattcaccc cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga ggattcaccc

54005400

ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg aggcccagga ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg aggcccagga

54605460

cctgtactga ttaattaaga gcatcttacc gccatttatt cccatatttg ttctgttttt cctgtactga ttaattaaga gcatcttacc gccatttatt cccatatttg ttctgttttt

55205520

cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa tcatttacat cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa tcatttacat

55805580

ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tgttaagaaa ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tgttaagaaa

56405640

ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa aatttgtgaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa aatttgtgaa

57005700

agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata tgctgcttta agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata tgctgcttta

57605760

tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc cttgtataaa tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc cttgtataaa

58205820

tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg tggcgtggtg tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg tggcgtggtg

58805880

tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac ctgtcaactc tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac ctgtcaactc

59405940

ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat cgccgcctgc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat cgccgcctgc

60006000

cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt ggtgttgtct cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt ggtgttgtct

60606060

ccataaagta ggaaacacta cacgattcca taaagtagga aacactacat cactccataa ccataaagta ggaaacacta cacgattcca taaagtagga aacactacat cactccataa

61206120

agtaggaaac actacatgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg agtaggaaac actacatgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg

61806180

tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa

62406240

ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca

63006300

gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg

63606360

ctctagatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca ctctagatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca

64206420

cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct

64806480

cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag

65406540

cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt accaagcttg tcgagaagta cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt accaagcttg tcgagaagta

66006600

ctagaggatc ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct ctagaggatc ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct

66606660

cccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt cccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt

67206720

tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc

67806780

atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt

68406840

ctggatctga tcactgatat cgcctaggag atccgaacca gataagtgaa atctagttcc ctggatctga tcactgatat cgcctaggag atccgaacca gataagtgaa atctagttcc

69006900

aaactatttt gtcattttta attttcgtat tagcttacga cgctacaccc agttcccatc aaactatttt gtcattttta attttcgtat tagcttacga cgctacaccc agttcccatc

69606960

tattttgtca ctcttcccta aataatcctt aaaaactcca tttccacccc tcccagttcc tattttgtca ctcttcccta aataatcctt aaaaactcca tttccacccc tcccagttcc

70207020

caactatttt gtccgcccac agcggggcat ttttcttcct gttatgtttt taatcaaaca caactatttt gtccgcccac agcggggcat ttttcttcct gttatgtttt taatcaaaca

70807080

tcctgccaac tccatgtgac aaaccgtcat cttcggctac tttttctctg tcacagaatg tcctgccaac tccatgtgac aaaccgtcat cttcggctac tttttctctg tcacagaatg

71407140

aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tgactgaata tcaacgctta aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tgactgaata tcaacgctta

72007200

tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg

72607260

tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg

73207320

ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg

73807380

ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt

74407440

agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt

75007500

tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta

75607560

tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa

76207620

atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt

76807680

caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac

77407740

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa

78007800

aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat

78607860

tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc

79207920

agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga

79807980

gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg

80408040

cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc

81008100

agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag

81608160

taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc

82208220

tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg

82808280

taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg

83408340

acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac

84008400

ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac

84608460

cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg

85208520

agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg

85808580

tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg

86408640

agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac

87008700

tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg

87608760

ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg

88208820

tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc

88808880

aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc

89408940

tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt

90009000

agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc

90609060

taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact

91209120

caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac

91809180

agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag

92409240

aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg

93009300

gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg

93609360

tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga

94209420

gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt

94809480

ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct

95409540

ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg

96009600

aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac

96609660

accgcagacc agccgcgtaa cctggcaaaa tcggttacgg ttgagtaata aatggatgcc accgcagacc agccgcgtaa cctggcaaaa tcggttacgg ttgagtaata aatggatgcc

97209720

ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact gaacaaaata gatctaaact ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact gaacaaaata gatctaaact

97809780

atgacaataa agtcttaaac tagacagaat agttgtaaac tgaaatcagt ccagttatgc atgacaataa agtcttaaac tagacagaat agttgtaaac tgaaatcagt ccagttatgc

98409840

tgtgaaaaag catactggac ttttgttatg gctaaagcaa actcttcatt ttctgaagtg tgtgaaaaag catactggac ttttgttatg gctaaagcaa actcttcatt ttctgaagtg

99009900

caaattgccc gtcgtattaa agaggggcgt ggccaagggc atggtaaaga ctatattcgc caaattgccc gtcgtattaa agaggggcgt ggccaagggc atggtaaaga ctatattcgc

99609960

ggcgttgtga caatttaccg aacaactccg cggccgggaa gccgatctcg gcttgaacga ggcgttgtga caatttaccg aacaactccg cggccgggaa gccgatctcg gcttgaacga

1002010020

attgttaggt ggcggtactt gggtcgatat caaagtgcat cacttcttcc cgtatgccca attgttaggt ggcggtactt gggtcgatat caaagtgcat cacttcttcc cgtatgccca

1008010080

actttgtata gagagccact gcgggatcgt caccgtaatc tgcttgcacg tagatcacat actttgtata gagagccact gcgggatcgt caccgtaatc tgcttgcacg tagatcacat

1014010140

aagcaccaag cgcgttggcc tcatgcttga ggagattgat gagcgcggtg gcaatgccct aagcaccaag cgcgttggcc tcatgcttga ggagattgat gagcgcggtg gcaatgccct

1020010200

gcctccggtg ctcgccggag actgcgagat catagatata gatctcacta cgcggctgct gcctccggtg ctcgccggag actgcgagat catagatata gatctcacta cgcggctgct

1026010260

caaacctggg cagaacgtaa gccgcgagag cgccaacaac cgcttcttgg tcgaaggcag caaacctggg cagaacgtaa gccgcgagag cgccaacaac cgcttcttgg tcgaaggcag

1032010320

caagcgcgat gaatgtctta ctacggagca agttcccgag gtaatcggag tccggctgat caagcgcgat gaatgtctta ctacggagca agttcccgag gtaatcggag tccggctgat

1038010380

gttgggagta ggtggctacg tctccgaact cacgaccgaa aagatcaaga gcagcccgca gttgggagta ggtggctacg tctccgaact cacgaccgaa aagatcaaga gcagcccgca

1044010440

tggatttgac ttggtcaggg ccgagcctac atgtgcgaat gatgcccata cttgagccac tggatttgac ttggtcaggg ccgagcctac atgtgcgaat gatgcccata cttgagccac

1050010500

ctaactttgt tttagggcga ctgccctgct gcgtaacatc gttgctgctg cgtaacatcg ctaactttgt tttagggcga ctgccctgct gcgtaacatc gttgctgctg cgtaacatcg

1056010560

ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc

1062010620

cgaggcatag actgtacaaa aaaacagtca taacaagcca tgaaaaccgc cactgcgccg cgaggcatag actgtacaaa aaaacagtca taacaagcca tgaaaaccgc cactgcgccg

1068010680

ttaccaccgc tgcgttcggt caaggttctg gaccagttgc gtgagcgcat acgctacttg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc gtgagcgcat acgctacttg

1074010740

cattacagtt tacgaaccga acaggcttat gtcaactggg ttcgtgcctt catccgtttc cattacagtt tacgaaccga acaggcttat gtcaactggg ttcgtgcctt catccgtttc

1080010800

cacggtgtgc gtcacccggc aaccttgggc agcagcgaag tcgaggcatt tctgtcctgg cacggtgtgc gtcacccggc aaccttgggc agcagcgaag tcgaggcatt tctgtcctgg

1086010860

ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc aggcattggc ggccttgctg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc aggcattggc ggccttgctg

1092010920

ttcttctacg gcaaggtgct gtgcacggat ctgccctggc ttcaggagat cggaagacct ttcttctacg gcaaggtgct gtgcacggat ctgccctggc ttcaggagat cggaagacct

1098010980

cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg aagtggttcg catcctcggt cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg aagtggttcg catcctcggt

1104011040

tttctggaag gcgagcatcg tttgttcgcc caggactcta gctatagttc tagtggttgg tttctggaag gcgagcatcg tttgttcgcc caggactcta gctatagttc tagtggttgg

1110011100

ctacgtatac tccggaatat taatagatca tggagataat taaaatgata accatctcgc ctacgtatac tccggaatat taatagatca tggagataat taaaatgata accatctcgc

1116011160

aaataaataa gtattttact gttttcgtaa cagttttgta ataaaaaaac ctataaatat aaataaataa gtattttact gttttcgtaa cagttttgta ataaaaaaac ctataaatat

1122011220

tccggattat tcataccgtc ccaccatcgg gcgcggatct cggtccgaaa ccatgtcgta tccggattat tcataccgtc cccacatcgg gcgcggatct cggtccgaaa ccatgtcgta

1128011280

ctaccatcac catcaccatc acgattacga tatcccaacg accgaaaacc tgtattttca ctaccatcac catcaccatc acgattacga tatcccaacg accgaaaacc tgtattttca

1134011340

gggcgccatg ggatcc gggcgccatg ggatcc

1135611356

<210> 214<210> 214

<211> 11434<211> 11434

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 214<400> 214

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240 240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300 300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360 360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420 420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480 480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540 540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600 600

ggtttaaacg ccgccaccat gcaaattgag ttaagtacct gttttttcct gtgcctgttg ggtttaaacg ccgccaccat gcaaattgag ttaagtacct gttttttcct gtgcctgttg

660 660

agattttgct tctctgctac cagaaggtat tacctgggag ctgtggagct gtcatgggac agattttgct tctctgctac cagaaggtat tacctgggag ctgtggagct gtcatgggac

720 720

tacatgcagt ctgacctggg agagctccct gttgatgcta ggtttccccc tagggtgcca tacatgcagt ctgacctggg agagctccct gttgatgcta ggtttccccc tagggtgcca

780 780

aagtcctttc cttttaacac ctcagtggtg tacaagaaga cactgtttgt ggagtttact aagtcctttc cttttaacac ctcagtggtg tacaagaaga cactgtttgt ggagtttact

840 840

gaccacctct tcaatattgc taagccaaga cccccttgga tgggtctctt gggccctacc gaccacctct tcaatattgc taagccaaga cccccttgga tgggtctctt gggccctacc

900 900

atccaggctg aggtttatga tacagtggtg attaccctca agaatatggc ttctcatcct atccaggctg aggtttatga tacagtggtg attaccctca agaatatggc ttctcatcct

960 960

gttagtctgc atgcagtagg ggtcagctat tggaaggcca gtgaaggagc tgagtatgat gttagtctgc atgcagtagg ggtcagctat tggaaggcca gtgaaggagc tgagtatgat

10201020

gaccagacca gccagagaga gaaagaggat gacaaggtgt tccctggggg atcacacacc gaccagacca gccagagaga gaaagaggat gacaaggtgt tccctggggg atcacacacc

10801080

tatgtgtggc aggtgttgaa ggaaaatgga cccatggcct ctgacccact ctgcctgact tatgtgtggc aggtgttgaa ggaaaatgga cccatggcct ctgacccact ctgcctgact

11401140

tactcctacc tgtctcatgt ggacctggtc aaagatctga actctggcct gattggggca tactcctacc tgtctcatgt ggacctggtc aaagatctga actctggcct gattggggca

12001200

ctgttggtgt gcagagaagg gtctcttgcc aaggagaaga ctcagaccct gcacaagttc ctgttggtgt gcagagaagg gtctcttgcc aaggagaaga ctcagaccct gcacaagttc

12601260

atcctgctgt ttgctgtgtt tgatgaaggc aagtcttggc attctgagac taagaacagc atcctgctgt ttgctgtgtt tgatgaaggc aagtcttggc attctgagac taagaacagc

13201320

ctgatgcaag atagagatgc tgcatctgcc agggcctggc ctaagatgca cactgtgaat ctgatgcaag atagagatgc tgcatctgcc agggcctggc ctaagatgca cactgtgaat

13801380

ggatatgtga ataggtcctt gcctggcctg attggatgcc ataggaagtc tgtgtactgg ggatatgtga ataggtcctt gcctggcctg attggatgcc ataggaagtc tgtgtactgg

14401440

catgtgattg gcatgggcac cacccctgag gttcactcta tttttctgga gggccatact catgtgattg gcatgggcac cacccctgag gttcactcta tttttctgga gggccatact

15001500

ttccttgtga ggaatcatag acaggcctct ctggagatta gccctattac atttctgact ttccttgtga ggaatcatag acaggcctct ctggagatta gccctattac atttctgact

15601560

gctcagaccc tcctcatgga cttggggcag tttctgttaa gctgccacat cagcagccat gctcagaccc tcctcatgga cttggggcag tttctgttaa gctgccacat cagcagccat

16201620

caacatgatg gtatggaagc ctatgtcaaa gtggatagct gccctgaaga accacagctt caacatgatg gtatggaagc ctatgtcaaa gtggatagct gccctgaaga accacagctt

16801680

aggatgaaga acaatgagga ggcagaggac tatgatgatg atctgactga ttctgaaatg aggatgaaga acaatgagga ggcagaggac tatgatgatg atctgactga ttctgaaatg

17401740

gatgtggtga gatttgatga tgataatagc ccttccttta tccagatcag gtcagtggcc gatgtggtga gatttgatga tgataatagc ccttccttta tccagatcag gtcagtggcc

18001800

aagaagcacc caaagacctg ggtgcattat attgctgctg aggaggagga ctgggactat aagaagcacc caaagacctg ggtgcattat attgctgctg aggagggagga ctgggactat

18601860

gcccctctgg tgctggcccc tgatgataga agctataagt ctcaatactt gaataatggc gcccctctgg tgctggcccc tgatgataga agctataagt ctcaatactt gaataatggc

19201920

ccacagagga ttgggagaaa gtacaaaaag gtgagattta tggcctacac tgatgagact ccacagagga ttgggagaaa gtacaaaaag gtgagattta tggcctacac tgatgagact

19801980

ttcaagacca gagaggccat ccagcatgaa tcaggcattt tgggtcccct gctgtatgga ttcaagacca gagaggccat ccagcatgaa tcaggcattt tgggtcccct gctgtatgga

20402040

gaggtggggg ataccctgct gatcatcttt aagaaccagg ccagcagacc ttacaacatt gaggtggggg ataccctgct gatcatcttt aagaaccagg ccagcagacc ttacaacatt

21002100

taccctcatg ggatcacaga tgtgaggcca ctctactcta ggagattgcc caagggagtc taccctcatg ggatcacaga tgtgaggcca ctctactcta ggagattgcc caagggagtc

21602160

aagcatctta aggactttcc aatcctgcct ggggagatct tcaagtacaa atggacagtg aagcatctta aggactttcc aatcctgcct ggggagatct tcaagtacaa atggacagtg

22202220

acagttgagg atggacctac taagagtgac cccaggtgtc tgaccagata ttactctagc acagttgagg atggacctac taagagtgac cccaggtgtc tgaccagata ttactctagc

22802280

tttgtcaata tggaaagaga cctggcttca ggcttgatag gccctcttct catctgctac tttgtcaata tggaaagaga cctggcttca ggcttgatag gccctcttct catctgctac

23402340

aaagagtctg tggaccagag aggaaatcag attatgtctg acaagagaaa tgttattctg aaagagtctg tggaccagag aggaaatcag attatgtctg acaagagaaa tgttattctg

24002400

ttttcagtct ttgatgagaa cagaagttgg tacttgacag agaacattca gagatttctg ttttcagtct ttgatgagaa cagaagttgg tacttgacag agaacattca gagatttctg

24602460

cctaaccctg caggagtgca gcttgaggac cctgagtttc aggcttccaa tatcatgcat cctaaccctg caggagtgca gcttgaggac cctgagtttc aggcttccaa tatcatgcat

25202520

tctatcaatg gctatgtgtt tgatagcctg cagctgtctg tgtgcctgca tgaggttgcc tctatcaatg gctatgtgtt tgatagcctg cagctgtctg tgtgcctgca tgaggttgcc

25802580

tattggtaca tcctgtctat tggggcccaa actgatttct tgtctgtgtt tttcagtgga tattggtaca tcctgtctat tggggcccaa actgatttct tgtctgtgtt tttcagtgga

26402640

tataccttta agcataagat ggtgtatgaa gataccttga cacttttccc tttctcagga tataccttta agcataagat ggtgtatgaa gataccttga cacttttccc tttctcagga

27002700

gagactgtct tcatgtctat ggagaaccct ggactgtgga tcctgggatg ccacaactca gagactgtct tcatgtctat ggagaaccct ggactgtgga tcctgggatg ccacaactca

27602760

gacttcagaa acaggggtat gacagctctg cttaaggtct cctcatgtga caaaaataca gacttcagaa acaggggtat gacagctctg cttaaggtct cctcatgtga caaaaataca

28202820

ggagactact atgaagattc ctatgaggac atctctgctt acctgctcag caaaaacaat ggagactact atgaagattc ctatgaggac atctctgctt acctgctcag caaaaacaat

28802880

gccattgagc ccagaagctt cagccagaat tccagacatc ccagtactag gcagaagcag gccattgagc ccagaagctt cagccagaat tccagacatc ccagtactag gcagaagcag

29402940

tttaatgcca ccaccatccc agaaaatgac attgagaaga cagacccttg gtttgcccat tttaatgcca caccatccc agaaaatgac attgagaaga cagacccttg gtttgcccat

30003000

agaaccccaa tgcccaagat tcagaatgtg agcagctcag acttgctgat gctgctgagg agaaccccaa tgcccaagat tcagaatgtg agcagctcag acttgctgat gctgctgagg

30603060

cagtctccta ctccccatgg cctgtccctc tcagatctgc aggaagccaa gtatgagaca cagtctccta ctccccatgg cctgtccctc tcagatctgc aggaagccaa gtatgagaca

31203120

ttttctgatg acccctcccc aggggctatt gacagtaaca acagcctgtc tgaaatgacc ttttctgatg acccctcccc aggggctatt gacagtaaca acagcctgtc tgaaatgacc

31803180

cacttcagac ctcagctcca ccacagtggg gatatggtgt ttaccccaga gtcaggcctg cacttcagac ctcagctcca ccacagtggg gatatggtgt ttaccccaga gtcaggcctg

32403240

cagctgagac tgaatgagaa gctgggaacc acagctgcca cagaactgaa gaagctggat cagctgagac tgaatgagaa gctgggaacc acagctgcca cagaactgaa gaagctggat

33003300

ttcaaggtga gctctacttc aaataatctg atttccacta tcccatctga caatttggca ttcaaggtga gctctacttc aaataatctg atttccacta tcccatctga caatttggca

33603360

gctggcactg acaatacaag ctctctgggc ccacctagca tgccagtgca ttatgacagc gctggcactg acaatacaag ctctctgggc ccacctagca tgccagtgca ttatgacagc

34203420

cagttggaca ccactctttt tggaaagaaa tccagtcccc tgacagagtc aggaggaccc cagttggaca ccactctttt tggaaagaaa tccagtcccc tgacagagtc aggaggaccc

34803480

ctttctctgt ctgaggagaa caatgatagt aagcttctgg agtcaggctt gatgaactcc ctttctctgt ctgaggagaa caatgatagt aagcttctgg agtcaggctt gatgaactcc

35403540

caggagagtt cttggggcaa gaatgtgagc tctagggaga tcaccagaac cactctgcag caggagagtt cttggggcaa gaatgtgagc tctagggaga tcaccagaac cactctgcag

36003600

tctgaccaag aagagattga ttatgatgac actatctctg ttgagatgaa gaaggaggac tctgaccaag aagagattga ttatgatgac actatctctg ttgagatgaa gaaggaggac

36603660

tttgatatct atgatgagga tgagaaccag tctccaagaa gtttccagaa gaagaccagg tttgatatct atgatgagga tgagaaccag tctccaagaa gtttccagaa gaagaccagg

37203720

cactacttta ttgctgctgt ggagagactg tgggactatg gaatgtcctc ctcccctcat cactacttta ttgctgctgt ggagagactg tgggactatg gaatgtcctc ctcccctcat

37803780

gtcctgagaa atagagctca gtcaggatca gtgccccagt tcaagaaggt ggtgttccag gtcctgagaa atagagctca gtcaggatca gtgccccagt tcaagaaggt ggtgttccag

38403840

gaattcacag atggaagttt tacccagcca ctgtatagag gtgaactgaa tgaacatctg gaattcacag atggaagttt tacccagcca ctgtatagag gtgaactgaa tgaacatctg

39003900

ggtctgctgg ggccctatat cagggctgag gtggaggaca atattatggt gacctttaga ggtctgctgg ggccctatat cagggctgag gtggaggaca atattatggt gacctttaga

39603960

aaccaggcct caaggcccta cagcttctac tcttccctca tttcatatga ggaagaccag aaccaggcct caaggcccta cagcttctac tcttccctca tttcatatga ggaagaccag

40204020

agacagggag cagagcctag aaagaacttt gtcaagccca atgaaaccaa aacctatttc agacagggag cagagcctag aaagaacttt gtcaagccca atgaaaccaa aacctatttc

40804080

tggaaggtgc agcaccacat ggcacccacc aaagatgagt ttgactgcaa agcctgggcc tggaaggtgc agcaccacat ggcacccacc aaagatgagt ttgactgcaa agcctgggcc

41404140

tatttctcag atgtggatct ggagaaggat gtccattcag gtctgattgg accactcctg tatttctcag atgtggatct ggagaaggat gtccattcag gtctgattgg accactcctg

42004200

gtgtgccaca ccaacacact gaatccagct catggcagac aggtgacagt ccaggagttt gtgtgccaca ccaacacact gaatccagct catggcagac aggtgacagt ccaggagttt

42604260

gccctgtttt tcactatttt tgatgagacc aagagctggt attttacaga gaatatggaa gccctgtttt tcactatttt tgatgagacc aagagctggt attttacaga gaatatggaa

43204320

agaaactgca gagccccttg taatatccag atggaggacc caacctttaa ggagaactac agaaactgca gagccccttg taatatccag atggaggacc caacctttaa ggagaactac

43804380

aggttccatg ccatcaatgg ctacattatg gataccctgc ctggcctggt tatggcccag aggttccatg ccatcaatgg ctacattatg gataccctgc ctggcctggt tatggcccag

44404440

gatcagagga tcaggtggta tctgctgtca atgggctcca atgagaacat tcatagtatt gatcagagga tcaggtggta tctgctgtca atgggctcca atgagaacat tcatagtatt

45004500

cacttttcag gacatgtgtt cacagtgaga aagaaggagg agtataagat ggccctctat cacttttcag gacatgtgtt cacagtgaga aagaaggagg agtataagat ggccctctat

45604560

aatctctacc caggggtgtt tgagacagtt gagatgctgc catctaaggc aggcatctgg aatctctacc caggggtgtt tgagacagtt gagatgctgc catctaaggc aggcatctgg

46204620

agagtggaat gcctcattgg agagcacctg catgctggca tgtccaccct gtttctggtg agagtggaat gcctcattgg agagcacctg catgctggca tgtccaccct gtttctggtg

46804680

tactccaaca aatgtcagac ccctcttggt atggcctctg gccacattag ggatttccag tactccaaca aatgtcagac ccctcttggt atggcctctg gccacattag ggatttccag

47404740

attactgcca gtggtcagta tgggcagtgg gcccctaagc tggccagact gcactattct attactgcca gtggtcagta tgggcagtgg gcccctaagc tggccagact gcactattct

48004800

gggagcatca atgcctggtc caccaaggaa cctttttctt ggattaaagt ggatctgctg gggagcatca atgcctggtc caccaaggaa cctttttctt ggattaaagt ggatctgctg

48604860

gccccaatga tcatccatgg gatcaagacc cagggagcta ggcagaagtt cagcagcctg gccccaatga tcatccatgg gatcaagacc cagggagcta ggcagaagtt cagcagcctg

49204920

tacattagtc agttcatcat tatgtacagt ctggatggca aaaagtggca gacatacagg tacattagtc agttcatcat tatgtacagt ctggatggca aaaagtggca gacatacagg

49804980

ggcaattcca ctggaaccct gatggtgttc tttggaaatg tggatagcag tggtatcaag ggcaattcca ctggaaccct gatggtgttc tttggaaatg tggatagcag tggtatcaag

50405040

cacaacattt tcaaccctcc catcattgcc aggtacatca gactgcatcc aacccactac cacaacattt tcaaccctcc catcattgcc aggtacatca gactgcatcc aacccactac

51005100

agcattagga gcacccttag gatggagctc atggggtgtg acctgaactc ttgctctatg agcattagga gcacccttag gatggagctc atggggtgtg acctgaactc ttgctctatg

51605160

ccacttggaa tggagagcaa ggccatctct gatgcccaga ttactgctag ttcctacttc ccacttggaa tggagagcaa ggccatctct gatgcccaga ttactgctag ttcctacttc

52205220

accaatatgt ttgccacctg gtcacccagc aaggccaggc tgcacctgca gggaaggtcc accaatatgt ttgccacctg gtcacccagc aaggccaggc tgcacctgca gggaaggtcc

52805280

aatgcttgga ggcctcaggt gaacaatcca aaggagtggc tgcaggtgga cttccagaag aatgcttgga ggcctcaggt gaacaatcca aaggagtggc tgcaggtgga cttccagaag

53405340

actatgaagg tgacaggagt gaccactcag ggagtgaaga gcctgctgac ctccatgtat actatgaagg tgacaggagt gaccactcag ggagtgaaga gcctgctgac ctccatgtat

54005400

gtgaaggagt ttctgatctc cagctcccag gatggccacc agtggaccct gttctttcag gtgaaggagt ttctgatctc cagctcccag gatggccacc agtggaccct gttctttcag

54605460

aatggcaagg tgaaggtgtt tcaggggaat caggactcct tcaccccagt ggtgaattcc aatggcaagg tgaaggtgtt tcaggggaat caggactcct tcaccccagt ggtgaattcc

55205520

ctggatcccc ctctgctgac cagatacctg agaatccacc cccagtcttg ggtgcaccag ctggatcccc ctctgctgac cagatacctg agaatccacc cccagtcttg ggtgcaccag

55805580

attgccctta ggatggaggt gctgggctgt gaggcccagg acctgtactg attaattaag attgccctta ggatggaggt gctgggctgt gaggcccagg acctgtactg attaattaag

56405640

agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt

57005700

taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta

57605760

ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct

58205820

ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta

58805880

actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta

59405940

ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt

60006000

tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg

60606060

caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt

61206120

tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag

61806180

gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc

62406240

catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg

63006300

tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc

63606360

tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg

64206420

ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag tagcatggcg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag tagcatggcg

64806480

ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg ccactccctc ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg ccactccctc

65406540

tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg

66006600

cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg catgcggtac cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg catgcggtac

66606660

caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt

67206720

acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat

67806780

tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac

68406840

aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat

69006900

caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccgaaccaga caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccgaaccaga

69606960

taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg

70207020

ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt

70807080

tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt ttcttcctgt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt ttcttcctgt

71407140

tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct tcggctactt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct tcggctactt

72007200

tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tttgtaattg tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tttgtaattg

72607260

actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tgtagcggcg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tgtagcggcg

73207320

cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc

73807380

tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc

74407440

gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg

75007500

accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg

75607560

tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg tttttcgccc tttgacgttg gagtccaacgt tctttaatag tggactcttg ttccaaactg

76207620

gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt

76807680

cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa

77407740

tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt

78007800

gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa

78607860

tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta

79207920

ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag

79807980

taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca

80408040

gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta

81008100

aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc

81608160

gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc

82208220

ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca

82808280

ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc

83408340

acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca

84008400

taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac

84608460

tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg

85208520

cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg

85808580

ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg

86408640

gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac

87008700

gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc

87608760

aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct

88208820

aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc

88808880

actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc

89408940

gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg

90009000

atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa

90609060

atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc

91209120

ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt

91809180

gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa

92409240

cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc

93009300

tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc

93609360

cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct

94209420

ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat

94809480

gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc

95409540

tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg

96009600

ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc

96609660

gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc

97209720

atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ggttacggtt atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ggttacggtt

97809780

gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt cttaaactga gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt cttaaactga

98409840

acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag ttgtaaactg acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag ttgtaaactg

99009900

aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc taaagcaaac aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc taaagcaaac

99609960

tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg ccaagggcat tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg ccaagggcat

1002010020

ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg gccgggaagc ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg gccgggaagc

1008010080

cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca aagtgcatca cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca aagtgcatca

1014010140

cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca ccgtaatctg cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca ccgtaatctg

1020010200

cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg agattgatga cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg agattgatga

1026010260

gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca tagatataga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca tagatataga

1032010320

tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg ccaacaaccg tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg ccaacaaccg

1038010380

cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ttcccgaggt cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ttcccgaggt

1044010440

aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca cgaccgaaaa aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca cgaccgaaaa

1050010500

gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat gtgcgaatga gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat gtgcgaatga

1056010560

tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtaacatcgt tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtaacatcgt

1062010620

tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac ggcgtaacgc tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac ggcgtaacgc

1068010680

gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata acaagccatg gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata acaagccatg

1074010740

aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt

1080010800

gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt caactgggtt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt caactgggtt

1086010860

cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc

1092010920

gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag

1098010980

gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt

1104011040

caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa

1110011100

gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca ggactctagc gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca ggactctagc

1116011160

tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg gagataatta tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg gagataatta

1122011220

aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gttttgtaat aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gttttgtaat

1128011280

aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gcggatctcg aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gcggatctcg

1134011340

gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata tcccaacgac gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata tcccaacgac

1140011400

cgaaaacctg tattttcagg gcgccatggg atcc cgaaaacctg tattttcagg gcgccatggg atcc

1143411434

<210> 215<210> 215

<211> 13477<211> 13477

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 215<400> 215

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60 60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120 120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180 180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240 240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300 300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360 360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420 420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480 480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540 540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600 600

ggtttaaacg ccgccaccat gcaaatagag ctctccacct gcttctttct gtgccttttg ggtttaaacg ccgccaccat gcaaatatagg ctctccacct gcttctttct gtgccttttg

660 660

cgattctgct ttagtgccac cagaagatac tacctgggtg cagtggaact gtcatgggac cgattctgct ttagtgccac cagaagatac tacctgggtg cagtggaact gtcatgggac

720 720

tatatgcaaa gtgatctcgg tgagctgcct gtggacgcaa gatttcctcc tagagtgcca tatatgcaaa gtgatctcgg tgagctgcct gtggacgcaa gatttcctcc tagagtgcca

780 780

aaatcttttc cattcaacac ctcagtcgtg tacaaaaaga ctctgtttgt agaattcacg aaatcttttc cattcaacac ctcagtcgtg tacaaaaaga ctctgtttgt agaattcacg

840 840

gatcaccttt tcaacatcgc taagccaagg ccaccctgga tgggtctgct aggtcctacc gatcaccttt tcaacatcgc taagccaagg ccaccctgga tgggtctgct aggtcctacc

900 900

atccaggctg aggtttatga tacagtggtc attacactta agaacatggc ttcccatcct atccaggctg aggtttatga tacagtggtc attacactta agaacatggc ttcccatcct

960 960

gtcagtcttc atgctgttgg tgtatcctac tggaaagctt ctgagggagc tgaatatgat gtcagtcttc atgctgttgg tgtatcctac tggaaagctt ctgagggagc tgaatatgat

10201020

gatcagacca gtcaaaggga gaaagaagat gataaagtct tccctggtgg aagccataca gatcagacca gtcaaaggga gaaagaagat gataaagtct tccctggtgg aagccataca

10801080

tatgtctggc aggtcctgaa agagaatggt ccaatggcct ctgacccact gtgccttacc tatgtctggc aggtcctgaa agagaatggt ccaatggcct ctgacccact gtgccttacc

11401140

tactcatatc tttctcatgt ggacctggta aaagacttga attcaggcct cattggagcc tactcatatc tttctcatgt ggacctggta aaagacttga attcaggcct cattggagcc

12001200

ctactagtat gtagagaagg gagtctggcc aaggaaaaga cacagacctt gcacaaattt ctactagtat gtagagaagg gagtctggcc aaggaaaaga cacagacctt gcacaaattt

12601260

atactacttt ttgctgtatt tgatgaaggg aaaagttggc actcagaaac aaagaactcc atactacttt ttgctgtatt tgatgaaggg aaaagttggc actcagaaac aaagaactcc

13201320

ttgatgcagg atagggatgc tgcatctgct cgggcctggc ctaaaatgca cacagtcaat ttgatgcagg atagggatgc tgcatctgct cgggcctggc ctaaaatgca cacagtcaat

13801380

ggttatgtaa acaggtctct gccaggtctg attggatgcc acaggaaatc agtctattgg ggttatgtaa acaggtctct gccaggtctg attggatgcc acaggaaatc agtctattgg

14401440

catgtgattg gaatgggcac cactcctgaa gtgcactcaa tattcctcga aggtcacaca catgtgattg gaatgggcac cactcctgaa gtgcactcaa tattcctcga aggtcacaca

15001500

tttcttgtga ggaaccatcg ccaggcgtcc ttggaaatct cgccaataac tttccttact tttcttgtga ggaaccatcg ccaggcgtcc ttggaaatct cgccaataac tttccttact

15601560

gctcaaacac tcttgatgga ccttggacag tttctactgt tttgtcatat ctcttcccac gctcaaacac tcttgatgga ccttggacag tttctactgt tttgtcatat ctcttcccac

16201620

caacatgatg gcatggaagc ttatgtcaaa gtagacagct gtccagagga accccaacta caacatgatg gcatggaagc ttatgtcaaa gtagacagct gtccagagga accccaacta

16801680

cgaatgaaaa ataatgaaga agcggaagac tatgatgatg atcttactga ttctgaaatg cgaatgaaaa ataatgaaga agcggaagac tatgatgatg atcttactga ttctgaaatg

17401740

gatgtggtca ggtttgatga tgacaactct ccttccttta tccaaattcg ctcagttgcc gatgtggtca ggtttgatga tgacaactct ccttccttta tccaaattcg ctcagttgcc

18001800

aagaagcatc ctaaaacttg ggtacattac attgctgctg aagaggagga ctgggactat aagaagcatc ctaaaacttg ggtacattac attgctgctg aagaggagga ctgggactat

18601860

gctcccttag tcctcgcccc cgatgacaga agttataaaa gtcaatattt gaacaatggc gctcccttag tcctcgcccc cgatgacaga agttataaaa gtcaatattt gaacaatggc

19201920

cctcagcgga ttggtaggaa gtacaaaaaa gtccgattta tggcatacac agatgaaacc cctcagcgga ttggtaggaa gtacaaaaaa gtccgattta tggcatacac agatgaaacc

19801980

tttaagactc gtgaagctat tcagcatgaa tcaggaatct tgggaccttt actttatggg tttaagactc gtgaagctat tcagcatgaa tcaggaatct tgggaccttt actttatggg

20402040

gaagttggag acacactgtt gattatattt aagaatcaag caagcagacc atataacatc gaagttggag acacactgtt gattatattt aagaatcaag caagcagacc atataacatc

21002100

taccctcacg gaatcactga tgtccgtcct ttgtattcaa ggagattacc aaaaggtgta taccctcacg gaatcactga tgtccgtcct ttgtattcaa ggagattacc aaaaggtgta

21602160

aaacatttga aggattttcc aattctgcca ggagaaatat tcaaatataa atggacagtg aaacatttga aggattttcc aattctgcca ggagaaatat tcaaatataa atggacagtg

22202220

actgtagaag atgggccaac taaatcagat cctcggtgcc tgacccgcta ttactctagt actgtagaag atgggccaac taaatcagat cctcggtgcc tgacccgcta ttactctagt

22802280

ttcgttaata tggagagaga tctagcttca ggactcattg gccctctcct catctgctac ttcgttaata tggagagaga tctagcttca ggactcattg gccctctcct catctgctac

23402340

aaagaatctg tagatcaaag aggaaaccag ataatgtcag acaagaggaa tgtcatcctg aaagaatctg tagatcaaag aggaaaccag ataatgtcag acaagaggaa tgtcatcctg

24002400

ttttctgtat ttgatgagaa ccgaagctgg tacctcacag agaatataca acgctttctc ttttctgtat ttgatgagaa ccgaagctgg tacctcacag agaatataca acgctttctc

24602460

cccaatccag ctggagtgca gcttgaggat ccagagttcc aagcctccaa catcatgcac cccaatccag ctggagtgca gcttgaggat cccagttcc aagcctccaa catcatgcac

25202520

agcatcaatg gctatgtttt tgatagtttg cagttgtcag tttgtttgca tgaggtggca agcatcaatg gctatgtttt tgatagtttg cagttgtcag tttgtttgca tgaggtggca

25802580

tactggtaca ttctaagcat tggagcacag actgacttcc tttctgtctt cttctctgga tactggtaca ttctaagcat tggagcacag actgacttcc tttctgtctt cttctctgga

26402640

tataccttca aacacaaaat ggtctatgaa gacacactca ccctattccc attctcagga tataccttca aacacaaaat ggtctatgaa gacacactca ccctattccc attctcagga

27002700

gaaactgtct tcatgtcgat ggaaaaccca ggtctatgga ttctggggtg ccacaactca gaaactgtct tcatgtcgat ggaaaaccca ggtctatgga ttctggggtg ccacaactca

27602760

gactttcgga acagaggcat gaccgcctta ctgaaggttt ctagttgtga caagaacact gactttcgga acagaggcat gaccgcctta ctgaaggttt ctagttgtga caagaacact

28202820

ggtgattatt acgaggacag ttatgaagat atttcagcat acttgctgag taaaaacaat ggtgattatt acgaggacag ttatgaagat atttcagcat acttgctgag taaaaacaat

28802880

gccattgaac caagaagctt ctcccagaat tcaagacacc ctagcactag gcaaaagcaa gccattgaac caagaagctt ctcccagaat tcaagacacc ctagcactag gcaaaagcaa

29402940

tttaatgcca ccacaattcc agaaaatgac atagagaaga ctgacccttg gtttgcacac tttaatgcca ccacaattcc agaaaatgac atagagaaga ctgacccttg gtttgcacac

30003000

agaacaccta tgcctaaaat acaaaatgtc tcctctagtg atttgttgat gctcttgcga agaacaccta tgcctaaaat acaaaatgtc tcctctagtg atttgttgat gctcttgcga

30603060

cagagtccta ctccacatgg gctatcctta tctgatctcc aagaagccaa atatgagact cagagtccta ctccacatgg gctatcctta tctgatctcc aagaagccaa atatgagact

31203120

ttttctgatg atccatcacc tggagcaata gacagtaata acagcctgtc tgaaatgaca ttttctgatg atccatcacc tggagcaata gacagtaata acagcctgtc tgaaatgaca

31803180

cacttcaggc cacagctcca tcacagtggg gacatggtat ttacccctga gtcaggcctc cacttcaggc cacagctcca tcacagtggg gacatggtat ttacccctga gtcaggcctc

32403240

caattaagat taaatgagaa actggggaca actgcagcaa cagagttgaa gaaacttgat caattaagat taaatgagaa actggggaca actgcagcaa cagagttgaa gaaacttgat

33003300

ttcaaagttt ctagtacatc aaataatctg atttcaacaa ttccatcaga caatttggca ttcaaagttt ctagtacatc aaataatctg atttcaacaa ttccatcaga caatttggca

33603360

gcaggtactg ataatacaag ttccttagga cccccaagta tgccagttca ttatgatagt gcaggtactg aatacaag ttccttagga cccccaagta tgccagttca ttatgatagt

34203420

caattagata ccactctatt tggcaaaaag tcatctcccc ttactgagtc tggtggacct caattagata ccactctatt tggcaaaaag tcatctcccc ttactgagtc tggtggacct

34803480

ctgagcttga gtgaagaaaa taatgattca aagttgttag aatcaggttt aatgaatagc ctgagcttga gtgaagaaaa taatgattca aagttgttag aatcaggttt aatgaatagc

35403540

caagaaagtt catggggaaa aaatgtatcg tcaacagaga gtggtaggtt atttaaaggg caagaaagtt catggggaaa aaatgtatcg tcaacagaga gtggtaggtt atttaaaggg

36003600

aaaagagctc atggacctgc tttgttgact aaagataatg ccttattcaa agttagcatc aaaagagctc atggacctgc tttgttgact aaagataatg ccttattcaa agttagcatc

36603660

tctttgttaa agacaaacaa aacttccaat aattcagcaa ctaatagaaa gactcacatt tctttgttaa agacaaacaa aacttccaat aattcagcaa ctaatagaaa gactcacatt

37203720

gatggcccat cattattaat tgagaatagt ccatcagtct ggcaaaatat attagaaagt gatggcccat cattattaat tgagaatagt ccatcagtct ggcaaaatat attagaaagt

37803780

gacactgagt ttaaaaaagt gacacctttg attcatgaca gaatgcttat ggacaaaaat gacactgagt ttaaaaaagt gacacctttg attcatgaca gaatgcttat ggacaaaaat

38403840

gctacagctt tgaggctaaa tcatatgtca aataaaacta cttcatcaaa aaacatggaa gctacagctt tgaggctaaa tcatatgtca aataaaacta cttcatcaaa aaacatggaa

39003900

atggtccaac agaaaaaaga gggccccatt ccaccagatg cacaaaatcc agatatgtcg atggtccaac agaaaaaaga gggccccatt ccaccagatg cacaaaatcc agatatgtcg

39603960

ttctttaaga tgctattctt gccagaatca gcaaggtgga tacaaaggac tcatggaaag ttctttaaga tgctattctt gccagaatca gcaaggtgga tacaaaggac tcatggaaag

40204020

aactctctga actctgggca aggccccagt ccaaagcaat tagtatcctt aggaccagaa aactctctga actctgggca aggccccagt ccaaagcaat tagtatcctt aggaccagaa

40804080

aaatctgtgg aaggtcagaa tttcttgtct gagaaaaaca aagtggtagt aggaaagggt aaatctgtgg aaggtcagaa tttcttgtct gagaaaaaca aagtggtagt aggaaagggt

41404140

gaatttacaa aggacgtagg actcaaagag atggtttttc caagcagcag aaacctattt gaatttacaa aggacgtagg actcaaagag atggtttttc caagcagcag aaacctattt

42004200

cttactaact tggataattt acatgaaaat aatacacaca atcaagaaaa aaaaattcag cttactaact tggataattt acatgaaaat aatacacaca atcaagaaaa aaaaattcag

42604260

gaagaaatag aaaagaagga aacattaatc caagagaatg tagttttgcc tcagatacat gaagaaatag aaaagaagga aacattaatc caagagaatg tagttttgcc tcagatacat

43204320

acagtgactg gcactaagaa tttcatgaag aaccttttct tactgagcac taggcaaaat acagtgactg gcactaagaa tttcatgaag aaccttttct tactgagcac taggcaaaat

43804380

gtagaaggtt catatgacgg ggcatatgct ccagtacttc aagattttag gtcattaaat gtagaaggtt catatgacgg ggcatatgct ccagtacttc aagattttag gtcattaaat

44404440

gattcaacaa atagaacaaa gaaacacaca gctcatttct caaaaaaagg ggaggaagaa gattcaacaa atagaacaaa gaaacacaca gctcatttct caaaaaaagg ggaggaagaa

45004500

aacttggaag gcttgggaaa tcaaaccaag caaattgtag agaaatatgc atgcaccaca aacttggaag gcttgggaaa tcaaaccaag caaattgtag agaaatatgc atgcaccaca

45604560

aggatatctc ctaatacaag ccagcagaat tttgtcacgc aacgtagtaa gagagctttg aggatatctc ctaatacaag ccagcagaat tttgtcacgc aacgtagtaa gagagctttg

46204620

aaacaattca gactcccact agaagaaaca gaacttgaaa aaaggataat tgtggatgac aaacaattca gactcccact agaagaaaca gaacttgaaa aaaggataat tgtggatgac

46804680

acctcaaccc agtggtccaa aaacatgaaa catttgaccc cgagcaccct cacacagata acctcaaccc agtggtccaa aaacatgaaa catttgaccc cgagcaccct cacacagata

47404740

gactacaatg agaaggagaa aggggccatt actcagtctc ccttatcaga ttgccttacg gactacaatg agaaggagaa aggggccatt actcagtctc ccttatcaga ttgccttacg

48004800

aggagtcata gcatccctca agcaaataga tctccattac ccattgcaaa ggtatcatca aggagtcata gcatccctca agcaaataga tctccattac ccattgcaaa ggtatcatca

48604860

tttccatcta ttagacctat atatctgacc agggtcctat tccaagacaa ctcttctcat tttccatcta ttagacctat atatctgacc agggtcctat tccaagacaa ctcttctcat

49204920

cttccagcag catcttatag aaagaaagat tctggggtcc aagaaagcag tcatttctta cttccagcag catcttatag aaagaaagat tctggggtcc aagaaagcag tcatttctta

49804980

caaggagcca aaaaaaataa cctttcttta gccattctaa ccttggagat gactggtgat caaggagcca aaaaaaataa cctttcttta gccattctaa ccttggagat gactggtgat

50405040

caaagagagg ttggctccct ggggacaagt gccacaaatt cagtcacata caagaaagtt caaagagagg ttggctccct ggggacaagt gccacaaatt cagtcacata caagaaagtt

51005100

gagaacactg ttctcccgaa accagacttg cccaaaacat ctggcaaagt tgaattgctt gagaacactg ttctcccgaa accagacttg cccaaaacat ctggcaaagt tgaattgctt

51605160

ccaaaagttc acatttatca gaaggaccta ttccctacgg aaactagcaa tgggtctcct ccaaaagttc acatttatca gaaggaccta ttccctacgg aaactagcaa tgggtctcct

52205220

ggccatctgg atctcgtgga agggagcctt cttcagggaa cagagggagc gattaagtgg ggccatctgg atctcgtgga agggagcctt cttcagggaa cagagggagc gattaagtgg

52805280

aatgaagcaa acagacctgg aaaagttccc tttctgagag tagcaacaga aagctctgca aatgaagcaa acagacctgg aaaagttccc tttctgagag tagcaacaga aagctctgca

53405340

aagactccct ccaagctatt ggatcctctt gcttgggata accactatgg tactcagata aagactccct ccaagctatt ggatcctctt gcttgggata accactatgg tactcagata

54005400

ccaaaagaag agtggaaatc ccaagagaag tcaccagaaa aaacagcttt taagaaaaag ccaaaagaag agtggaaatc ccaagagaag tcaccagaaa aaacagcttt taagaaaaag

54605460

gataccattt tgtccctgaa cgcttgtgaa agcaatcatg caatagcagc aataaatgag gataccattt tgtccctgaa cgcttgtgaa agcaatcatg caatagcagc aataaatgag

55205520

ggacaaaata agcccgaaat agaagtcacc tgggcaaagc aaggtaggac tgaaaggctg ggacaaaata agcccgaaat agaagtcacc tgggcaaagc aaggtaggac tgaaaggctg

55805580

tgctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt tgctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt

56405640

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa

57005700

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca

57605760

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca

58205820

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc

58805880

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat

59405940

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc

60006000

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat

60606060

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac

61206120

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg

61806180

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt

62406240

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa

63006300

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg

63606360

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat

64206420

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct

64806480

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct

65406540

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg

66006600

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt

66606660

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg

67206720

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt

67806780

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat

68406840

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg

69006900

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc

69606960

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat

70207020

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata

70807080

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat

71407140

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc

72007200

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac

72607260

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg

73207320

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag agtaatgcct ggagaacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag

73807380

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg

74407440

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt

75007500

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac

75607560

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac

76207620

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctgattaatt cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctgattaatt

76807680

aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac

77407740

atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa

78007800

ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac

78607860

gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc

79207920

ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag

79807980

ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc

80408040

ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg

81008100

acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg

81608160

ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga

82208220

caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc

82808280

agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca

83408340

ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta

84008400

ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc

84608460

atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg

85208520

gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc

85808580

ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg

86408640

cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcgcctcg aggcatgcgg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcgcctcg aggcatgcgg

87008700

taccaagctt gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt taccaagctt gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt

87608760

tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc

88208820

aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat

88808880

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact

89408940

catcaatgta tcttatcatg tctggatctg atcactgata tcgcctagga gatccgaacc catcaatgta tcttatcatg tctggatctg atcactgata tcgcctagga gatccgaacc

90009000

agataagtga aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg agataagtga aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg

90609060

acgctacacc cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc acgctacacc cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc

91209120

atttccaccc ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc atttccaccc ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc

91809180

tgttatgttt ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta tgttatgttt ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta

92409240

ctttttctct gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa ctttttctct gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa

93009300

ttgactgaat atcaacgctt atttgcagcc tgaatggcga atgggacgcg ccctgtagcg ttgactgaat atcaacgctt atttgcagcc tgaatggcga atgggacgcg ccctgtagcg

93609360

gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg

94209420

ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc

94809480

cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc

95409540

tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga

96009600

cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa

96609660

ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga

97209720

tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca

97809780

aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta

98409840

tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat

99009900

aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc

99609960

ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga

1002010020

aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca

1008010080

acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt

1014010140

ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg

1020010200

gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc

1026010260

atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata

1032010320

acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt acactgcggc caacttactt ctgacaacga tcggaggacc gaagggagcta accgcttttt

1038010380

tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag

1044010440

ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca

1050010500

aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg

1056010560

aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg

1062010620

ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag

1068010680

atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg

1074010740

aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag

1080010800

accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga

1086010860

tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt

1092010920

tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc

1098010980

tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc

1104011040

cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac

1110011100

caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac

1116011160

cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt

1122011220

cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct

1128011280

gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat

1134011340

acctacagcg tgagcattga gaaagcgcca cgcttcccga agggagaaag gcggacaggt acctacagcg tgagcattga gaaagcgcca cgcttcccga agggaaaag gcggacaggt

1140011400

atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg

1146011460

cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt

1152011520

gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt

1158011580

tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg

1164011640

tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg

1170011700

agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat tttctcctta agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat tttctcctta

1176011760

cgcatctgtg cggtatttca caccgcagac cagccgcgta acctggcaaa atcggttacg cgcatctgtg cggtatttca caccgcagac cagccgcgta acctggcaaa atcggttacg

1182011820

gttgagtaat aaatggatgc cctgcgtaag cgggtgtggg cggacaataa agtcttaaac gttgagtaat aaatggatgc cctgcgtaag cgggtgtggg cggacaataa agtcttaaac

1188011880

tgaacaaaat agatctaaac tatgacaata aagtcttaaa ctagacagaa tagttgtaaa tgaacaaaat agatctaaac tatgacaata aagtcttaaa ctagacagaa tagttgtaaa

1194011940

ctgaaatcag tccagttatg ctgtgaaaaa gcatactgga cttttgttat ggctaaagca ctgaaatcag tccagttatg ctgtgaaaaa gcatactgga cttttgttat ggctaaagca

1200012000

aactcttcat tttctgaagt gcaaattgcc cgtcgtatta aagaggggcg tggccaaggg aactcttcat tttctgaagt gcaaattgcc cgtcgtatta aagaggggcg tggccaaggg

1206012060

catggtaaag actatattcg cggcgttgtg acaatttacc gaacaactcc gcggccggga catggtaaag actatattcg cggcgttgtg acaatttacc gaacaactcc gcggccggga

1212012120

agccgatctc ggcttgaacg aattgttagg tggcggtact tgggtcgata tcaaagtgca agccgatctc ggcttgaacg aattgttagg tggcggtact tgggtcgata tcaaagtgca

1218012180

tcacttcttc ccgtatgccc aactttgtat agagagccac tgcgggatcg tcaccgtaat tcacttcttc ccgtatgccc aactttgtat agagagccac tgcgggatcg tcaccgtaat

1224012240

ctgcttgcac gtagatcaca taagcaccaa gcgcgttggc ctcatgcttg aggagattga ctgcttgcac gtagatcaca taagcaccaa gcgcgttggc ctcatgcttg aggagattga

1230012300

tgagcgcggt ggcaatgccc tgcctccggt gctcgccgga gactgcgaga tcatagatat tgagcgcggt ggcaatgccc tgcctccggt gctcgccgga gactgcgaga tcatagatat

1236012360

agatctcact acgcggctgc tcaaacctgg gcagaacgta agccgcgaga gcgccaacaa agatctcact acgcggctgc tcaaacctgg gcagaacgta agccgcgaga gcgccaacaa

1242012420

ccgcttcttg gtcgaaggca gcaagcgcga tgaatgtctt actacggagc aagttcccga ccgcttcttg gtcgaaggca gcaagcgcga tgaatgtctt actacggagc aagttcccga

1248012480

ggtaatcgga gtccggctga tgttgggagt aggtggctac gtctccgaac tcacgaccga ggtaatcgga gtccggctga tgttgggagt aggtggctac gtctccgaac tcacgaccga

1254012540

aaagatcaag agcagcccgc atggatttga cttggtcagg gccgagccta catgtgcgaa aaagatcaag agcagcccgc atggatttga cttggtcagg gccgagccta catgtgcgaa

1260012600

tgatgcccat acttgagcca cctaactttg ttttagggcg actgccctgc tgcgtaacat tgatgcccat acttgagcca cctaactttg ttttagggcg actgccctgc tgcgtaacat

1266012660

cgttgctgct gcgtaacatc gttgctgctc cataacatca aacatcgacc cacggcgtaa cgttgctgct gcgtaacatc gttgctgctc cataacatca aacatcgacc cacggcgtaa

1272012720

cgcgcttgct gcttggatgc ccgaggcata gactgtacaa aaaaacagtc ataacaagcc cgcgcttgct gcttggatgc ccgaggcata gactgtacaa aaaaacagtc ataacaagcc

1278012780

atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg tcaaggttct ggaccagttg atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg tcaaggttct ggaccagttg

1284012840

cgtgagcgca tacgctactt gcattacagt ttacgaaccg aacaggctta tgtcaactgg cgtgagcgca tacgctactt gcattacagt ttacgaaccg aacaggctta tgtcaactgg

1290012900

gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg caaccttggg cagcagcgaa gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg caaccttggg cagcagcgaa

1296012960

gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg tttcggtctc cacgcatcgt gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg tttcggtctc cacgcatcgt

1302013020

caggcattgg cggccttgct gttcttctac ggcaaggtgc tgtgcacgga tctgccctgg caggcattgg cggccttgct gttcttctac ggcaaggtgc tgtgcacgga tctgccctgg

1308013080

cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc cggtggtgct gaccccggat cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc cggtggtgct gaccccggat

1314013140

gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc gtttgttcgc ccaggactct gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc gtttgttcgc ccaggactct

1320013200

agctatagtt ctagtggttg gctacgtata ctccggaata ttaatagatc atggagataa agctatagtt ctagtggttg gctacgtata ctccggaata ttaatagatc atggagataa

1326013260

ttaaaatgat aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt ttaaaatgat aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt

1332013320

aataaaaaaa cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc aataaaaaaa cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc

1338013380

tcggtccgaa accatgtcgt actaccatca ccatcaccat cacgattacg atatcccaac tcggtccgaa accatgtcgt actaccatca ccatcaccat cacgattacg atatcccaac

1344013440

gaccgaaaac ctgtattttc agggcgccat gggatcc gaccgaaaac ctgtattttc agggcgccat gggatcc

1347713477

<210> 216<210> 216

<211> 11180<211> 11180

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 216<400> 216

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60 60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120 120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180 180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240 240

atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt

300 300

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt

360 360

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac

420 420

aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag

480 480

taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt

540 540

gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac

600 600

tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag

660 660

cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat

720 720

gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc

780 780

cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata

840 840

aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat

900 900

agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt

960 960

ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag

10201020

tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag

10801080

tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tcaataggga ctttccatg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa

11401140

tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag

12001200

catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag

12601260

aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa

13201320

ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata

13801380

tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg

14401440

gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa gtaagtcact gactgtctat gcctgggaaa gggtggggcag gagatggggc agtgcaggaa

15001500

aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct

15601560

cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaga tagaattatc cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaga tagaattatc

16201620

tacttgtttt tttctttgtc tgctcaggtt ctgcttctct gctacaagga ggtattactt tacttgtttt tttctttgtc tgctcaggtt ctgcttctct gctacaagga ggtattactt

16801680

aggtgctgta gagttatctt gggactacat gcagtctgat cttggggagc tccctgtgga aggtgctgta gagttatctt gggactacat gcagtctgat cttggggagc tccctgtgga

17401740

tgcaagattt ccccctagag tacctaaaag tttccctttc aacacaagtg tggtgtataa tgcaagattt ccccctagag tacctaaaag tttccctttc aacacaagtg tggtgtataa

18001800

gaagactctg tttgttgagt tcacagatca ccttttcaat attgccaagc ccagaccccc gaagactctg tttgttgagt tcacagatca ccttttcaat attgccaagc ccagaccccc

18601860

ctggatgggt ctactggggc caacaattca agcagaggta tatgatacag tggtgatcac ctggatgggt ctactggggc caacaattca agcagaggta tatgatacag tggtgatcac

19201920

attaaagaac atggcatccc accctgtaag cctgcatgct gttggtgtgt cctattggaa attaaagaac atggcatccc accctgtaag cctgcatgct gttggtgtgt cctattggaa

19801980

agcaagtgaa ggtgctgaat atgatgatca aacatcccaa agagagaagg aagatgacaa agcaagtgaa ggtgctgaat atgatgatca aacatcccaa agagagaagg aagatgacaa

20402040

agtcttccca ggtggctctc acacctatgt gtggcaagtg ctcaaggaaa atgggcctat agtcttccca ggtggctctc acacctatgt gtggcaagtg ctcaaggaaa atgggcctat

21002100

ggctagtgat ccattgtgcc tcacatatag ctacctgtcc catgtggact tagttaaaga ggctagtgat ccattgtgcc tcacatatag ctacctgtcc catgtggact tagttaaaga

21602160

tctgaactca ggtctgattg gtgccctgct ggtctgtagg gaaggatcac tagctaaaga tctgaactca ggtctgattg gtgccctgct ggtctgtagg gaaggatcac tagctaaaga

22202220

aaaaacccag actttacaca agttcatctt attatttgct gtttttgatg agggaaagag aaaaacccag actttacaca agttcatctt attatttgct gtttttgatg agggaaagag

22802280

ctggcactca gagactaaga attcactcat gcaggataga gatgcagctt ctgctagagc ctggcactca gagactaaga attcactcat gcaggataga gatgcagctt ctgctagagc

23402340

atggccaaaa atgcatactg tgaatgggta tgttaacagg agtctgcctg gcctcatagg atggccaaaa atgcatactg tgaatgggta tgttaacagg agtctgcctg gcctcatagg

24002400

ctgccataga aaatcagtgt actggcatgt cataggtatg ggcactactc ctgaggtgca ctgccataga aaatcagtgt actggcatgt cataggtatg ggcactactc ctgaggtgca

24602460

ttccattttt ttggaggggc atactttcct tgtaagaaac cacaggcagg cttcattgga ttccatttt ttggaggggc atactttcct tgtaagaaac cacaggcagg cttcattgga

25202520

aattagtcca ataacctttc tcacagccca gactctgcta atggacttgg ggcagttttt aattagtcca ataacctttc tcacagccca gactctgcta atggacttgg ggcagttttt

25802580

attattttgt cacattagct ctcatcagca tgatggaatg gaagcctatg ttaaggttga attattttgt cacattagct ctcatcagca tgatggaatg gaagcctatg ttaaggttga

26402640

ttcctgccca gaagagcccc agttgagaat gaagaacaat gaggaagcag aagactatga ttcctgccca gaagagcccc agttgagaat gaagaacaat gaggaagcag aagactatga

27002700

tgatgatcta acagactcag aaatggatgt tgtgagattt gatgatgata actccccaag tgatgatcta acagactcag aaatggatgt tgtgagattt gatgatgata actccccaag

27602760

ttttattcag atcaggtcag tggccaagaa acatccaaaa acatgggttc attatattgc ttttattcag atcaggtcag tggccaagaa acatccaaaa acatgggttc attatattgc

28202820

agcagaagaa gaagactggg attatgcacc cttggtatta gcccctgatg acagaagcta agcagaagaa gaagactggg attatgcacc cttggtatta gcccctgatg acagaagcta

28802880

taagtcacaa tatctcaaca atggacccca gagaattggc agaaagtaca aaaaagtcag taagtcacaa tatctcaaca atggacccca gagaattggc agaaagtaca aaaaagtcag

29402940

gtttatggct tatactgatg agactttcaa aactagagag gctattcaac atgaatctgg gtttatggct tatactgatg agactttcaa aactagagag gctattcaac atgaatctgg

30003000

catcctaggt cctttgttat atggggaagt aggggacacc ttattaatta tatttaaaaa catcctaggt cctttgttat atggggaagt aggggacacc ttattaatta tatttaaaaa

30603060

ccaggccagt aggccttaca acatttaccc ccacggtata acagatgtca gaccactgta ccaggccagt aggccttaca acatttaccc ccacggtata acagatgtca gaccactgta

31203120

ctcaaggagg ctaccaaaag gggtgaagca cctaaaagac ttccccatcc tacctggtga ctcaaggagg ctaccaaaag gggtgaagca cctaaaagac ttccccatcc tacctggtga

31803180

gattttcaag tataagtgga cagtgactgt agaagatggt ccaaccaaat cagatcccag gattttcaag tataagtgga cagtgactgt agaagatggt ccaaccaaat cagatcccag

32403240

atgcctgaca aggtactaca gtagctttgt aaatatggag agagacctgg cctcagggtt atgcctgaca aggtactaca gtagctttgt aaatatggag agagacctgg cctcagggtt

33003300

aatagggccc ctactgatct gctacaagga gagtgtagac caaagaggca accaaattat aatagggccc ctactgatct gctacaagga gagtgtagac caaagaggca accaaattat

33603360

gtcagacaag agaaatgtca tcctctttag tgtttttgat gagaataggt cctggtacct gtcagacaag agaaatgtca tcctctttag tgtttttgat gagaataggt cctggtacct

34203420

gacagaaaat atccaaagat tccttccaaa tccagcaggg gtacaactgg aggaccctga gacagaaaat atccaaagat tccttccaaa tccagcaggg gtacaactgg aggaccctga

34803480

gttccaggcc tccaatatca tgcacagcat caatggttat gtgtttgaca gtttgcaact gttccaggcc tccaatatca tgcacagcat caatggttat gtgtttgaca gtttgcaact

35403540

ttcagtgtgc cttcatgagg ttgcatactg gtatatactt tctatagggg cccagacaga ttcagtgtgc cttcatgagg ttgcatactg gtatatactt tctatagggg cccagacaga

36003600

cttcttgtca gttttctttt caggctatac tttcaagcat aagatggtat atgaagatac cttcttgtca gttttctttt caggctatac tttcaagcat aagatggtat atgaagatac

36603660

cctgactctt tttcccttta gtggtgagac agttttcatg tcaatggaaa acccagggct cctgactctt tttcccttta gtggtgagac agttttcatg tcaatggaaa acccagggct

37203720

ttggatcttg ggatgccaca actctgactt tagaaacaga ggcatgactg cccttttaaa ttggatcttg ggatgccaca actctgactt tagaaacaga ggcatgactg cccttttaaa

37803780

ggtgtcctct tgtgataaga atactggaga ctactatgag gacagctatg aggacatttc ggtgtcctct tgtgataaga atactggaga ctactatgag gacagctatg aggacatttc

38403840

agcctatctg ctgtcaaaaa ataatgctat agagccaagg tcattttctc aaaatcctcc agcctatctg ctgtcaaaaa ataatgctat agagccaagg tcattttctc aaaatcctcc

39003900

tgtcctgaag aggcaccaaa gagagataac caggactacc ttacagtctg accaggagga tgtcctgaag aggcaccaaa gagagataac caggactacc ttacagtctg accaggagga

39603960

aattgattat gatgacacaa taagtgtgga gatgaaaaag gaggattttg atatttatga aattgattat gatgacacaa taagtgtgga gatgaaaaag gaggattttg atatttatga

40204020

tgaggatgaa aaccaatctc caagatcttt ccagaagaag actagacact atttcattgc tgaggatgaa aaccaatctc caagatcttt ccagaagaag actagacact atttcattgc

40804080

tgcagtggaa agactgtggg actatggaat gtcctccagc cctcatgttc tcaggaatag tgcagtggaa agactgtggg actatggaat gtcctccagc cctcatgttc tcaggaatag

41404140

ggctcaaagt ggttctgtgc cacagttcaa gaaggtggtg tttcaggaat tcacagatgg ggctcaaagt ggttctgtgc cacagttcaa gaaggtggtg tttcaggaat tcacagatgg

42004200

gtcctttact caaccactgt ataggggaga actcaatgaa catctaggat tactaggtcc gtcctttact caaccactgt ataggggaga actcaatgaa catctaggat tactaggtcc

42604260

ctacattaga gctgaggtgg aggacaatat catggtcact ttcaggaacc aggcatctag ctacattaga gctgaggtgg aggacaatat catggtcact ttcaggaacc aggcatctag

43204320

accatactct ttttacagct ccttgatatc ttatgaagag gaccagagac agggtgcaga accatactct ttttacagct ccttgatatc ttatgaagag gaccagagac agggtgcaga

43804380

acccaggaag aactttgtga aacccaatga gaccaaaaca tacttctgga aggtccagca acccaggaag aactttgtga aacccaatga gaccaaaaca tacttctgga aggtccagca

44404440

tcatatggct cctaccaagg atgaatttga ctgcaaagcc tgggcttact tctcagatgt tcatatggct cctaccaagg atgaatttga ctgcaaagcc tgggcttact tctcagatgt

45004500

ggatttggag aaagatgtgc acagtggctt gattgggcct cttttggtat gtcataccaa ggatttggag aaagatgtgc acagtggctt gattgggcct cttttggtat gtcataccaa

45604560

caccttaaac cctgctcatg gaagacaagt aacagtgcaa gagtttgccc tctttttcac caccttaaac cctgctcatg gaagacaagt aacagtgcaa gagtttgccc tctttttcac

46204620

tatatttgat gagacaaaaa gttggtactt tactgagaat atggagagga actgcagggc tatatttgat gagacaaaaa gttggtactt tactgagaat atggagagga actgcagggc

46804680

tccctgcaat atacagatgg aggatcctac tttcaaggaa aactataggt ttcatgccat tccctgcaat atacagatgg aggatcctac tttcaaggaa aactataggt ttcatgccat

47404740

taatggctat atcatggata cattgcctgg cttagttatg gcccaggatc agagaatcag taatggctat atcatggata cattgcctgg cttagttatg gcccaggatc agagaatcag

48004800

atggtacctc cttagtatgg gaagcaatga aaacatacat tctattcact tcagtggaca atggtacctc cttagtatgg gaagcaatga aaacatacat tctattcact tcagtggaca

48604860

tgtctttact gtgagaaaaa aggaagagta caagatggca ctgtacaatc tgtaccctgg tgtctttact gtgagaaaaa aggaagagta caagatggca ctgtacaatc tgtaccctgg

49204920

agtgtttgag acagttgaga tgctgcccag caaggctggg atctggaggg tagaatgcct agtgtttgag acagttgaga tgctgcccag caaggctggg atctggaggg tagaatgcct

49804980

gattggagaa cacttacatg caggtatgtc cactctattc ttggtctatt ccaacaagtg gattggagaa cacttacatg caggtatgtc cactctattc ttggtctatt ccaacaagtg

50405040

tcagaccccc ctaggcatgg catctggcca tattagagat ttccagataa ctgcttctgg tcagaccccc ctaggcatgg catctggcca tattagagat ttccagataa ctgcttctgg

51005100

tcagtatggc cagtgggccc ccaagcttgc tagacttcac tacagtggtt caataaatgc tcagtatggc cagtgggccc ccaagcttgc tagacttcac tacagtggtt caataaatgc

51605160

ctggtccacc aaggagccct tcagctggat taaagtggac ttgctagccc ccatgatcat ctggtccacc aaggagccct tcagctggat taaagtggac ttgctagccc ccatgatcat

52205220

tcatgggata aaaacacagg gtgccagaca gaaattttca tctctgtaca tcagccagtt tcatgggata aaaacacagg gtgccagaca gaaattttca tctctgtaca tcagccagtt

52805280

tatcatcatg tacagtctgg atggcaaaaa atggcagacc tacagaggta actctacagg tatcatcatg tacagtctgg atggcaaaaa atggcagacc tacagaggta actctacagg

53405340

tacactaatg gtattttttg gcaatgtaga ttcatcaggt atcaagcata atatctttaa tacactaatg gtattttttg gcaatgtaga ttcatcaggt atcaagcata atatctttaa

54005400

tcctcccatt attgccagat acatcaggtt gcacccaact cattacagta taagatccac tcctcccatt attgccagat acatcaggtt gcacccaact cattacagta taagatccac

54605460

tttaaggatg gagcttatgg ggtgtgacct taatagctgc agtatgccct tgggaatgga tttaaggatg gagcttatgg ggtgtgacct taatagctgc agtatgccct tgggaatgga

55205520

aagtaaggcc atatcagatg cccagattac tgcaagcagc tactttacaa acatgtttgc aagtaaggcc atatcagatg cccagattac tgcaagcagc tactttacaa acatgtttgc

55805580

aacctggtct cctagtaaag ccaggctgca cttgcagggt aggagcaatg catggagacc aacctggtct cctagtaaag ccaggctgca cttgcagggt aggagcaatg catggagacc

56405640

ccaggtcaat aacccaaaag agtggcttca agttgacttt caaaagacaa tgaaggtaac ccaggtcaat aacccaaaag agtggcttca agttgacttt caaaagacaa tgaaggtaac

57005700

aggggtaacc acccaagggg taaagagtct gctgacatct atgtatgtaa aagaattcct aggggtaacc acccaagggg taaagagtct gctgacatct atgtatgtaa aagaattcct

57605760

catctcaagt agtcaagatg ggcaccagtg gacactgttc ttccagaatg gaaaagttaa catctcaagt agtcaagatg ggcaccagtg gacactgttc ttccagaatg gaaaagttaa

58205820

ggtgttccaa ggtaatcaag acagcttcac tccagtggtg aacagtctgg atccaccact ggtgttccaa ggtaatcaag acagcttcac tccagtggtg aacagtctgg atccaccact

58805880

cctaaccagg tacctgagga tccaccctca gtcctgggtc caccagatag ctctgagaat cctaaccagg tacctgagga tccaccctca gtcctgggtc caccagatag ctctgagaat

59405940

ggaagtgctg ggctgtgaag ctcaggacct atactgatta attaataaaa tacagcatag ggaagtgctg ggctgtgaag ctcaggacct atactgatta attaataaaa tacagcatag

60006000

caaaacttta acctccaaat caagcctcta cttgaatcct tttctgaggg atgaataagg caaaacttta acctccaaat caagcctcta cttgaatcct tttctgaggg atgaataagg

60606060

cataggcatc aggggctgtt gccaatgtgc attagctgtt tgcagcctca ccttctttca cataggcatc aggggctgtt gccaatgtgc attagctgtt tgcagcctca ccttctttca

61206120

tggagtttaa gatatagtgt attttcccaa ggtttgaact agctcttcat ttctttatgt tggagtttaa gatatagtgt attttcccaa ggtttgaact agctcttcat ttctttatgt

61806180

tttaaatgca ctgacctccc acattccctt tttagtaaaa tattcagaaa taatttaaat tttaaatgca ctgacctccc acattccctt tttagtaaaa tattcagaaa taatttaaat

62406240

acatcattgc aatgaaaata aatgtttttt attaggcaga atccagatgc tcaaggccct acatcattgc aatgaaaata aatgtttttt attaggcaga atccagatgc tcaaggccct

63006300

tcataatatc ccccagttta gtagttggac ttagggaaca aaggaacctt taatagaaat tcataatatc ccccagttta gtagttggac ttagggaaca aaggaacctt taatagaaat

63606360

tggacagcaa gaaagcgagc tccataaagt aggaaacact acacgattcc ataaagtagg tggacagcaa gaaagcgagc tccataaagt aggaaacact acacgattcc ataaagtagg

64206420

aaacactaca tcactccata aagtaggaaa cactacacag acatgataag atacattgat aaacactaca tcactccata aagtaggaaa cactacacag acatgataag atacattgat

64806480

gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt

65406540

gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat

66006600

tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa

66606660

aacctctaca aatgtggtac ttaagcatgg ctacgtagat aagtagcatg gcgggttaat aacctctaca aatgtggtac ttaagcatgg ctacgtagat aagtagcatg gcgggttaat

67206720

cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc

67806780

gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt

68406840

gagcgagcga gcgcgcagct gcctgcaggg gcgcgccgct agcagctgat gcatagcatg gagcgagcga gcgcgcagct gcctgcaggg gcgcgccgct agcagctgat gcatagcatg

69006900

cggtaccggg agatggggga ggctaactga aacacggaag gagacaatac cggaaggaac cggtaccggg agatggggga ggctaactga aacacggaag gagacaatac cggaaggaac

69606960

ccgcgctatg acggcaataa aaagacagaa taaaacgcac gggtgttggg tcgtttgttc ccgcgctatg acggcaataa aaagacagaa taaaacgcac gggtgttggg tcgtttgttc

70207020

ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt

70807080

gggaccaata cgcccgcgtt tcttcctttt ccccacccca acccccaagt tcgggtgaag gggaccaata cgcccgcgtt tcttcctttt ccccacccca acccccaagt tcgggtgaag

71407140

gcccagggct cgcagccaac gtcggggcgg caagccctgc catagccact acgggtacgt gcccagggct cgcagccaac gtcggggcgg caagccctgc catagccact acgggtacgt

72007200

aggccaacca ctagaactat agctagagtc ctgggcgaac aaacgatgct cgccttccag aggccaacca ctagaactat agctagagtc ctgggcgaac aaacgatgct cgccttccag

72607260

aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc gccgcgacgg aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc gccgcgacgg

73207320

ccgaggtcta ccgatctcct gaagccaggg cagatccgtg cacagcacct tgccgtagaa ccgaggtcta ccgatctcct gaagccaggg cagatccgtg cacagcacct tgccgtagaa

73807380

gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc gctcgttcgc gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc gctcgttcgc

74407440

cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt gacgcacacc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt gacgcacacc

75007500

gtggaaacgg atgaaggcac gaacccagtt gacataagcc tgttcggttc gtaaactgta gtggaaacgg atgaaggcac gaacccagtt gacataagcc tgttcggttc gtaaactgta

75607560

atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg

76207620

taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgtac agtctatgcc taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgtac agtctatgcc

76807680

tcgggcatcc aagcagcaag cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag tcgggcatcc aagcagcaag cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag

77407740

caacgatgtt acgcagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt caacgatgtt acgcagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt

78007800

taggtggctc aagtatgggc atcattcgca catgtaggct cggccctgac caagtcaaat taggtggctc aagtatgggc atcattcgca catgtaggct cggccctgac caagtcaaat

78607860

ccatgcgggc tgctcttgat cttttcggtc gtgagttcgg agacgtagcc acctactccc ccatgcgggc tgctcttgat cttttcggtc gtgagttcgg agacgtagcc acctactccc

79207920

aacatcagcc ggactccgat tacctcggga acttgctccg tagtaagaca ttcatcgcgc aacatcagcc ggactccgat tacctcggga acttgctccg tagtaagaca ttcatcgcgc

79807980

ttgctgcctt cgaccaagaa gcggttgttg gcgctctcgc ggcttacgtt ctgcccaggt ttgctgcctt cgaccaagaa gcggttgttg gcgctctcgc ggcttacgtt ctgcccaggt

80408040

ttgagcagcc gcgtagtgag atctatatct atgatctcgc agtctccggc gagcaccgga ttgagcagcc gcgtagtgag atctatatct atgatctcgc agtctccggc gagcaccgga

81008100

ggcagggcat tgccaccgcg ctcatcaatc tcctcaagca tgaggccaac gcgcttggtg ggcagggcat tgccaccgcg ctcatcaatc tcctcaagca tgaggccaac gcgcttggtg

81608160

cttatgtgat ctacgtgcaa gcagattacg gtgacgatcc cgcagtggct ctctatacaa cttatgtgat ctacgtgcaa gcagattacg gtgacgatcc cgcagtggct ctctatacaa

82208220

agttgggcat acgggaagaa gtgatgcact ttgatatcga cccaagtacc gccacctaac agttgggcat acgggaagaa gtgatgcact ttgatatcga cccaagtacc gccacctaac

82808280

aattcgttca agccgagatc ggcttcccgg ccgcggagtt gttcggtaaa ttgtcacaac aattcgttca agccgagatc ggcttcccgg ccgcggagtt gttcggtaaa ttgtcacaac

83408340

gccgcgaata tagtctttac catgcccttg gccacgcccc tctttaatac gacgggcaat gccgcgaata tagtctttac catgcccttg gccacgcccc tctttaatac gacgggcaat

84008400

ttgcacttca gaaaatgaag agtttgcttt agccataaca aaagtccagt atgctttttc ttgcacttca gaaaatgaag agtttgcttt agccataaca aaagtccagt atgctttttc

84608460

acagcataac tggactgatt tcagtttaca actattctgt ctagtttaag actttattgt acagcataac tggactgatt tcagtttaca actattctgt ctagtttaag actttattgt

85208520

catagtttag atctattttg ttcagtttaa gactttattg tccgcccaca cccgcttacg catagtttag atctattttg ttcagtttaa gactttattg tccgcccaca cccgcttacg

85808580

cagggcatcc atttattact caaccgtaac cgattttgcc aggttacgcg gctggtctgc cagggcatcc atttattact caaccgtaac cgattttgcc aggttacgcg gctggtctgc

86408640

ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt

87008700

cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact

87608760

caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag

88208820

caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata

88808880

ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc

89408940

cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg

90009000

ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc

90609060

tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg

91209120

gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc

91809180

ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga

92409240

ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg

93009300

gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa

93609360

aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg

94209420

tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt

94809480

ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat

95409540

tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct

96009600

aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta

96609660

tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa

97209720

ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac

97809780

gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa

98409840

gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag

99009900

taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg

99609960

tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag

1002010020

ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg

1008010080

tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc

1014010140

ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat

1020010200

tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata

1026010260

ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa

1032010320

aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca

1038010380

actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc

1044010440

aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc

1050010500

tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg

1056010560

aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac

1062010620

ctgaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct ctgaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct

1068010680

cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg

1074010740

agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact

1080010800

ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac

1086010860

cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga

1092010920

gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga

1098010980

aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca

1104011040

ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ccattcgcca ttcaggctgc ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ccattcgcca ttcaggctgc

1110011100

aaataagcgt tgatattcag tcaattacaa acattaataa cgaagagatg acagaaaaat aaataagcgt tgatattcag tcaattacaa acattaataa cgaagagatg acagaaaaat

1116011160

tttcattctg tgacagagaa tttcattctg tgacagagaa

1118011180

<210> 217<210> 217

<211> 13862<211> 13862

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 217<400> 217

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60 60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120 120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180 180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240 240

atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt

300 300

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt

360 360

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac

420 420

aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag

480 480

taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt

540 540

gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac

600 600

tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag

660 660

cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat

720 720

gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc

780 780

cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata

840 840

aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat

900 900

agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt

960 960

ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag

10201020

tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag

10801080

tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tcaataggga ctttccatg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa

11401140

tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag

12001200

catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag

12601260

aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa

13201320

ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata

13801380

tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg

14401440

gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa gtaagtcact gactgtctat gcctgggaaa gggtggggcag gagatggggc agtgcaggaa

15001500

aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct

15601560

cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaaa tagagctctc cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaaa tagagctctc

16201620

cacctgcttc tttctgtgcc ttttgcgatt ctgctttagt gccaccagaa gatactacct cacctgcttc tttctgtgcc ttttgcgatt ctgctttagt gccaccagaa gatactacct

16801680

gggtgcagtg gaactgtcat gggactatat gcaaagtgat ctcggtgagc tgcctgtgga gggtgcagtg gaactgtcat gggactatat gcaaagtgat ctcggtgagc tgcctgtgga

17401740

cgcaagattt cctcctagag tgccaaaatc ttttccattc aacacctcag tcgtgtacaa cgcaagattt cctcctagag tgccaaaatc ttttccattc aacacctcag tcgtgtacaa

18001800

aaagactctg tttgtagaat tcacggatca ccttttcaac atcgctaagc caaggccacc aaagactctg tttgtagaat tcacggatca ccttttcaac atcgctaagc caaggccacc

18601860

ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt tatgatacag tggtcattac ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt tatgatacag tggtcattac

19201920

acttaagaac atggcttccc atcctgtcag tcttcatgct gttggtgtat cctactggaa acttaagaac atggcttccc atcctgtcag tcttcatgct gttggtgtat cctactggaa

19801980

agcttctgag ggagctgaat atgatgatca gaccagtcaa agggagaaag aagatgataa agcttctgag ggagctgaat atgatgatca gaccagtcaa agggagaaag aagatgataa

20402040

agtcttccct ggtggaagcc atacatatgt ctggcaggtc ctgaaagaga atggtccaat agtcttccct ggtggaagcc atacatatgt ctggcaggtc ctgaaagaga atggtccaat

21002100

ggcctctgac ccactgtgcc ttacctactc atatctttct catgtggacc tggtaaaaga ggcctctgac ccactgtgcc ttacctactc atatctttct catgtggacc tggtaaaaga

21602160

cttgaattca ggcctcattg gagccctact agtatgtaga gaagggagtc tggccaagga cttgaattca ggcctcattg gagccctact agtatgtaga gaagggagtc tggccaagga

22202220

aaagacacag accttgcaca aatttatact actttttgct gtatttgatg aagggaaaag aaagacacag accttgcaca aatttatact actttttgct gtatttgatg aagggaaaag

22802280

ttggcactca gaaacaaaga actccttgat gcaggatagg gatgctgcat ctgctcgggc ttggcactca gaaacaaaga actccttgat gcaggatagg gatgctgcat ctgctcgggc

23402340

ctggcctaaa atgcacacag tcaatggtta tgtaaacagg tctctgccag gtctgattgg ctggcctaaa atgcacacag tcaatggtta tgtaaacagg tctctgccag gtctgattgg

24002400

atgccacagg aaatcagtct attggcatgt gattggaatg ggcaccactc ctgaagtgca atgccacagg aaatcagtct attggcatgt gattggaatg ggcaccactc ctgaagtgca

24602460

ctcaatattc ctcgaaggtc acacatttct tgtgaggaac catcgccagg cgtccttgga ctcaatattc ctcgaaggtc acacatttct tgtgaggaac catcgccagg cgtccttgga

25202520

aatctcgcca ataactttcc ttactgctca aacactcttg atggaccttg gacagtttct aatctcgcca ataactttcc ttactgctca aacactcttg atggaccttg gacagtttct

25802580

actgttttgt catatctctt cccaccaaca tgatggcatg gaagcttatg tcaaagtaga actgttttgt catatctctt cccaccaaca tgatggcatg gaagcttatg tcaaagtaga

26402640

cagctgtcca gaggaacccc aactacgaat gaaaaataat gaagaagcgg aagactatga cagctgtcca gaggaacccc aactacgaat gaaaaataat gaagaagcgg aagactatga

27002700

tgatgatctt actgattctg aaatggatgt ggtcaggttt gatgatgaca actctccttc tgatgatctt actgattctg aaatggatgt ggtcaggttt gatgatgaca actctccttc

27602760

ctttatccaa attcgctcag ttgccaagaa gcatcctaaa acttgggtac attacattgc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa acttgggtac attacattgc

28202820

tgctgaagag gaggactggg actatgctcc cttagtcctc gcccccgatg acagaagtta tgctgaagag gaggactggg actatgctcc cttagtcctc gcccccgatg acagaagtta

28802880

taaaagtcaa tatttgaaca atggccctca gcggattggt aggaagtaca aaaaagtccg taaaagtcaa tatttgaaca atggccctca gcggattggt aggaagtaca aaaaagtccg

29402940

atttatggca tacacagatg aaacctttaa gactcgtgaa gctattcagc atgaatcagg atttatggca tacacagatg aaacctttaa gactcgtgaa gctattcagc atgaatcagg

30003000

aatcttggga cctttacttt atggggaagt tggagacaca ctgttgatta tatttaagaa aatcttggga cctttacttt atggggaagt tggagacaca ctgttgatta tatttaagaa

30603060

tcaagcaagc agaccatata acatctaccc tcacggaatc actgatgtcc gtcctttgta tcaagcaagc agaccatata acatctaccc tcacggaatc actgatgtcc gtcctttgta

31203120

ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat tttccaattc tgccaggaga ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat tttccaattc tgccaggaga

31803180

aatattcaaa tataaatgga cagtgactgt agaagatggg ccaactaaat cagatcctcg aatattcaaa tataaatgga cagtgactgt agaagatggg ccaactaaat cagatcctcg

32403240

gtgcctgacc cgctattact ctagtttcgt taatatggag agagatctag cttcaggact gtgcctgacc cgctattact ctagtttcgt taatatggag agagatctag cttcaggact

33003300

cattggccct ctcctcatct gctacaaaga atctgtagat caaagaggaa accagataat cattggccct ctcctcatct gctacaaaga atctgtagat caaagaggaa accagataat

33603360

gtcagacaag aggaatgtca tcctgttttc tgtatttgat gagaaccgaa gctggtacct gtcagacaag aggaatgtca tcctgttttc tgtatttgat gagaaccgaa gctggtacct

34203420

cacagagaat atacaacgct ttctccccaa tccagctgga gtgcagcttg aggatccaga cacagagaat atacaacgct ttctccccaa tccagctgga gtgcagcttg aggatccaga

34803480

gttccaagcc tccaacatca tgcacagcat caatggctat gtttttgata gtttgcagtt gttccaagcc tccaacatca tgcacagcat caatggctat gtttttgata gtttgcagtt

35403540

gtcagtttgt ttgcatgagg tggcatactg gtacattcta agcattggag cacagactga gtcagtttgt ttgcatgagg tggcatactg gtacattcta agcattggag cacagactga

36003600

cttcctttct gtcttcttct ctggatatac cttcaaacac aaaatggtct atgaagacac cttcctttct gtcttcttct ctggatatac cttcaaacac aaaatggtct atgaagacac

36603660

actcacccta ttcccattct caggagaaac tgtcttcatg tcgatggaaa acccaggtct actcacccta ttcccattct caggagaaac tgtcttcatg tcgatggaaa acccaggtct

37203720

atggattctg gggtgccaca actcagactt tcggaacaga ggcatgaccg ccttactgaa atggattctg gggtgccaca actcagactt tcggaacaga ggcatgaccg ccttactgaa

37803780

ggtttctagt tgtgacaaga acactggtga ttattacgag gacagttatg aagatatttc ggtttctagt tgtgacaaga acactggtga ttattacgag gacagttatg aagatatttc

38403840

agcatacttg ctgagtaaaa acaatgccat tgaaccaaga agcttctccc agaattcaag agcatacttg ctgagtaaaa acaatgccat tgaaccaaga agcttctccc agaattcaag

39003900

acaccctagc actaggcaaa agcaatttaa tgccaccaca attccagaaa atgacataga acaccctagc actaggcaaa agcaatttaa tgccaccaca attccagaaa atgacataga

39603960

gaagactgac ccttggtttg cacacagaac acctatgcct aaaatacaaa atgtctcctc gaagactgac ccttggtttg cacacagaac acctatgcct aaaatacaaa atgtctcctc

40204020

tagtgatttg ttgatgctct tgcgacagag tcctactcca catgggctat ccttatctga tagtgatttg ttgatgctct tgcgacagag tcctactcca catgggctat ccttatctga

40804080

tctccaagaa gccaaatatg agactttttc tgatgatcca tcacctggag caatagacag tctccaagaa gccaaatatg agactttttc tgatgatcca tcacctggag caatagacag

41404140

taataacagc ctgtctgaaa tgacacactt caggccacag ctccatcaca gtggggacat taataacagc ctgtctgaaa tgacacactt caggccacag ctccatcaca gtggggacat

42004200

ggtatttacc cctgagtcag gcctccaatt aagattaaat gagaaactgg ggacaactgc ggtatttacc cctgagtcag gcctccaatt aagattaaat gagaaactgg ggacaactgc

42604260

agcaacagag ttgaagaaac ttgatttcaa agtttctagt acatcaaata atctgatttc agcaacagag ttgaagaaac ttgatttcaa agtttctagt acatcaaata atctgatttc

43204320

aacaattcca tcagacaatt tggcagcagg tactgataat acaagttcct taggaccccc aacaattcca tcagacaatt tggcagcagg tactgataat acaagttcct taggaccccc

43804380

aagtatgcca gttcattatg atagtcaatt agataccact ctatttggca aaaagtcatc aagtatgcca gttcattatg atagtcaatt agataccact ctatttggca aaaagtcatc

44404440

tccccttact gagtctggtg gacctctgag cttgagtgaa gaaaataatg attcaaagtt tccccttact gagtctggtg gacctctgag cttgagtgaa gaaaataatg attcaaagtt

45004500

gttagaatca ggtttaatga atagccaaga aagttcatgg ggaaaaaatg tatcgtcaac gttagaatca ggtttaatga atagccaaga aagttcatgg ggaaaaaatg tatcgtcaac

45604560

agagagtggt aggttattta aagggaaaag agctcatgga cctgctttgt tgactaaaga agagagtggt aggttattta aagggaaaag agctcatgga cctgctttgt tgactaaaga

46204620

taatgcctta ttcaaagtta gcatctcttt gttaaagaca aacaaaactt ccaataattc taatgcctta ttcaaagtta gcatctcttt gttaaagaca aacaaaactt ccaataattc

46804680

agcaactaat agaaagactc acattgatgg cccatcatta ttaattgaga atagtccatc agcaactaat agaaagactc acattgatgg cccatcatta ttaattgaga atagtccatc

47404740

agtctggcaa aatatattag aaagtgacac tgagtttaaa aaagtgacac ctttgattca agtctggcaa aatatattag aaagtgacac tgagtttaaa aaagtgacac ctttgattca

48004800

tgacagaatg cttatggaca aaaatgctac agctttgagg ctaaatcata tgtcaaataa tgacagaatg cttatggaca aaaatgctac agctttgagg ctaaatcata tgtcaaataa

48604860

aactacttca tcaaaaaaca tggaaatggt ccaacagaaa aaagagggcc ccattccacc aactacttca tcaaaaaaca tggaaatggt ccaacagaaa aaagaggggcc ccattccacc

49204920

agatgcacaa aatccagata tgtcgttctt taagatgcta ttcttgccag aatcagcaag agatgcacaa aatccagata tgtcgttctt taagatgcta ttcttgccag aatcagcaag

49804980

gtggatacaa aggactcatg gaaagaactc tctgaactct gggcaaggcc ccagtccaaa gtggatacaa aggactcatg gaaagaactc tctgaactct gggcaaggcc ccagtccaaa

50405040

gcaattagta tccttaggac cagaaaaatc tgtggaaggt cagaatttct tgtctgagaa gcaattagta tccttaggac cagaaaaatc tgtggaaggt cagaatttct tgtctgagaa

51005100

aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac gtaggactca aagagatggt aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac gtaggactca aagagatggt

51605160

ttttccaagc agcagaaacc tatttcttac taacttggat aatttacatg aaaataatac ttttccaagc agcagaaacc tatttcttac taacttggat aatttacatg aaaataatac

52205220

acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag aaggaaacat taatccaaga acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag aaggaaacat taatccaaga

52805280

gaatgtagtt ttgcctcaga tacatacagt gactggcact aagaatttca tgaagaacct gaatgtagtt ttgcctcaga tacatacagt gactggcact aagaatttca tgaagaacct

53405340

tttcttactg agcactaggc aaaatgtaga aggttcatat gacggggcat atgctccagt tttcttactg agcactaggc aaaatgtaga aggttcatat gacggggcat atgctccagt

54005400

acttcaagat tttaggtcat taaatgattc aacaaataga acaaagaaac acacagctca acttcaagat tttaggtcat taaatgattc aacaaataga acaaagaaac acacagctca

54605460

tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg ggaaatcaaa ccaagcaaat tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg ggaaatcaaa ccaagcaaat

55205520

tgtagagaaa tatgcatgca ccacaaggat atctcctaat acaagccagc agaattttgt tgtagagaaa tatgcatgca ccacaaggat atctcctaat acaagccagc agaattttgt

55805580

cacgcaacgt agtaagagag ctttgaaaca attcagactc ccactagaag aaacagaact cacgcaacgt agtaagagag ctttgaaaca attcagactc ccactagaag aaacagaact

56405640

tgaaaaaagg ataattgtgg atgacacctc aacccagtgg tccaaaaaca tgaaacattt tgaaaaaagg ataattgtgg atgacacctc aacccagtgg tccaaaaaca tgaaacattt

57005700

gaccccgagc accctcacac agatagacta caatgagaag gagaaagggg ccattactca gaccccgagc accctcacac agatagacta caatgagaag gagaaagggg ccattactca

57605760

gtctccctta tcagattgcc ttacgaggag tcatagcatc cctcaagcaa atagatctcc gtctccctta tcagattgcc ttacgaggag tcatagcatc cctcaagcaa atagatctcc

58205820

attacccatt gcaaaggtat catcatttcc atctattaga cctatatatc tgaccagggt attacccatt gcaaaggtat catcatttcc atctattaga cctatatatc tgaccagggt

58805880

cctattccaa gacaactctt ctcatcttcc agcagcatct tatagaaaga aagattctgg cctattccaa gacaactctt ctcatcttcc agcagcatct tatagaaaga aagattctgg

59405940

ggtccaagaa agcagtcatt tcttacaagg agccaaaaaa aataaccttt ctttagccat ggtccaagaa agcagtcatt tcttacaagg agccaaaaaa aataaccttt ctttagccat

60006000

tctaaccttg gagatgactg gtgatcaaag agaggttggc tccctgggga caagtgccac tctaaccttg gagatgactg gtgatcaaag agaggttggc tccctgggga caagtgccac

60606060

aaattcagtc acatacaaga aagttgagaa cactgttctc ccgaaaccag acttgcccaa aaattcagtc acatacaaga aagttgagaa cactgttctc ccgaaaccag acttgcccaa

61206120

aacatctggc aaagttgaat tgcttccaaa agttcacatt tatcagaagg acctattccc aacatctggc aaagttgaat tgcttccaaa agttcacatt tatcagaagg acctattccc

61806180

tacggaaact agcaatgggt ctcctggcca tctggatctc gtggaaggga gccttcttca tacggaaact agcaatgggt ctcctggcca tctggatctc gtggaaggga gccttcttca

62406240

gggaacagag ggagcgatta agtggaatga agcaaacaga cctggaaaag ttccctttct gggaacagag ggagcgatta agtggaatga agcaaacaga cctggaaaag ttccctttct

63006300

gagagtagca acagaaagct ctgcaaagac tccctccaag ctattggatc ctcttgcttg gagagtagca acagaaagct ctgcaaagac tccctccaag ctattggatc ctcttgcttg

63606360

ggataaccac tatggtactc agataccaaa agaagagtgg aaatcccaag agaagtcacc ggataaccac tatggtactc agataccaaa agaagagtgg aaatcccaag agaagtcacc

64206420

agaaaaaaca gcttttaaga aaaaggatac cattttgtcc ctgaacgctt gtgaaagcaa agaaaaaaca gcttttaaga aaaaggatac cattttgtcc ctgaacgctt gtgaaagcaa

64806480

tcatgcaata gcagcaataa atgagggaca aaataagccc gaaatagaag tcacctgggc tcatgcaata gcagcaataa atgagggaca aaataagccc gaaatagaag tcacctgggc

65406540

aaagcaaggt aggactgaaa ggctgtgctc tcaaaaccca ccagtcttga aacgccatca aaagcaaggt aggactgaaa ggctgtgctc tcaaaaccca ccagtcttga aacgccatca

66006600

acgggaaata actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac acgggaaata actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac

66606660

catatcagtt gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag catatcagtt gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag

67206720

cccccgcagc tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg cccccgcagc tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg

67806780

ggattatggg atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt ggattatggg atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt

68406840

ccctcagttc aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt ccctcagttc aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt

69006900

ataccgtgga gaactaaatg aacatttggg actcctgggg ccatatataa gagcagaagt ataccgtgga gaactaaatg aacatttggg actcctgggg ccatatataa gagcagaagt

69606960

tgaagataat atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc tgaagataat atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc

70207020

tagccttatt tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt tagccttatt tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt

70807080

caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa

71407140

agatgagttt gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt agatgagttt gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt

72007200

gcactcaggc ctgattggac cccttctggt ctgccacact aacacactga accctgctca gcactcaggc ctgattggac cccttctggt ctgccacact aacacactga accctgctca

72607260

tgggagacaa gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa tggggagacaa gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa

73207320

aagctggtac ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat aagctggtac ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat

73807380

ggaagatccc acttttaaag agaattatcg cttccatgca atcaatggct acataatgga ggaagatccc acttttaaag agaattatcg cttccatgca atcaatggct acataatgga

74407440

tacactacct ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat tacactacct ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat

75007500

gggcagcaat gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa gggcagcaat gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa

75607560

aaaagaggag tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga aaaagaggag tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga

76207620

aatgttacca tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca aatgttacca tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca

76807680

tgctgggatg agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat tgctgggatg agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat

77407740

ggcttctgga cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc ggcttctgga cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc

78007800

cccaaagctg gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc cccaaagctg gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc

78607860

cttttcttgg atcaaggtgg atctgttggc accaatgatt attcacggca tcaagaccca cttttcttgg atcaaggtgg atctgttggc accaatgatt attcacggca tcaagacca

79207920

gggtgcccgt cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct gggtgcccgt cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct

79807980

tgatgggaag aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt tgatgggaag aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt

80408040

tggcaatgtg gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg tggcaatgtg gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg

81008100

atacatccgt ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat atacatccgt ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat

81608160

gggctgtgat ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga gggctgtgat ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga

82208220

tgcacagatt actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa tgcacagatt actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa

82808280

agctcgactt cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa agctcgactt cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa

83408340

agagtggctg caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg agagtggctg caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg

84008400

agtaaaatct ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga agtaaaatct ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga

84608460

tggccatcag tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca tggccatcag tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca

85208520

agactccttc acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg agactccttc acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg

85808580

aattcacccc cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga aattcacccc cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga

86408640

ggcacaggac ctctactgat taattaataa aatacagcat agcaaaactt taacctccaa ggcacaggac ctctactgat taattaataa aatacagcat agcaaaactt taacctccaa

87008700

atcaagcctc tacttgaatc cttttctgag ggatgaataa ggcataggca tcaggggctg atcaagcctc tacttgaatc cttttctgag ggatgaataa ggcataggca tcaggggctg

87608760

ttgccaatgt gcattagctg tttgcagcct caccttcttt catggagttt aagatatagt ttgccaatgt gcattagctg tttgcagcct caccttcttt catggagttt aagatatagt

88208820

gtattttccc aaggtttgaa ctagctcttc atttctttat gttttaaatg cactgacctc gtattttccc aaggtttgaa ctagctcttc atttctttat gttttaaatg cactgacctc

88808880

ccacattccc tttttagtaa aatattcaga aataatttaa atacatcatt gcaatgaaaa ccacattccc tttttagtaa aatattcaga aataatttaa atacatcatt gcaatgaaaa

89408940

taaatgtttt ttattaggca gaatccagat gctcaaggcc cttcataata tcccccagtt taaatgtttt ttattaggca gaatccagat gctcaaggcc cttcataata tcccccagtt

90009000

tagtagttgg acttagggaa caaaggaacc tttaatagaa attggacagc aagaaagcga tagtagttgg acttagggaa caaaggaacc tttaatagaa attggacagc aagaaagcga

90609060

gctccataaa gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca gctccataaa gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca

91209120

taaagtagga aacactacac agacatgata agatacattg atgagtttgg acaaaccaca taaagtagga aacactacac agacatgata agatacattg atgagtttgg acaaaccaca

91809180

actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt

92409240

gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt

93009300

caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt

93609360

acttaagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag acttaagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag

94209420

gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag

94809480

gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag

95409540

ctgcctgcag gggcgcgccg ctagcagctg atgcatagca tgcggtaccg ggagatgggg ctgcctgcag gggcgcgccg ctagcagctg atgcatagca tgcggtaccg ggagatgggg

96009600

gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat

96609660

aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt

97209720

cccagggctg gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg cccagggctg gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg

97809780

tttcttcctt ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca tttcttcctt ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca

98409840

acgtcggggc ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact acgtcggggc ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact

99009900

atagctagag tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac atagctagag tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac

99609960

cacttcatcc ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc cacttcatcc ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc

1002010020

ctgaagccag ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa ctgaagccag ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa

1008010080

tgcctgacga tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc tgcctgacga tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc

1014010140

ctcgacttcg ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc ctcgacttcg ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc

1020010200

acgaacccag ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg acgaacccag ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg

1026010260

ctcacgcaac tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt ctcacgcaac tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt

1032010320

tttcatggct tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca tttcatggct tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca

1038010380

agcgcgttac gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca agcgcgttac gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca

1044010440

gcaacgatgt tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcaacgatgt tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg

1050010500

gcatcattcg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg gcatcattcg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg

1056010560

atcttttcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg atcttttcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg

1062010620

attacctcgg gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag attacctcgg gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag

1068010680

aagcggttgt tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg aagcggttgt tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg

1074010740

agatctatat ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg agatctatat ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg

1080010800

cgctcatcaa tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc cgctcatcaa tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc

1086010860

aagcagatta cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagcagatta cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag

1092010920

aagtgatgca ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga aagtgatgca ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga

1098010980

tcggcttccc ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt tcggcttccc ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt

1104011040

accatgccct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga accatgccct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga

1110011100

agagtttgct ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga agagtttgct ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga

1116011160

tttcagttta caactattct gtctagttta agactttatt gtcatagttt agatctattt tttcagttta caactattct gtctagttta agactttatt gtcatagttt agatctattt

1122011220

tgttcagttt aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta tgttcagttt aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta

1128011280

ctcaaccgta accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca ctcaaccgta accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca

1134011340

gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc

1140011400

tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt

1146011460

tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg

1152011520

ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg caccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg

1158011580

agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat

1164011640

accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta

1170011700

ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct

1176011760

gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc

1182011820

ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa

1188011880

gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg

1194011940

taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag

1200012000

tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt

1206012060

gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta

1212012120

cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc

1218012180

agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca

1224012240

cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa

1230012300

cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat

1236012360

ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggaggggct

1242012420

taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt

1248012480

tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat

1254012540

ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta

1260012600

atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg

1266012660

gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt

1272012720

tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg

1278012780

cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg

1284012840

taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc

1290012900

ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa

1296012960

ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac

1302013020

cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt

1308013080

ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg

1314013140

gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa

1320013200

gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata

1326013260

aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta

1332013320

atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg

1338013380

ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg

1344013440

ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa

1350013500

aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg

1356013560

ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt

1362013620

gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg

1368013680

ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta

1374013740

atgcgccgct acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc atgcgccgct acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc

1380013800

agtcaattac aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag agtcaattac aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag

1386013860

aa aa

1386213862

<210> 218<210> 218

<211> 2351<211> 2351

<212> БЕЛОК<212> PROTEIN

<213> Homo sapiens<213> Homo sapiens

<400> 218<400> 218

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 151 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu SerCys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30 20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala ArgTrp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45 35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val ValPhe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60 50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn IleTyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 8065 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile GlnAla Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95 85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala SerAla Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110 100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala SerHis Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125 115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu AspGlu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140 130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val LeuAsp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr SerLys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175 165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu IleTyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190 180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys ThrGly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205 195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu GlyGln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220 210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg AspLys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly TyrAla Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255 245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser ValVal Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270 260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser IleTyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285 275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala SerPhe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300 290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu MetLeu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln HisAsp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335 325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu ProAsp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350 340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp AspGln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365 355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn SerLeu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380 370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys ThrPro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala ProTrp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415 405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu AsnLeu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430 420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe MetAsn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445 435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His GluAla Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460 450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr LeuSer Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr ProLeu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495 485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro LysHis Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510 500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile PheGly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525 515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser AspLys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540 530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu ArgPro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys GluAsp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575 565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn ValSer Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590 580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr GluIle Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605 595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu AspAsn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620 610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr ValPro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr TrpPhe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655 645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe PheTyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670 660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu ThrSer Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685 675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn ProLeu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700 690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg GlyGly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly AspMet Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735 725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser LysTyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750 740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His ProAsn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro

755 760 765 755 760 765

Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn AspSer Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp

770 775 780 770 775 780

Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro LysIle Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys

785 790 795 800785 790 795 800

Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln SerIle Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser

805 810 815 805 810 815

Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys TyrPro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr

820 825 830 820 825 830

Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn AsnGlu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn

835 840 845 835 840 845

Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser GlySer Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly

850 855 860 850 855 860

Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn GluAsp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu

865 870 875 880865 870 875 880

Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe LysLys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys

885 890 895 885 890 895

Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp AsnVal Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn

900 905 910 900 905 910

Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser MetLeu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met

915 920 925 915 920 925

Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys LysPro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys

930 935 940 930 935 940

Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu GluSer Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu

945 950 955 960945 950 955 960

Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln GluAsn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu

965 970 975 965 970 975

Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu PheSer Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe

980 985 990 980 985 990

Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn AlaLys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala

995 1000 1005 995 1000 1005

Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr SerLeu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser

1010 1015 1020 1010 1015 1020

Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro SerAsn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser

1025 1030 1035 1025 1030 1035

Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu GluLeu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu

1040 1045 1050 1040 1045 1050

Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp ArgSer Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg

1055 1060 1065 1055 1060 1065

Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His MetMet Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met

1070 1075 1080 1070 1075 1080

Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln GlnSer Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln

1085 1090 1095 1085 1090 1095

Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp MetLys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met

1100 1105 1110 1100 1105 1110

Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp IleSer Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile

1115 1120 1125 1115 1120 1125

Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly ProGln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro

1130 1135 1140 1130 1135 1140

Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val GluSer Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu

1145 1150 1155 1145 1150 1155

Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly LysGly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys

1160 1165 1170 1160 1165 1170

Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe ProGly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro

1175 1180 1185 1175 1180 1185

Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His GluSer Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu

1190 1195 1200 1190 1195 1200

Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile GluAsn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu

1205 1210 1215 1205 1210 1215

Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln IleLys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile

1220 1225 1230 1220 1225 1230

His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe LeuHis Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu

1235 1240 1245 1235 1240 1245

Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala TyrLeu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr

1250 1255 1260 1250 1255 1260

Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr AsnAla Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn

1265 1270 1275 1265 1270 1275

Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu GluArg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu

1280 1285 1290 1280 1285 1290

Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val GluGlu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu

1295 1300 1305 1295 1300 1305

Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln GlnLys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln

1310 1315 1320 1310 1315 1320

Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe ArgAsn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg

1325 1330 1335 1325 1330 1335

Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val AspLeu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp

1340 1345 1350 1340 1345 1350

Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr ProAsp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro

1355 1360 1365 1355 1360 1365

Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly AlaSer Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala

1370 1375 1380 1370 1375 1380

Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His SerIle Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser

1385 1390 1395 1385 1390 1395

Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val SerIle Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser

1400 1405 1410 1400 1405 1410

Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu PheSer Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe

1415 1420 1425 1415 1420 1425

Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys LysGln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys

1430 1435 1440 1430 1435 1440

Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala LysAsp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys

1445 1450 1455 1445 1450 1455

Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr GlyLys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly

1460 1465 1470 1460 1465 1470

Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn SerAsp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser

1475 1480 1485 1475 1480 1485

Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro AspVal Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp

1490 1495 1500 1490 1495 1500

Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val HisLeu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His

1505 1510 1515 1505 1510 1515

Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly SerIle Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser

1520 1525 1530 1520 1525 1530

Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly ThrPro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr

1535 1540 1545 1535 1540 1545

Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys ValGlu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val

1550 1555 1560 1550 1555 1560

Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro SerPro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser

1565 1570 1575 1565 1570 1575

Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr GlnLys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln

1580 1585 1590 1580 1585 1590

Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu LysIle Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys

1595 1600 1605 1595 1600 1605

Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala CysThr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys

1610 1615 1620 1610 1615 1620

Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn LysGlu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys

1625 1630 1635 1625 1630 1635

Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu ArgPro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg

1640 1645 1650 1640 1645 1650

Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg GluLeu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu

1655 1660 1665 1655 1660 1665

Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp TyrIle Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr

1670 1675 1680 1670 1675 1680

Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp IleAsp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile

1685 1690 1695 1685 1690 1695

Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys LysTyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys

1700 1705 1710 1700 1705 1710

Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp TyrThr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr

1715 1720 1725 1715 1720 1725

Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln SerGly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser

1730 1735 1740 1730 1735 1740

Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe ThrGly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr

1745 1750 1755 1745 1750 1755

Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn GluAsp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu

1760 1765 1770 1760 1765 1770

His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu AspHis Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp

1775 1780 1785 1775 1780 1785

Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr SerAsn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser

1790 1795 1800 1790 1795 1800

Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln GlyPhe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly

1805 1810 1815 1805 1810 1815

Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys ThrAla Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr

1820 1825 1830 1820 1825 1830

Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp GluTyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu

1835 1840 1845 1835 1840 1845

Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu GluPhe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu

1850 1855 1860 1850 1855 1860

Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys HisLys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His

1865 1870 1875 1865 1870 1875

Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val GlnThr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln

1880 1885 1890 1880 1885 1890

Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser TrpGlu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp

1895 1900 1905 1895 1900 1905

Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys AsnTyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn

1910 1915 1920 1910 1915 1920

Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe HisIle Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His

1925 1930 1935 1925 1930 1935

Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val MetAla Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met

1940 1945 1950 1940 1945 1950

Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly SerAla Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser

1955 1960 1965 1955 1960 1965

Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe ThrAsn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr

1970 1975 1980 1970 1975 1980

Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu TyrVal Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr

1985 1990 1995 1985 1990 1995

Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala GlyPro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly

2000 2005 2010 2000 2005 2010

Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala GlyIle Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly

2015 2020 2025 2015 2020 2025

Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr ProMet Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro

2030 2035 2040 2030 2035 2040

Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr AlaLeu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala

2045 2050 2055 2045 2050 2055

Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu HisSer Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His

2060 2065 2070 2060 2065 2070

Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe SerTyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser

2075 2080 2085 2075 2080 2085

Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly IleTrp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile

2090 2095 2100 2090 2095 2100

Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile SerLys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser

2105 2110 2115 2105 2110 2115

Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln ThrGln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr

2120 2125 2130 2120 2125 2130

Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly AsnTyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn

2135 2140 2145 2135 2140 2145

Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro IleVal Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile

2150 2155 2160 2150 2155 2160

Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile ArgIle Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg

2165 2170 2175 2165 2170 2175

Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser CysSer Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys

2180 2185 2190 2180 2185 2190

Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala GlnSer Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln

2195 2200 2205 2195 2200 2205

Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp SerIle Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser

2210 2215 2220 2210 2215 2220

Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala TrpPro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp

2225 2230 2235 2225 2230 2235

Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp PheArg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe

2240 2245 2250 2240 2245 2250

Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val LysGln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys

2255 2260 2265 2255 2260 2265

Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser SerSer Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser

2270 2275 2280 2270 2275 2280

Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly LysSer Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys

2285 2290 2295 2285 2290 2295

Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val ValVal Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val

2300 2305 2310 2300 2305 2310

Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile HisAsn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His

2315 2320 2325 2315 2320 2325

Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val LeuPro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu

2330 2335 2340 2330 2335 2340

Gly Cys Glu Ala Gln Asp Leu TyrGly Cys Glu Ala Gln Asp Leu Tyr

2345 2350 2345 2350

<210> 219<210> 219

<400> 219<400> 219

000000

<210> 220<210> 220

<400> 220<400> 220

000000

<210> 221<210> 221

<400> 221<400> 221

000000

<210> 222<210> 222

<400> 222<400> 222

000000

<210> 223<210> 223

<400> 223<400> 223

000000

<210> 224<210> 224

<400> 224<400> 224

000000

<210> 225<210> 225

<400> 225<400> 225

000000

<210> 226<210> 226

<400> 226<400> 226

000000

<210> 227<210> 227

<400> 227<400> 227

000000

<210> 228<210> 228

<400> 228<400> 228

000000

<210> 229<210> 229

<400> 229<400> 229

000000

<210> 230<210> 230

<400> 230<400> 230

000000

<210> 231<210> 231

<400> 231<400> 231

000000

<210> 232<210> 232

<400> 232<400> 232

000000

<210> 233<210> 233

<400> 233<400> 233

000000

<210> 234<210> 234

<400> 234<400> 234

000000

<210> 235<210> 235

<400> 235<400> 235

000000

<210> 236<210> 236

<400> 236<400> 236

000000

<210> 237<210> 237

<400> 237<400> 237

000000

<210> 238<210> 238

<400> 238<400> 238

000000

<210> 239<210> 239

<400> 239<400> 239

000000

<210> 240<210> 240

<400> 240<400> 240

000000

<210> 241<210> 241

<400> 241<400> 241

000000

<210> 242<210> 242

<400> 242<400> 242

000000

<210> 243<210> 243

<400> 243<400> 243

000000

<210> 244<210> 244

<400> 244<400> 244

000000

<210> 245<210> 245

<400> 245<400> 245

000000

<210> 246<210> 246

<400> 246<400> 246

000000

<210> 247<210> 247

<400> 247<400> 247

000000

<210> 248<210> 248

<400> 248<400> 248

000000

<210> 249<210> 249

<400> 249<400> 249

000000

<210> 250<210> 250

<400> 250<400> 250

000000

<210> 251<210> 251

<400> 251<400> 251

000000

<210> 252<210> 252

<400> 252<400> 252

000000

<210> 253<210> 253

<400> 253<400> 253

000000

<210> 254<210> 254

<400> 254<400> 254

000000

<210> 255<210> 255

<400> 255<400> 255

000000

<210> 256<210> 256

<400> 256<400> 256

000000

<210> 257<210> 257

<400> 257<400> 257

000000

<210> 258<210> 258

<400> 258<400> 258

000000

<210> 259<210> 259

<400> 259<400> 259

000000

<210> 260<210> 260

<400> 260<400> 260

000000

<210> 261<210> 261

<400> 261<400> 261

000000

<210> 262<210> 262

<400> 262<400> 262

000000

<210> 263<210> 263

<400> 263<400> 263

000000

<210> 264<210> 264

<400> 264<400> 264

000000

<210> 265<210> 265

<400> 265<400> 265

000000

<210> 266<210> 266

<400> 266<400> 266

000000

<210> 267<210> 267

<400> 267<400> 267

000000

<210> 268<210> 268

<400> 268<400> 268

000000

<210> 269<210> 269

<400> 269<400> 269

000000

<210> 270<210> 270

<400> 270<400> 270

000000

<210> 271<210> 271

<400> 271<400> 271

000000

<210> 272<210> 272

<400> 272<400> 272

000000

<210> 273<210> 273

<400> 273<400> 273

000000

<210> 274<210> 274

<400> 274<400> 274

000000

<210> 275<210> 275

<400> 275<400> 275

000000

<210> 276<210> 276

<400> 276<400> 276

000000

<210> 277<210> 277

<400> 277<400> 277

000000

<210> 278<210> 278

<400> 278<400> 278

000000

<210> 279<210> 279

<400> 279<400> 279

000000

<210> 280<210> 280

<400> 280<400> 280

000000

<210> 281<210> 281

<400> 281<400> 281

000000

<210> 282<210> 282

<400> 282<400> 282

000000

<210> 283<210> 283

<400> 283<400> 283

000000

<210> 284<210> 284

<400> 284<400> 284

000000

<210> 285<210> 285

<400> 285<400> 285

000000

<210> 286<210> 286

<400> 286<400> 286

000000

<210> 287<210> 287

<400> 287<400> 287

000000

<210> 288<210> 288

<400> 288<400> 288

000000

<210> 289<210> 289

<400> 289<400> 289

000000

<210> 290<210> 290

<400> 290<400> 290

000000

<210> 291<210> 291

<400> 291<400> 291

000000

<210> 292<210> 292

<400> 292<400> 292

000000

<210> 293<210> 293

<400> 293<400> 293

000000

<210> 294<210> 294

<400> 294<400> 294

000000

<210> 295<210> 295

<400> 295<400> 295

000000

<210> 296<210> 296

<400> 296<400> 296

000000

<210> 297<210> 297

<400> 297<400> 297

000000

<210> 298<210> 298

<400> 298<400> 298

000000

<210> 299<210> 299

<400> 299<400> 299

000000

<210> 300<210> 300

<400> 300<400> 300

000000

<210> 301<210> 301

<400> 301<400> 301

000000

<210> 302<210> 302

<400> 302<400> 302

000000

<210> 303<210> 303

<400> 303<400> 303

000000

<210> 304<210> 304

<400> 304<400> 304

000000

<210> 305<210> 305

<400> 305<400> 305

000000

<210> 306<210> 306

<400> 306<400> 306

000000

<210> 307<210> 307

<400> 307<400> 307

000000

<210> 308<210> 308

<400> 308<400> 308

000000

<210> 309<210> 309

<400> 309<400> 309

000000

<210> 310<210> 310

<400> 310<400> 310

000000

<210> 311<210> 311

<400> 311<400> 311

000000

<210> 312<210> 312

<400> 312<400> 312

000000

<210> 313<210> 313

<400> 313<400> 313

000000

<210> 314<210> 314

<400> 314<400> 314

000000

<210> 315<210> 315

<400> 315<400> 315

000000

<210> 316<210> 316

<400> 316<400> 316

000000

<210> 317<210> 317

<400> 317<400> 317

000000

<210> 318<210> 318

<400> 318<400> 318

000000

<210> 319<210> 319

<400> 319<400> 319

000000

<210> 320<210> 320

<400> 320<400> 320

000000

<210> 321<210> 321

<400> 321<400> 321

000000

<210> 322<210> 322

<400> 322<400> 322

000000

<210> 323<210> 323

<400> 323<400> 323

000000

<210> 324<210> 324

<400> 324<400> 324

000000

<210> 325<210> 325

<400> 325<400> 325

000000

<210> 326<210> 326

<400> 326<400> 326

000000

<210> 327<210> 327

<400> 327<400> 327

000000

<210> 328<210> 328

<400> 328<400> 328

000000

<210> 329<210> 329

<400> 329<400> 329

000000

<210> 330<210> 330

<400> 330<400> 330

000000

<210> 331<210> 331

<400> 331<400> 331

000000

<210> 332<210> 332

<400> 332<400> 332

000000

<210> 333<210> 333

<400> 333<400> 333

000000

<210> 334<210> 334

<400> 334<400> 334

000000

<210> 335<210> 335

<400> 335<400> 335

000000

<210> 336<210> 336

<400> 336<400> 336

000000

<210> 337<210> 337

<400> 337<400> 337

000000

<210> 338<210> 338

<400> 338<400> 338

000000

<210> 339<210> 339

<400> 339<400> 339

000000

<210> 340<210> 340

<400> 340<400> 340

000000

<210> 341<210> 341

<400> 341<400> 341

000000

<210> 342<210> 342

<400> 342<400> 342

000000

<210> 343<210> 343

<400> 343<400> 343

000000

<210> 344<210> 344

<400> 344<400> 344

000000

<210> 345<210> 345

<400> 345<400> 345

000000

<210> 346<210> 346

<400> 346<400> 346

000000

<210> 347<210> 347

<400> 347<400> 347

000000

<210> 348<210> 348

<400> 348<400> 348

000000

<210> 349<210> 349

<400> 349<400> 349

000000

<210> 350<210> 350

<400> 350<400> 350

000000

<210> 351<210> 351

<400> 351<400> 351

000000

<210> 352<210> 352

<400> 352<400> 352

000000

<210> 353<210> 353

<400> 353<400> 353

000000

<210> 354<210> 354

<400> 354<400> 354

000000

<210> 355<210> 355

<400> 355<400> 355

000000

<210> 356<210> 356

<400> 356<400> 356

000000

<210> 357<210> 357

<400> 357<400> 357

000000

<210> 358<210> 358

<400> 358<400> 358

000000

<210> 359<210> 359

<400> 359<400> 359

000000

<210> 360<210> 360

<400> 360<400> 360

000000

<210> 361<210> 361

<400> 361<400> 361

000000

<210> 362<210> 362

<400> 362<400> 362

000000

<210> 363<210> 363

<400> 363<400> 363

000000

<210> 364<210> 364

<400> 364<400> 364

000000

<210> 365<210> 365

<400> 365<400> 365

000000

<210> 366<210> 366

<400> 366<400> 366

000000

<210> 367<210> 367

<400> 367<400> 367

000000

<210> 368<210> 368

<400> 368<400> 368

000000

<210> 369<210> 369

<400> 369<400> 369

000000

<210> 370<210> 370

<400> 370<400> 370

000000

<210> 371<210> 371

<400> 371<400> 371

000000

<210> 372<210> 372

<400> 372<400> 372

000000

<210> 373<210> 373

<400> 373<400> 373

000000

<210> 374<210> 374

<400> 374<400> 374

000000

<210> 375<210> 375

<400> 375<400> 375

000000

<210> 376<210> 376

<400> 376<400> 376

000000

<210> 377<210> 377

<400> 377<400> 377

000000

<210> 378<210> 378

<400> 378<400> 378

000000

<210> 379<210> 379

<400> 379<400> 379

000000

<210> 380<210> 380

<211> 4374<211> 4374

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 380<400> 380

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc

60 60

accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg

120 120

ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180 180

acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240 240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat

300 300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360 360

ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg

420 420

gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg

480 480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat

540 540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg

660 660

tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat

720 720

gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc

780 780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc

840 840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900 900

aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg

960 960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag

10201020

gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag

10801080

gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat

11401140

gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

12601260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

13201320

aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

13801380

atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg

14401440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact

15001500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc

15601560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc

16201620

accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg

16801680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

17401740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag

18001800

aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg

18601860

cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg

19201920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

19801980

attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag

20402040

atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc

21002100

atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc

21602160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac

22202220

agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc

22802280

ttcagccaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg ttcagccaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg

23402340

cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag cagtctgacc aggagagat tgactatgat gacaccatct ctgtggagat gaagaaggag

24002400

gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc

24602460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc

25202520

catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc

25802580

caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac

26402640

ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc

27002700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac

27602760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac

28202820

ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg

28802880

gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg

29402940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag

30003000

tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg

30603060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac

31203120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc

31803180

caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc

32403240

atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg

33003300

tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc

33603360

tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg

34203420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat caggacttc

34803480

cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac

35403540

tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

36003600

ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc ctggccccca tgatcatcca tggcatcaag acccagggg ccaggcagaa gttcagcagc

36603660

ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac

37203720

aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc

37803780

aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac

38403840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc

39003900

atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac

39603960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg

40204020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag

40804080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg

41404140

tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc

42004200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac

42604260

agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac

43204320

cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga

43744374

<210> 381<210> 381

<211> 4374<211> 4374

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 381<400> 381

atgcagattg agctgagcac ctgcttcttc ctgtgtctgc tgaggttctg cttctctgcc atgcagattg agctgagcac ctgcttcttc ctgtgtctgc tgaggttctg cttctctgcc

60 60

accaggaggt attacctggg ggctgtggag ctgagctggg actatatgca gtctgacctg accaggaggt attacctggg ggctgtggag ctgagctggg actatatgca gtctgacctg

120 120

ggggagctgc ctgtggatgc taggttcccc cccagggtgc ccaagagctt cccctttaac ggggagctgc ctgtggatgc taggttcccc cccagggtgc ccaagagctt cccctttaac

180 180

acttctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acttctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240 240

gccaagccca ggcccccctg gatggggctg ctggggccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatggggctg ctggggccca ccatccaggc tgaggtgtat

300 300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360 360

ggggtgagct actggaaggc ttctgagggg gctgagtatg atgaccagac tagccagagg ggggtgagct actggaaggc ttctgagggg gctgagtatg atgaccagac tagccagagg

420 420

gagaaggagg atgacaaggt gtttcctggg ggcagccata cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gtttcctggg ggcagccata cctatgtgtg gcaggtgctg

480 480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgtctcat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgtctcat

540 540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ctctgctggt gtgtagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ctctgctggt gtgtagggag

600 600

ggcagcctgg ctaaggaaaa gacccagacc ctgcataagt ttatcctgct gtttgctgtg ggcagcctgg ctaaggaaaa gacccagacc ctgcataagt ttatcctgct gtttgctgtg

660 660

tttgatgagg gcaagagctg gcactctgag accaagaaca gcctgatgca ggatagggat tttgatgagg gcaagagctg gcactctgag accaagaaca gcctgatgca ggatagggat

720 720

gctgcctctg ccagggcttg gcctaagatg cacactgtga atgggtatgt gaataggagc gctgcctctg ccagggcttg gcctaagatg cacactgtga atgggtatgt gaataggagc

780 780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tgggatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tgggatgggc

840 840

accacccctg aggtccatag catcttcctg gagggccaca ctttcctggt gaggaaccac accacccctg aggtccatag catcttcctg gagggccaca ctttcctggt gaggaaccac

900 900

agacaggcct ctctggagat ctctcccatc accttcctga ctgctcagac tctgctgatg agacaggcct ctctggagat ctctcccatc accttcctga ctgctcagac tctgctgatg

960 960

gacctgggcc agttcctgct gttttgccat attagcagcc accagcatga tgggatggag gacctgggcc agttcctgct gttttgccat attagcagcc accagcatga tgggatggag

10201020

gcctatgtga aggtggatag ctgccctgag gagcctcagc tgaggatgaa gaacaatgag gcctatgtga aggtggatag ctgccctgag gagcctcagc tgaggatgaa gaacaatgag

10801080

gaggctgaag actatgatga tgacctgact gattctgaga tggatgtggt gaggtttgat gaggctgaag actatgatga tgacctgact gattctgaga tggatgtggt gaggtttgat

11401140

gatgacaata gccccagctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc gatgacaata gccccagctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc

12001200

tgggtgcact acattgctgc tgaggaagag gactgggact atgctcccct ggtgctggcc tgggtgcact acattgctgc tgaggaagag gactgggact atgctcccct ggtgctggcc

12601260

cctgatgata ggtcttataa gagccagtac ctgaacaatg ggccccagag gattggcagg cctgatgata ggtcttataa gagccagtac ctgaacaatg ggccccagag gattggcagg

13201320

aagtacaaga aggtgaggtt catggcctac actgatgaaa ccttcaaaac cagggaggcc aagtacaaga aggtgaggtt catggcctac actgatgaaa ccttcaaaac cagggaggcc

13801380

attcagcatg agtctggcat cctgggccct ctgctgtatg gggaggtggg ggacaccctg attcagcatg agtctggcat cctgggccct ctgctgtatg gggaggtggg ggacaccctg

14401440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctatcctca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctatcctca tggcatcact

15001500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaagacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaagacttc

15601560

cccatcctgc ctggggagat ctttaagtat aagtggactg tgactgtgga ggatggccct cccatcctgc ctggggagat ctttaagtat aagtggactg tgactgtgga ggatggccct

16201620

accaagtctg accccaggtg tctgaccagg tactattcta gctttgtgaa catggagagg accaagtctg accccaggtg tctgaccagg tactattcta gctttgtgaa catggagagg

16801680

gacctggcct ctggcctgat tgggcccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tgggcccctg ctgatctgct acaaggagtc tgtggaccag

17401740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttttctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttttctgt gtttgatgag

18001800

aataggagct ggtacctgac tgagaacatc cagaggtttc tgcccaatcc tgctggggtg aataggagct ggtacctgac tgagaacatc cagaggtttc tgcccaatcc tgctggggtg

18601860

cagctggagg atcctgagtt ccaggccagc aatatcatgc atagcatcaa tggctatgtg cagctggagg atcctgagtt ccaggccagc aatatcatgc atagcatcaa tggctatgtg

19201920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

19801980

attggggccc agactgactt tctgtctgtg ttcttttctg gctatacctt caagcacaag attggggccc agactgactt tctgtctgtg ttcttttctg gctatacctt caagcacaag

20402040

atggtgtatg aggataccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggataccct gaccctgttc cccttctctg gggagactgt gttcatgagc

21002100

atggagaatc ctgggctgtg gatcctgggg tgccacaact ctgattttag gaacaggggg atggagaatc ctgggctgtg gatcctgggg tgccacaact ctgattttag gaacaggggg

21602160

atgactgccc tgctgaaggt gtctagctgt gataagaaca ctggggacta ctatgaggac atgactgccc tgctgaaggt gtctagctgt gataagaaca ctggggacta ctatgaggac

22202220

agctatgagg acatttctgc ttatctgctg tctaagaata atgccattga gcccagaagc agctatgagg acatttctgc ttatctgctg tctaagaata atgccattga gcccagaagc

22802280

ttcagccaga atccccctgt gctgaagaga catcagaggg agatcaccag aactaccctg ttcagccaga atccccctgt gctgaagaga catcagaggg agatcaccag aactaccctg

23402340

cagtctgatc aggaggagat tgactatgat gacactatct ctgtggagat gaagaaggag cagtctgatc aggaggat tgactatgat gacactatct ctgtggagat gaagaaggag

24002400

gactttgaca tctatgatga ggatgagaat cagtctccca ggagctttca gaagaagacc gactttgaca tctatgatga ggatgagaat cagtctccca ggagctttca gaagaagacc

24602460

agacattact tcattgctgc tgtggagagg ctgtgggact atggcatgag ctctagccct agacattact tcattgctgc tgtggagagg ctgtgggact atggcatgag ctctagccct

25202520

catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc

25802580

caggaattca ctgatggcag cttcacccag cccctgtaca ggggggagct gaatgagcac caggaattca ctgatggcag cttcacccag cccctgtaca ggggggagct gaatgagcac

26402640

ctgggcctgc tggggcctta tatcagggct gaggtggagg ataatattat ggtgactttc ctgggcctgc tggggcctta tatcagggct gaggtggagg ataatattat ggtgactttc

27002700

aggaaccagg ccagcaggcc ctactctttc tatagcagcc tgatctctta tgaggaggat aggaaccagg ccagcaggcc ctactctttc tatagcagcc tgatctctta tgaggaggat

27602760

cagaggcagg gggctgagcc taggaagaac tttgtgaagc ccaatgagac taagacctac cagaggcagg gggctgagcc taggaagaac tttgtgaagc ccaatgagac taagacctac

28202820

ttctggaagg tccagcacca catggcccct accaaggatg agtttgactg caaggcctgg ttctggaagg tccagcacca catggcccct accaaggatg agtttgactg caaggcctgg

28802880

gcctatttct ctgatgtgga tctggagaag gatgtccatt ctgggctgat tggccccctg gcctatttct ctgatgtgga tctggagaag gatgtccatt ctgggctgat tggccccctg

29402940

ctggtgtgcc acactaacac tctgaatcct gcccatggca ggcaggtgac tgtccaggag ctggtgtgcc acactaacac tctgaatcct gcccatggca ggcaggtgac tgtccaggag

30003000

tttgccctgt tcttcactat ctttgatgag accaagagct ggtactttac tgagaacatg tttgccctgt tcttcactat ctttgatgag accaagagct ggtactttac tgagaacatg

30603060

gagaggaact gcagagctcc ttgcaatatt cagatggagg accccacctt caaggagaat gagaggaact gcagagctcc ttgcaatatt cagatggagg accccacctt caaggagaat

31203120

tacaggttcc atgccattaa tgggtacatc atggacaccc tgcctggcct ggtgatggct tacaggttcc atgccattaa tgggtacatc atggacaccc tgcctggcct ggtgatggct

31803180

caggaccaga ggatcaggtg gtacctgctg agcatgggct ctaatgagaa tatccacagc caggaccaga ggatcaggtg gtacctgctg agcatgggct ctaatgagaa tatccacagc

32403240

atccacttct ctgggcatgt gttcactgtg aggaagaagg aggagtacaa gatggctctg atccacttct ctgggcatgt gttcactgtg aggaagaagg aggagtacaa gatggctctg

33003300

tataatctgt accctggggt gtttgaaact gtggagatgc tgccctctaa ggctggcatc tataatctgt accctggggt gtttgaaact gtggagatgc tgccctctaa ggctggcatc

33603360

tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg

34203420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat caggacttc

34803480

cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactat cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactat

35403540

tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

36003600

ctggccccca tgatcattca tggcatcaag acccaggggg ccaggcagaa gttcagctct ctggccccca tgatcattca tggcatcaag acccagggg ccaggcagaa gttcagctct

36603660

ctgtacatct ctcagttcat catcatgtac tctctggatg ggaagaagtg gcagacctac ctgtacatct ctcagttcat catcatgtac tctctggatg ggaagaagtg gcagacctac

37203720

aggggcaaca gcactggcac cctgatggtg ttctttggga atgtggactc ttctggcatc aggggcaaca gcactggcac cctgatggtg ttctttggga atgtggactc ttctggcatc

37803780

aagcacaaca tcttcaatcc ccccatcatt gctaggtata ttaggctgca tcccacccac aagcacaaca tcttcaatcc ccccatcatt gctaggtata ttaggctgca tcccacccac

38403840

tacagcatca ggtctaccct gaggatggag ctgatgggct gtgacctgaa ctcttgcagc tacagcatca ggtctaccct gaggatggag ctgatgggct gtgacctgaa ctcttgcagc

39003900

atgcccctgg gcatggagtc taaggccatc tctgatgccc agattactgc cagcagctac atgcccctgg gcatggagtc taaggccatc tctgatgccc agattactgc cagcagctac

39603960

ttcaccaaca tgtttgccac ctggagcccc tctaaggcca ggctgcatct gcaggggagg ttcaccaaca tgtttgccac ctggagcccc tctaaggcca ggctgcatct gcaggggagg

40204020

agcaatgcct ggaggcctca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag agcaatgcct ggaggcctca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag

40804080

aagaccatga aggtgactgg ggtgaccacc cagggggtca agagcctgct gaccagcatg aagaccatga aggtgactgg ggtgaccacc cagggggtca agagcctgct gaccagcatg

41404140

tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac tctgttcttt tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac tctgttcttt

42004200

cagaatggga aggtgaaggt gtttcagggc aatcaggact ctttcacccc tgtggtgaac cagaatggga aggtgaaggt gtttcagggc aatcaggact ctttcacccc tgtggtgaac

42604260

agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagtc ttgggtgcat agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagtc ttgggtgcat

43204320

cagattgccc tgaggatgga ggtgctgggc tgtgaggctc aggatctgta ctga cagattgccc tgaggatgga ggtgctgggc tgtgaggctc aggatctgta ctga

43744374

<210> 382<210> 382

<211> 4374<211> 4374

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 382<400> 382

atgcagatcg agctctccac ctgcttcttt ctgtgcctgt tgagattctg cttcagcgcc atgcagatcg agctctccac ctgcttcttt ctgtgcctgt tgagattctg cttcagcgcc

60 60

accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg

120 120

ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180 180

acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240 240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat

300 300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360 360

ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg

420 420

gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg

480 480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat

540 540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg

660 660

tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat

720 720

gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc

780 780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc

840 840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900 900

aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg

960 960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag

10201020

gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag

10801080

gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat

11401140

gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

12601260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

13201320

aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

13801380

atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg

14401440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact

15001500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc

15601560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc

16201620

accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg

16801680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

17401740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag

18001800

aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg

18601860

cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg

19201920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

19801980

attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag

20402040

atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc

21002100

atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc

21602160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac

22202220

agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc

22802280

ttcagccaga atccacccgt ccttaagcgc catcagcgcg agatcaccag gaccaccctg ttcagccaga atccacccgt ccttaagcgc catcagcgcg agatcaccag gaccaccctg

23402340

cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag cagtctgacc aggagagat tgactatgat gacaccatct ctgtggagat gaagaaggag

24002400

gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc

24602460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc

25202520

catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc

25802580

caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac

26402640

ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc

27002700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac

27602760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac

28202820

ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg

28802880

gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg

29402940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag

30003000

tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg

30603060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac

31203120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc

31803180

caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc

32403240

atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg

33003300

tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc

33603360

tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg

34203420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat caggacttc

34803480

cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac

35403540

tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

36003600

ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc ctggccccca tgatcatcca tggcatcaag acccagggg ccaggcagaa gttcagcagc

36603660

ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac

37203720

aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc

37803780

aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac

38403840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc

39003900

atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac

39603960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcatct gcagggcagg ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcatct gcagggcagg

40204020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag

40804080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg

41404140

tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc

42004200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac

42604260

agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac

43204320

cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga

43744374

<210> 383<210> 383

<211> 7056<211> 7056

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 383<400> 383

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc

60 60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc

120 120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac

180 180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc

240 240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat

300 300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt

360 360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg

420 420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg

480 480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat

540 540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa

600 600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta

660 660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat

720 720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct gctgcatctg ctcggggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct

780 780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc

840 840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat

900 900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg

960 960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa

10201020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa

10801080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat

11401140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact

12001200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc

12601260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg

13201320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct

13801380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg

14401440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact

15001500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt gatgtccgtc ctttgtattc aaggatta ccaaaaggtg taaaacattt gaaggatttt

15601560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca

16201620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga

16801680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa

17401740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag

18001800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg

18601860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt

19201920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc

19801980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa

20402040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg

21002100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc

21602160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac

22202220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc

22802280

ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt

23402340

ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa

24002400

atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat

24602460

gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca

25202520

cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc

25802580

catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag

26402640

aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca

27002700

tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca

27602760

agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta

28202820

tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa

28802880

aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga

29402940

aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct

30003000

gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac

30603060

aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta

31203120

attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa

31803180

gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta

32403240

aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa

33003300

gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc

33603360

ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg

34203420

caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag

34803480

aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta

35403540

ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat

36003600

ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag

36603660

gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag

37203720

aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac

37803780

ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca

38403840

aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga

39003900

aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca

39603960

agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca

40204020

ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc

40804080

aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag

41404140

aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct

42004200

caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct

42604260

atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat atatatctga cccaggtcct attccaagac aactcttctc atcttccagc agcatcttat

43204320

agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat

43804380

aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc

44404440

ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg

45004500

aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat

45604560

cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg

46204620

gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct

46804680

ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta

47404740

ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa

48004800

tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg

48604860

aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa

49204920

atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca

49804980

gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa

50405040

attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat

51005100

gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct

51605160

gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg

52205220

gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc

52805280

tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca

53405340

tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt

54005400

ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa

54605460

cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat

55205520

catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt catatggcac cccataaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt

55805580

gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg cccacactaac

56405640

acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc

57005700

atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct

57605760

ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc

58205820

aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga

58805880

tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat

59405940

gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt

60006000

gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt

60606060

attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt

61206120

cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga

61806180

caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc

62406240

tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt

63006300

cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt cacggcatca agacccagg tgcccgtcag aagttctcca gcctctacat ctctcagttt

63606360

atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga

64206420

accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac

64806480

cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact

65406540

cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag

66006600

agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc

66606660

acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct

67206720

caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca

67806780

ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc

68406840

atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag

69006900

gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta

69606960

ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg

70207020

gaggttctgg gctgcgaggc acaggacctc tactga gaggttctgg gctgcgaggc acaggacctc tactga

70567056

<210> 384<210> 384

<211> 4425<211> 4425

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 384<400> 384

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc

60 60

accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg

120 120

ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180 180

acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240 240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat

300 300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360 360

ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg

420 420

gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg

480 480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat

540 540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg

660 660

tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat

720 720

gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc

780 780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc

840 840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900 900

aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg

960 960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag

10201020

gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag

10801080

gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat

11401140

gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

12601260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

13201320

aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

13801380

atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg

14401440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact

15001500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc

15601560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc

16201620

accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg

16801680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

17401740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag

18001800

aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg

18601860

cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg

19201920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

19801980

attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag

20402040

atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc

21002100

atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc

21602160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac

22202220

agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc

22802280

ttcagccaga atgccactaa tgtgtctaac aacagcaaca ccagcaatga cagcaatgtg ttcagccaga atgccactaa tgtgtctaac aacagcaaca ccagcaatga cagcaatgtg

23402340

tctcccccag tgctgaagag gcaccagagg gagatcacca ggaccaccct gcagtctgac tctcccccag tgctgaagag gcaccagagg gagatcacca ggaccaccct gcagtctgac

24002400

caggaggaga ttgactatga tgacaccatc tctgtggaga tgaagaagga ggactttgac caggaggaga ttgactatga tgacaccatc tctgtggaga tgaagaagga ggactttgac

24602460

atctacgacg aggacgagaa ccagagcccc aggagcttcc agaagaagac caggcactac atctacgacg aggacgagaa cccagcccc aggagcttcc agaagaagac caggcactac

25202520

ttcattgctg ctgtggagag gctgtgggac tatggcatga gcagcagccc ccatgtgctg ttcattgctg ctgtggagag gctgtgggac tatggcatga gcagcagccc ccatgtgctg

25802580

aggaacaggg cccagtctgg ctctgtgccc cagttcaaga aggtggtgtt ccaggagttc aggaacaggg cccagtctgg ctctgtgccc cagttcaaga aggtggtgtt ccaggagttc

26402640

actgatggca gcttcaccca gcccctgtac agaggggagc tgaatgagca cctgggcctg actgatggca gcttcaccca gcccctgtac agaggggagc tgaatgagca cctgggcctg

27002700

ctgggcccct acatcagggc tgaggtggag gacaacatca tggtgacctt caggaaccag ctgggcccct acatcagggc tgaggtggag gacaacatca tggtgacctt caggaaccag

27602760

gccagcaggc cctacagctt ctacagcagc ctgatcagct atgaggagga ccagaggcag gccagcaggc cctacagctt ctacagcagc ctgatcagct atgaggagga ccagaggcag

28202820

ggggctgagc ccaggaagaa ctttgtgaag cccaatgaaa ccaagaccta cttctggaag ggggctgagc ccaggaagaa ctttgtgaag cccaatgaaa ccaagaccta cttctggaag

28802880

gtgcagcacc acatggcccc caccaaggat gagtttgact gcaaggcctg ggcctacttc gtgcagcacc acatggcccc caccaaggat gagtttgact gcaaggcctg ggcctacttc

29402940

tctgatgtgg acctggagaa ggatgtgcac tctggcctga ttggccccct gctggtgtgc tctgatgtgg acctggagaa ggatgtgcac tctggcctga ttggccccct gctggtgtgc

30003000

cacaccaaca ccctgaaccc tgcccatggc aggcaggtga ctgtgcagga gtttgccctg cacaccaaca ccctgaaccc tgcccatggc aggcaggtga ctgtgcagga gtttgccctg

30603060

ttcttcacca tctttgatga aaccaagagc tggtacttca ctgagaacat ggagaggaac ttcttcacca tctttgatga aaccaagagc tggtacttca ctgagaacat ggagaggaac

31203120

tgcagggccc cctgcaacat ccagatggag gaccccacct tcaaggagaa ctacaggttc tgcagggccc cctgcaacat ccagatggag gaccccacct tcaaggagaa ctacaggttc

31803180

catgccatca atggctacat catggacacc ctgcctggcc tggtgatggc ccaggaccag catgccatca atggctacat catggacacc ctgcctggcc tggtgatggc ccaggaccag

32403240

aggatcaggt ggtacctgct gagcatgggc agcaatgaga acatccacag catccacttc aggatcaggt ggtacctgct gagcatgggc agcaatgaga acatccacag catccacttc

33003300

tctggccatg tgttcactgt gaggaagaag gaggagtaca agatggccct gtacaacctg tctggccatg tgttcactgt gaggaagaag gaggagtaca agatggccct gtacaacctg

33603360

taccctgggg tgtttgagac tgtggagatg ctgcccagca aggctggcat ctggagggtg taccctgggg tgtttgagac tgtggagatg ctgcccagca aggctggcat ctggagggtg

34203420

gagtgcctga ttggggagca cctgcatgct ggcatgagca ccctgttcct ggtgtacagc gagtgcctga ttggggagca cctgcatgct ggcatgagca ccctgttcct ggtgtacagc

34803480

aacaagtgcc agacccccct gggcatggcc tctggccaca tcagggactt ccagatcact aacaagtgcc agacccccct gggcatggcc tctggccaca tcagggactt ccagatcact

35403540

gcctctggcc agtatggcca gtgggccccc aagctggcca ggctgcacta ctctggcagc gcctctggcc agtatggcca gtgggccccc aagctggcca ggctgcacta ctctggcagc

36003600

atcaatgcct ggagcaccaa ggagcccttc agctggatca aggtggacct gctggccccc atcaatgcct ggagcaccaa ggagcccttc agctggatca aggtggacct gctggccccc

36603660

atgatcatcc atggcatcaa gacccagggg gccaggcaga agttcagcag cctgtacatc atgatcatcc atggcatcaa gacccagggg gccaggcaga agttcagcag cctgtacatc

37203720

agccagttca tcatcatgta cagcctggat ggcaagaagt ggcagaccta caggggcaac agccagttca tcatcatgta cagcctggat ggcaagaagt ggcagaccta caggggcaac

37803780

agcactggca ccctgatggt gttctttggc aatgtggaca gctctggcat caagcacaac agcactggca ccctgatggt gttctttggc aatgtggaca gctctggcat caagcacaac

38403840

atcttcaacc cccccatcat tgccagatac atcaggctgc accccaccca ctacagcatc atcttcaacc cccccatcat tgccagatac atcaggctgc accccaccca ctacagcatc

39003900

aggagcaccc tgaggatgga gctgatgggc tgtgacctga acagctgcag catgcccctg aggagcaccc tgaggatgga gctgatgggc tgtgacctga acagctgcag catgcccctg

39603960

ggcatggaga gcaaggccat ctctgatgcc cagatcactg ccagcagcta cttcaccaac ggcatggaga gcaaggccat ctctgatgcc cagatcactg ccagcagcta cttcaccaac

40204020

atgtttgcca cctggagccc cagcaaggcc aggctgcacc tgcagggcag gagcaatgcc atgtttgcca cctggagccc cagcaaggcc aggctgcacc tgcagggcag gagcaatgcc

40804080

tggaggcccc aggtcaacaa ccccaaggag tggctgcagg tggacttcca gaagaccatg tggaggcccc aggtcaacaa ccccaaggag tggctgcagg tggacttcca gaagaccatg

41404140

aaggtgactg gggtgaccac ccagggggtg aagagcctgc tgaccagcat gtatgtgaag aaggtgactg gggtgaccac ccagggggtg aagagcctgc tgaccagcat gtatgtgaag

42004200

gagttcctga tcagcagcag ccaggatggc caccagtgga ccctgttctt ccagaatggc gagttcctga tcagcagcag ccaggatggc caccagtgga ccctgttctt ccagaatggc

42604260

aaggtgaagg tgttccaggg caaccaggac agcttcaccc ctgtggtgaa cagcctggac aaggtgaagg tgttccaggg caaccaggac agcttcaccc ctgtggtgaa cagcctggac

43204320

ccccccctgc tgaccagata cctgaggatt cacccccaga gctgggtgca ccagattgcc ccccccctgc tgaccagata cctgaggatt cacccccaga gctgggtgca ccagattgcc

43804380

ctgaggatgg aggtgctggg ctgtgaggcc caggacctgt actga ctgaggatgg aggtgctggg ctgtgaggcc caggacctgt actga

44254425

<210> 385<210> 385

<211> 1474<211> 1474

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полипептидpolypeptide

<400> 385<400> 385

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 151 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu SerCys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30 20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala ArgTrp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45 35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val ValPhe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60 50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn IleTyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 8065 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile GlnAla Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95 85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala SerAla Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110 100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala SerHis Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125 115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu AspGlu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140 130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val LeuAsp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr SerLys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175 165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu IleTyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190 180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys ThrGly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205 195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu GlyGln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220 210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg AspLys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly TyrAla Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255 245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser ValVal Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270 260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser IleTyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285 275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala SerPhe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300 290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu MetLeu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln HisAsp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335 325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu ProAsp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350 340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp AspGln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365 355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn SerLeu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380 370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys ThrPro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala ProTrp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415 405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu AsnLeu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430 420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe MetAsn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445 435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His GluAla Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460 450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr LeuSer Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr ProLeu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495 485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro LysHis Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510 500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile PheGly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525 515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser AspLys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540 530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu ArgPro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys GluAsp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575 565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn ValSer Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590 580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr GluIle Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605 595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu AspAsn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620 610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr ValPro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr TrpPhe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655 645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe PheTyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670 660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu ThrSer Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685 675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn ProLeu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700 690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg GlyGly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly AspMet Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735 725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser LysTyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750 740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ala Thr Asn ValAsn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ala Thr Asn Val

755 760 765 755 760 765

Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val Ser Pro Pro ValSer Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val Ser Pro Pro Val

770 775 780 770 775 780

Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser AspLeu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp

785 790 795 800785 790 795 800

Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys LysGln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys

805 810 815 805 810 815

Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg SerGlu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser

820 825 830 820 825 830

Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg LeuPhe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu

835 840 845 835 840 845

Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg AlaTrp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala

850 855 860 850 855 860

Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu PheGln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe

865 870 875 880865 870 875 880

Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn GluThr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu

885 890 895 885 890 895

His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp AsnHis Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn

900 905 910 900 905 910

Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe TyrIle Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr

915 920 925 915 920 925

Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu ProSer Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro

930 935 940 930 935 940

Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp LysArg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys

945 950 955 960945 950 955 960

Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys AlaVal Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala

965 970 975 965 970 975

Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser GlyTrp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly

980 985 990 980 985 990

Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro AlaLeu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala

995 1000 1005 995 1000 1005

His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe ThrHis Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr

1010 1015 1020 1010 1015 1020

Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met GluIle Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu

1025 1030 1035 1025 1030 1035

Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro ThrArg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr

1040 1045 1050 1040 1045 1050

Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile MetPhe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met

1055 1060 1065 1055 1060 1065

Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile ArgAsp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg

1070 1075 1080 1070 1075 1080

Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser IleTrp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile

1085 1090 1095 1085 1090 1095

His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu TyrHis Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr

1100 1105 1110 1100 1105 1110

Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr ValLys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val

1115 1120 1125 1115 1120 1125

Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys LeuGlu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu

1130 1135 1140 1130 1135 1140

Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu ValIle Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val

1145 1150 1155 1145 1150 1155

Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly HisTyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His

1160 1165 1170 1160 1165 1170

Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln TrpIle Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp

1175 1180 1185 1175 1180 1185

Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn AlaAla Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala

1190 1195 1200 1190 1195 1200

Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu LeuTrp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu

1205 1210 1215 1205 1210 1215

Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg GlnAla Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln

1220 1225 1230 1220 1225 1230

Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr SerLys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser

1235 1240 1245 1235 1240 1245

Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr GlyLeu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly

1250 1255 1260 1250 1255 1260

Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile LysThr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys

1265 1270 1275 1265 1270 1275

His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg LeuHis Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu

1280 1285 1290 1280 1285 1290

His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu LeuHis Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu

1295 1300 1305 1295 1300 1305

Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met GluMet Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu

1310 1315 1320 1310 1315 1320

Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr PheSer Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe

1325 1330 1335 1325 1330 1335

Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu HisThr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His

1340 1345 1350 1340 1345 1350

Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn ProLeu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro

1355 1360 1365 1355 1360 1365

Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val ThrLys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr

1370 1375 1380 1370 1375 1380

Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met TyrGly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr

1385 1390 1395 1385 1390 1395

Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln TrpVal Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp

1400 1405 1410 1400 1405 1410

Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly AsnThr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn

1415 1420 1425 1415 1420 1425

Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro LeuGln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu

1430 1435 1440 1430 1435 1440

Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His GlnLeu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln

1445 1450 1455 1445 1450 1455

Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp LeuIle Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu

1460 1465 1470 1460 1465 1470

TyrTyr

<210> 386<210> 386

<211> 5052<211> 5052

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 386<400> 386

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc

60 60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc

120 120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac

180 180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc

240 240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat

300 300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt

360 360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg

420 420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg

480 480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat

540 540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa

600 600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta

660 660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat

720 720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct gctgcatctg ctcggggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct

780 780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc

840 840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat

900 900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg

960 960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa

10201020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa

10801080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat

11401140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact

12001200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc

12601260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg

13201320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct

13801380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg

14401440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact

15001500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt gatgtccgtc ctttgtattc aaggatta ccaaaaggtg taaaacattt gaaggatttt

15601560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca

16201620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga

16801680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa

17401740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag

18001800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg

18601860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt

19201920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc

19801980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa

20402040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg

21002100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc

21602160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac

22202220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc

22802280

ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt

23402340

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa

24002400

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca

24602460

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca

25202520

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc

25802580

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat

26402640

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc

27002700

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat

27602760

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac

28202820

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg

28802880

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt

29402940

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa

30003000

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg

30603060

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat

31203120

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct

31803180

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct

32403240

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg

33003300

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt

33603360

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg

34203420

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt

34803480

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat

35403540

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg

36003600

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc

36603660

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat

37203720

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata

37803780

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat

38403840

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc

39003900

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac

39603960

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg

40204020

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag agtaatgcct ggagaacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag

40804080

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg

41404140

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt

42004200

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac

42604260

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac

43204320

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact

43804380

cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc

44404440

cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg

45004500

gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag

45604560

gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc

46204620

agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc

46804680

tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc

47404740

cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc

48004800

agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtgggagagc agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtggggagagc

48604860

aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc

49204920

ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc

49804980

tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg

50405040

tctccgggta aa tctccgggta aa

50525052

<210> 387<210> 387

<211> 4374<211> 4374

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 387<400> 387

atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc

60 60

accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg

120 120

ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac

180 180

acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc

240 240

gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac

300 300

gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg

360 360

ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga

420 420

gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg

480 480

aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac

540 540

gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa

600 600

ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg

660 660

ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat

720 720

gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc

780 780

ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc

840 840

acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac

900 900

agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg

960 960

gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa

10201020

gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag

10801080

gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac

11401140

gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc

12601260

cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg

13201320

aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc

13801380

atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg

14401440

ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc

15001500

gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc

15601560

cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc

16201620

accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc

16801680

gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag

17401740

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag

18001800

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg

18601860

caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg

19201920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc

19801980

attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag

20402040

atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc

21002100

atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc

21602160

atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac

22202220

agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc

22802280

ttcagccaga atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg ttcagccaga atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg

23402340

cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa

24002400

gatttcgaca tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc gatttcgaca tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc

24602460

cggcactact tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cggcactact tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct

25202520

cacgtgctga gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc cacgtgctga gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc

25802580

caagagttca ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat caagagttca ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat

26402640

ctgggcctgc tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc ctgggcctgc tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc

27002700

cggaatcagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cggaatcagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac

27602760

cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac

28202820

ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg

28802880

gcctacttct ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg

29402940

cttgtgtgcc acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag cttgtgtgcc acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag

30003000

ttcgccctgt tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg ttcgccctgt tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg

30603060

gaacggaact gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac gaacggaact gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac

31203120

taccggttcc acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc taccggttcc acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc

31803180

caggatcaga gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc caggatcaga gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc

32403240

atccacttca gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg atccacttca gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg

33003300

tacaatctgt accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tacaatctgt accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt

33603360

tggagagtgg aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg tggagagtgg aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg

34203420

gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc

34803480

cagatcaccg cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac cagatcaccg cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac

35403540

agcggcagca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg agcggcagca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg

36003600

ctggctccca tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc ctggctccca tgatcatcca cggaatcaag acccagggcg cgacagaa gttcagcagc

36603660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac

37203720

agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt

37803780

aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac

38403840

tacagcatcc ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct tacagcatcc ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct

39003900

atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac

39603960

ttcaccaaca tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga ttcaccaaca tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga

40204020

agcaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa agcaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa

40804080

aagaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg aagaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg

41404140

tacgtgaaag agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc tacgtgaaag agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc

42004200

cagaacggca aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat cagaacggca aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat

42604260

tctctggacc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac tctctggacc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac

43204320

cagatcgctc tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctag cagatcgctc tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctag

43744374

<210> 388<210> 388

<211> 4980<211> 4980

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 388<400> 388

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc

60 60

acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120 120

ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac

180 180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240 240

gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300 300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360 360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc

420 420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480 480

aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac

540 540

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag

600 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660 660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac

720 720

gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc

780 780

ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc

840 840

accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac

900 900

cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960 960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag

10201020

gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag

10801080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac

11401140

gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc

12601260

cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc

13201320

aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc

13801380

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg

14401440

ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc

15001500

gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc

15601560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc

16201620

accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc

16801680

gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag gacctggcca gcggcctgat cggccccctg ctgatctgct acaagggagag cgtggaccag

17401740

cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag

18001800

aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg

18601860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

19201920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

19801980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

20402040

atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

21002100

atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc

21602160

atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac

22202220

agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc

22802280

ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc

23402340

cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag

24002400

atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac

24602460

ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc

25202520

cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg

25802580

caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag

26402640

aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc

27002700

agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc

27602760

agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg

28202820

ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag

28802880

aacaacgaca gcaagctgcc ccccgtgctg aagcgccacc agcgcgagat cacccgcacc aacaacgaca gcaagctgcc ccccgtgctg aagcgccacc agcgcgagat cacccgcacc

29402940

accctgcaga gcgaccagga ggagatcgac tacgacgaca ccatcagcgt ggagatgaag accctgcaga gcgaccagga ggagatcgac tacgacgaca ccatcagcgt ggagatgaag

30003000

aaggaggact tcgacatcta cgacgaggac gagaaccaga gcccccgcag cttccagaag aaggaggact tcgacatcta cgacgaggac gagaaccaga gcccccgcag cttccagaag

30603060

aagacccgcc actacttcat cgccgccgtg gagcgcctgt gggactacgg catgagcagc aagacccgcc actacttcat cgccgccgtg gagcgcctgt gggactacgg catgagcagc

31203120

agcccccacg tgctgcgcaa ccgcgcccag agcggcagcg tgccccagtt caagaaggtg agcccccacg tgctgcgcaa ccgcgcccag agcggcagcg tgccccagtt caagaaggtg

31803180

gtgttccagg agttcaccga cggcagcttc acccagcccc tgtaccgcgg cgagctgaac gtgttccagg agttcaccga cggcagcttc acccagcccc tgtaccgcgg cgagctgaac

32403240

gagcacctgg gcctgctggg cccctacatc cgcgccgagg tggaggacaa catcatggtg gagcacctgg gcctgctggg cccctacatc cgcgccgagg tggaggacaa catcatggtg

33003300

accttccgca accaggccag ccgcccctac agcttctaca gcagcctgat cagctacgag accttccgca accaggccag ccgcccctac agcttctaca gcagcctgat cagctacgag

33603360

gaggaccagc gccagggcgc cgagccccgc aagaacttcg tgaagcccaa cgagaccaag gaggaccagc gccagggcgc cgagccccgc aagaacttcg tgaagcccaa cgagaccaag

34203420

acctacttct ggaaggtgca gcaccacatg gcccccacca aggacgagtt cgactgcaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggacgagtt cgactgcaag

34803480

gcctgggcct acttcagcga cgtggacctg gagaaggacg tgcacagcgg cctgatcggc gcctgggcct acttcagcga cgtggacctg gagaaggacg tgcacagcgg cctgatcggc

35403540

cccctgctgg tgtgccacac caacaccctg aaccccgccc acggccgcca ggtgaccgtg cccctgctgg tgtgccacac caacaccctg aaccccgccc acggccgcca ggtgaccgtg

36003600

caggagttcg ccctgttctt caccatcttc gacgagacca agagctggta cttcaccgag caggagttcg ccctgttctt caccatcttc gacgagacca agagctggta cttcaccgag

36603660

aacatggagc gcaactgccg cgccccctgc aacatccaga tggaggaccc caccttcaag aacatggagc gcaactgccg cgccccctgc aacatccaga tggaggaccc caccttcaag

37203720

gagaactacc gcttccacgc catcaacggc tacatcatgg acaccctgcc cggcctggtg gagaactacc gcttccacgc catcaacggc tacatcatgg acaccctgcc cggcctggtg

37803780

atggcccagg accagcgcat ccgctggtac ctgctgagca tgggcagcaa cgagaacatc atggcccagg accagcgcat ccgctggtac ctgctgagca tgggcagcaa cgagaacatc

38403840

cacagcatcc acttcagcgg ccacgtgttc accgtgcgca agaaggagga gtacaagatg cacagcatcc acttcagcgg ccacgtgttc accgtgcgca agaagggagga gtacaagatg

39003900

gccctgtaca acctgtaccc cggcgtgttc gagaccgtgg agatgctgcc cagcaaggcc gccctgtaca acctgtaccc cggcgtgttc gagaccgtgg agatgctgcc cagcaaggcc

39603960

ggcatctggc gcgtggagtg cctgatcggc gagcacctgc acgccggcat gagcaccctg ggcatctggc gcgtggagtg cctgatcggc gagcacctgc acgccggcat gagcaccctg

40204020

ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggccagcgg ccacatccgc ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggccagcgg ccacatccgc

40804080

gacttccaga tcaccgccag cggccagtac ggccagtggg cccccaagct ggcccgcctg gacttccaga tcaccgccag cggccagtac ggccagtggg cccccaagct ggcccgcctg

41404140

cactacagcg gcagcatcaa cgcctggagc accaaggagc ccttcagctg gatcaaggtg cactacagcg gcagcatcaa cgcctggagc accaaggagc ccttcagctg gatcaaggtg

42004200

gacctgctgg cccccatgat catccacggc atcaagaccc agggcgcccg ccagaagttc gacctgctgg cccccatgat catccacggc atcaagaccc agggcgcccg ccagaagttc

42604260

agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggcaa gaagtggcag agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggcaa gaagtggcag

43204320

acctaccgcg gcaacagcac cggcaccctg atggtgttct tcggcaacgt ggacagcagc acctaccgcg gcaacagcac cggcaccctg atggtgttct tcggcaacgt ggacagcagc

43804380

ggcatcaagc acaacatctt caaccccccc atcatcgccc gctacatccg cctgcacccc ggcatcaagc acaacatctt caaccccccc atcatcgccc gctacatccg cctgcacccc

44404440

acccactaca gcatccgcag caccctgcgc atggagctga tgggctgcga cctgaacagc acccactaca gcatccgcag caccctgcgc atggagctga tgggctgcga cctgaacagc

45004500

tgcagcatgc ccctgggcat ggagagcaag gccatcagcg acgcccagat caccgccagc tgcagcatgc ccctgggcat ggagagcaag gccatcagcg acgcccagat caccgccagc

45604560

agctacttca ccaacatgtt cgccacctgg agccccagca aggcccgcct gcacctgcaa agctacttca ccaacatgtt cgccacctgg agccccagca aggcccgcct gcacctgcaa

46204620

ggccgcagca acgcctggcg cccccaggtg aacaacccca aggagtggct gcaggtggac ggccgcagca acgcctggcg cccccaggtg aacaacccca aggagtggct gcaggtggac

46804680

ttccagaaga ccatgaaggt gaccggcgtg accacccagg gcgtgaagag cctgctgacc ttccagaaga ccatgaaggt gaccggcgtg accacccagg gcgtgaagag cctgctgacc

47404740

agcatgtacg tgaaggagtt cctgatcagc agcagccagg acggccacca gtggaccctg agcatgtacg tgaaggagtt cctgatcagc agcagccagg acggccacca gtggaccctg

48004800

ttcttccaga acggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccccgtg ttcttccaga acggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccccgtg

48604860

gtgaacagcc tggacccccc cctgctgacc cgctacctgc gcatccaccc ccagagctgg gtgaacagcc tggacccccc cctgctgacc cgctacctgc gcatccaccc ccagagctgg

49204920

gtgcaccaga tcgccctgcg catggaggtg ctgggctgcg aggcccagga cctgtactaa gtgcaccaga tcgccctgcg catggaggtg ctgggctgcg aggcccagga cctgtactaa

49804980

<210> 389<210> 389

<211> 7056<211> 7056

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 389<400> 389

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc

60 60

acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120 120

ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac

180 180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240 240

gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300 300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360 360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc

420 420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480 480

aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac

540 540

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag

600 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660 660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac

720 720

gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc

780 780

ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc

840 840

accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac

900 900

cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960 960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag

10201020

gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag

10801080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac

11401140

gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc

12601260

cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc

13201320

aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc

13801380

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg

14401440

ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc

15001500

gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc

15601560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc

16201620

accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc

16801680

gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag gacctggcca gcggcctgat cggccccctg ctgatctgct acaagggagag cgtggaccag

17401740

cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag

18001800

aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg

18601860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

19201920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

19801980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

20402040

atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

21002100

atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc

21602160

atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac

22202220

agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc

22802280

ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc

23402340

cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag

24002400

atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac

24602460

ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc

25202520

cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg

25802580

caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag

26402640

aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc

27002700

agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc

27602760

agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg

28202820

ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag

28802880

aacaacgaca gcaagctgct ggagagcggc ctgatgaaca gccaggagag cagctggggc aacaacgaca gcaagctgct ggagagcggc ctgatgaaca gccaggagag cagctggggc

29402940

aagaacgtga gcagcaccga gagcggcagg ctgttcaagg gcaagcgcgc ccacggcccc aagaacgtga gcagcaccga gagcggcagg ctgttcaagg gcaagcgcgc ccacggcccc

30003000

gccctgctga ccaaggacaa cgccctgttc aaggtgagca tcagcctgct gaagaccaac gccctgctga ccaaggacaa cgccctgttc aaggtgagca tcagcctgct gaagaccaac

30603060

aagaccagca acaacagcgc caccaaccgc aagacccaca tcgacggccc cagcctgctg aagaccagca acaacagcgc caccaaccgc aagacccaca tcgacggccc cagcctgctg

31203120

atcgagaaca gccccagcgt gtggcagaac atcctggaga gcgacaccga gttcaagaag atcgagaaca gccccagcgt gtggcagaac atcctggaga gcgacaccga gttcaagaag

31803180

gtgacccccc tgatccacga ccgcatgctg atggacaaga acgccaccgc cctgcgcctg gtgacccccc tgatccacga ccgcatgctg atggacaaga acgccaccgc cctgcgcctg

32403240

aaccacatga gcaacaagac caccagcagc aagaacatgg agatggtgca gcagaagaag aaccacatga gcaacaagac caccagcagc aagaacatgg agatggtgca gcagaagaag

33003300

gagggcccca tcccccccga cgcccagaac cccgacatga gcttcttcaa gatgctgttc gagggcccca tcccccccga cgcccagaac cccgacatga gcttcttcaa gatgctgttc

33603360

ctgcccgaga gcgcccgctg gatccagcgc acccacggca agaacagcct gaacagcggc ctgcccgaga gcgcccgctg gatccagcgc acccacggca agaacagcct gaacagcggc

34203420

cagggcccca gccccaagca gctggtgagc ctgggccccg agaagagcgt ggagggccag cagggcccca gccccaagca gctggtgagc ctgggccccg agaagagcgt ggagggccag

34803480

aacttcctga gcgagaagaa caaggtggtg gtgggcaagg gcgagttcac caaggacgtg aacttcctga gcgagaagaa caaggtggtg gtgggcaagg gcgagttcac caaggacgtg

35403540

ggcctgaagg agatggtgtt ccccagcagc cgcaacctgt tcctgaccaa cctggacaac ggcctgaagg agatggtgtt ccccagcagc cgcaacctgt tcctgaccaa cctggacaac

36003600

ctgcacgaga acaacaccca caaccaggag aagaagatcc aggaggagat cgagaagaag ctgcacgaga acaacaccca caaccaggag aagaagatcc aggaggat cgagaagaag

36603660

gagaccctga tccaggagaa cgtggtgctg ccccagatcc acaccgtgac cggcaccaag gagaccctga tccaggagaa cgtggtgctg ccccagatcc acaccgtgac cggcaccaag

37203720

aacttcatga agaacctgtt cctgctgagc acccgccaga acgtggaggg cagctacgac aacttcatga agaacctgtt cctgctgagc acccgccaga acgtggaggg cagctacgac

37803780

ggcgcctacg cccccgtgct gcaggacttc cgcagcctga acgacagcac caaccgcacc ggcgcctacg cccccgtgct gcaggacttc cgcagcctga acgacagcac caaccgcacc

38403840

aagaagcaca ccgcccactt cagcaagaag ggcgaggagg agaacctgga gggcctgggc aagaagcaca ccgcccactt cagcaagaag ggcgaggagg agaacctgga gggcctgggc

39003900

aaccagacca agcagatcgt ggagaagtac gcctgcacca cccgcatcag ccccaacacc aaccagacca agcagatcgt ggagaagtac gcctgcacca cccgcatcag ccccaacacc

39603960

agccagcaga acttcgtgac ccagcgcagc aagcgcgccc tgaagcagtt ccgcctgccc agccagcaga acttcgtgac ccagcgcagc aagcgcgccc tgaagcagtt ccgcctgccc

40204020

ctggaggaga ccgagctgga gaagcgcatc atcgtggacg acaccagcac ccagtggagc ctggaggaga ccgagctgga gaagcgcatc atcgtggacg acaccagcac ccagtggagc

40804080

aagaacatga agcacctgac ccccagcacc ctgacccaga tcgactacaa cgagaaggag aagaacatga agcacctgac ccccagcacc ctgacccaga tcgactacaa cgagaaggag

41404140

aagggcgcca tcacccagag ccccctgagc gactgcctga cccgcagcca cagcatcccc aagggcgcca tcacccagag ccccctgagc gactgcctga cccgcagcca cagcatcccc

42004200

caggccaacc gcagccccct gcccatcgcc aaggtgagca gcttccccag catccgcccc caggccaacc gcagccccct gcccatcgcc aaggtgagca gcttccccag catccgcccc

42604260

atctacctga cccgcgtgct gttccaggac aacagcagcc acctgcccgc cgccagctac atctacctga cccgcgtgct gttccaggac aacagcagcc acctgcccgc cgccagctac

43204320

cgcaagaagg acagcggcgt gcaggagagc agccacttcc tgcaaggcgc caagaagaac cgcaagaagg acagcggcgt gcaggagagc agccacttcc tgcaaggcgc caagaagaac

43804380

aacctgagcc tggccatcct gaccctggag atgaccggcg accagcgcga ggtgggcagc aacctgagcc tggccatcct gaccctggag atgaccggcg accagcgcga ggtgggcagc

44404440

ctgggcacca gcgccaccaa cagcgtgacc tacaagaagg tggagaacac cgtgctgccc ctgggcacca gcgccaccaa cagcgtgacc tacaagaagg tggagaacac cgtgctgccc

45004500

aagcccgacc tgcccaagac cagcggcaag gtggagctgc tgcccaaggt gcacatctac aagcccgacc tgcccaagac cagcggcaag gtggagctgc tgcccaaggt gcacatctac

45604560

cagaaggacc tgttccccac cgagaccagc aacggcagcc ccggccacct ggacctggtg cagaaggacc tgttccccac cgagaccagc aacggcagcc ccggccacct ggacctggtg

46204620

gagggcagcc tgctgcaggg caccgagggc gccatcaagt ggaacgaggc caaccgcccc gagggcagcc tgctgcaggg caccgagggc gccatcaagt ggaacgaggc caaccgcccc

46804680

ggcaaggtgc ccttcctgcg cgtggccacc gagagcagcg ccaagacccc cagcaagctg ggcaaggtgc ccttcctgcg cgtggccacc gagagcagcg ccaagacccc cagcaagctg

47404740

ctggaccccc tggcctggga caaccactac ggcacccaga tccccaagga ggagtggaag ctggaccccc tggcctggga caaccactac ggcacccaga tccccaagga ggagtggaag

48004800

agccaggaga agagccccga gaagaccgcc ttcaagaaga aggacaccat cctgagcctg agccaggaga agagccccga gaagaccgcc ttcaagaaga aggacaccat cctgagcctg

48604860

aacgcctgcg agagcaacca cgccatcgcc gccatcaacg agggccagaa caagcccgag aacgcctgcg agagcaacca cgccatcgcc gccatcaacg agggccagaa caagcccgag

49204920

atcgaggtga cctgggccaa gcagggccgc accgagcgcc tgtgcagcca gaaccccccc atcgaggtga cctggggccaa gcagggccgc accgagcgcc tgtgcagcca gaaccccccc

49804980

gtgctgaagc gccaccagcg cgagatcacc cgcaccaccc tgcagagcga ccaggaggag gtgctgaagc gccaccagcg cgagatcacc cgcaccaccc tgcagagcga cccaggagg

50405040

atcgactacg acgacaccat cagcgtggag atgaagaagg aggacttcga catctacgac atcgactacg acgacaccat cagcgtggag atgaagaagg aggacttcga catctacgac

51005100

gaggacgaga accagagccc ccgcagcttc cagaagaaga cccgccacta cttcatcgcc gaggacgaga accagagccc ccgcagcttc cagaagaaga cccgccacta cttcatcgcc

51605160

gccgtggagc gcctgtggga ctacggcatg agcagcagcc cccacgtgct gcgcaaccgc gccgtggagc gcctgtggga ctacggcatg agcagcagcc cccacgtgct gcgcaaccgc

52205220

gcccagagcg gcagcgtgcc ccagttcaag aaggtggtgt tccaggagtt caccgacggc gccgagcg gcagcgtgcc ccagttcaag aaggtggtgt tccaggagtt caccgacggc

52805280

agcttcaccc agcccctgta ccgcggcgag ctgaacgagc acctgggcct gctgggcccc agcttcaccc agcccctgta ccgcggcgag ctgaacgagc acctgggcct gctgggcccc

53405340

tacatccgcg ccgaggtgga ggacaacatc atggtgacct tccgcaacca ggccagccgc tacatccgcg ccgaggtgga ggacaacatc atggtgacct tccgcaacca ggccagccgc

54005400

ccctacagct tctacagcag cctgatcagc tacgaggagg accagcgcca gggcgccgag ccctacagct tctacagcag cctgatcagc tacgaggagg accagcgcca gggcgccgag

54605460

ccccgcaaga acttcgtgaa gcccaacgag accaagacct acttctggaa ggtgcagcac ccccgcaaga acttcgtgaa gcccaacgag accaagacct acttctggaa ggtgcagcac

55205520

cacatggccc ccaccaagga cgagttcgac tgcaaggcct gggcctactt cagcgacgtg cacatggccc ccaccaagga cgagttcgac tgcaaggcct gggcctactt cagcgacgtg

55805580

gacctggaga aggacgtgca cagcggcctg atcggccccc tgctggtgtg ccacaccaac gacctggaga aggacgtgca cagcggcctg atcggccccc tgctggtgtg ccacaccaac

56405640

accctgaacc ccgcccacgg ccgccaggtg accgtgcagg agttcgccct gttcttcacc accctgaacc ccgcccacgg ccgccaggtg accgtgcagg agttcgccct gttcttcacc

57005700

atcttcgacg agaccaagag ctggtacttc accgagaaca tggagcgcaa ctgccgcgcc atcttcgacg agaccaagag ctggtacttc accgagaaca tggagcgcaa ctgccgcgcc

57605760

ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actaccgctt ccacgccatc ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actaccgctt ccacgccatc

58205820

aacggctaca tcatggacac cctgcccggc ctggtgatgg cccaggacca gcgcatccgc aacggctaca tcatggacac cctgcccggc ctggtgatgg cccaggacca gcgcatccgc

58805880

tggtacctgc tgagcatggg cagcaacgag aacatccaca gcatccactt cagcggccac tggtacctgc tgagcatggg cagcaacgag aacatccaca gcatccactt cagcggccac

59405940

gtgttcaccg tgcgcaagaa ggaggagtac aagatggccc tgtacaacct gtaccccggc gtgttcaccg tgcgcaagaa ggagagtac aagatggccc tgtacaacct gtaccccggc

60006000

gtgttcgaga ccgtggagat gctgcccagc aaggccggca tctggcgcgt ggagtgcctg gtgttcgaga ccgtggagat gctgcccagc aaggccggca tctggcgcgt ggagtgcctg

60606060

atcggcgagc acctgcacgc cggcatgagc accctgttcc tggtgtacag caacaagtgc atcggcgagc acctgcacgc cggcatgagc accctgttcc tggtgtacag caacaagtgc

61206120

cagacccccc tgggcatggc cagcggccac atccgcgact tccagatcac cgccagcggc cagacccccc tgggcatggc cagcggccac atccgcgact tccagatcac cgccagcggc

61806180

cagtacggcc agtgggcccc caagctggcc cgcctgcact acagcggcag catcaacgcc cagtacggcc agtgggcccc caagctggcc cgcctgcact acagcggcag catcaacgcc

62406240

tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc

63006300

cacggcatca agacccaggg cgcccgccag aagttcagca gcctgtacat cagccagttc cacggcatca agacccagg cgcccgccag aagttcagca gcctgtacat cagccagttc

63606360

atcatcatgt acagcctgga cggcaagaag tggcagacct accgcggcaa cagcaccggc atcatcatgt acagcctgga cggcaagaag tggcagacct accgcggcaa cagcaccggc

64206420

accctgatgg tgttcttcgg caacgtggac agcagcggca tcaagcacaa catcttcaac accctgatgg tgttcttcgg caacgtggac agcagcggca tcaagcacaa catcttcaac

64806480

ccccccatca tcgcccgcta catccgcctg caccccaccc actacagcat ccgcagcacc ccccccatca tcgcccgcta catccgcctg caccccaccc actacagcat ccgcagcacc

65406540

ctgcgcatgg agctgatggg ctgcgacctg aacagctgca gcatgcccct gggcatggag ctgcgcatgg agctgatggg ctgcgacctg aacagctgca gcatgcccct gggcatggag

66006600

agcaaggcca tcagcgacgc ccagatcacc gccagcagct acttcaccaa catgttcgcc agcaaggcca tcagcgacgc cgatcacc gccagcagct acttcaccaa catgttcgcc

66606660

acctggagcc ccagcaaggc ccgcctgcac ctgcaaggcc gcagcaacgc ctggcgcccc acctggagcc ccagcaaggc ccgcctgcac ctgcaaggcc gcagcaacgc ctggcgcccc

67206720

caggtgaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgacc caggtgaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgacc

67806780

ggcgtgacca cccagggcgt gaagagcctg ctgaccagca tgtacgtgaa ggagttcctg ggcgtgacca cccagggcgt gaagagcctg ctgaccagca tgtacgtgaa ggagttcctg

68406840

atcagcagca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaggtgaag atcagcagca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaggtgaag

69006900

gtgttccagg gcaaccagga cagcttcacc cccgtggtga acagcctgga cccccccctg gtgttccagg gcaaccagga cagcttcacc cccgtggtga acagcctgga cccccccctg

69606960

ctgacccgct acctgcgcat ccacccccag agctgggtgc accagatcgc cctgcgcatg ctgacccgct acctgcgcat ccacccccag agctgggtgc accagatcgc cctgcgcatg

70207020

gaggtgctgg gctgcgaggc ccaggacctg tactaa gaggtgctgg gctgcgaggc ccaggacctg tactaa

70567056

<210> 390<210> 390

<211> 4374<211> 4374

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 390<400> 390

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc

60 60

acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120 120

ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac

180 180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240 240

gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300 300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360 360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc

420 420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480 480

aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac

540 540

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag

600 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660 660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac

720 720

gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc

780 780

ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc

840 840

accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac

900 900

cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960 960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag

10201020

gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag

10801080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac

11401140

gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc

12601260

cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc

13201320

aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc

13801380

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg

14401440

ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc

15001500

gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc

15601560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc

16201620

accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc

16801680

gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag gacctggcca gcggcctgat cggccccctg ctgatctgct acaagggagag cgtggaccag

17401740

cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag

18001800

aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg

18601860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

19201920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

19801980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

20402040

atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

21002100

atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc

21602160

atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac

22202220

agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc

22802280

ttcagccaga acccccccgt gctgaagcgc caccagcgcg agatcacccg caccaccctg ttcagccaga acccccccgt gctgaagcgc caccagcgcg agatcacccg caccaccctg

23402340

cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag

24002400

gacttcgaca tctacgacga ggacgagaac cagagccccc gcagcttcca gaagaagacc gacttcgaca tctacgacga ggacgagaac cagagccccc gcagcttcca gaagaagacc

24602460

cgccactact tcatcgccgc cgtggagcgc ctgtgggact acggcatgag cagcagcccc cgccactact tcatcgccgc cgtggagcgc ctgtgggact acggcatgag cagcagcccc

25202520

cacgtgctgc gcaaccgcgc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc cacgtgctgc gcaaccgcgc cccagcggc agcgtgcccc agttcaagaa ggtggtgttc

25802580

caggagttca ccgacggcag cttcacccag cccctgtacc gcggcgagct gaacgagcac caggagttca ccgacggcag cttcacccag cccctgtacc gcggcgagct gaacgagcac

26402640

ctgggcctgc tgggccccta catccgcgcc gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggccccta catccgcgcc gaggtggagg acaacatcat ggtgaccttc

27002700

cgcaaccagg ccagccgccc ctacagcttc tacagcagcc tgatcagcta cgaggaggac cgcaaccagg ccagccgccc ctacagcttc tacagcagcc tgatcagcta cgaggaggac

27602760

cagcgccagg gcgccgagcc ccgcaagaac ttcgtgaagc ccaacgagac caagacctac cagcgccagg gcgccgagcc ccgcaagaac ttcgtgaagc ccaacgagac caagacctac

28202820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg

28802880

gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg

29402940

ctggtgtgcc acaccaacac cctgaacccc gcccacggcc gccaggtgac cgtgcaggag ctggtgtgcc acaccaacac cctgaacccc gcccacggcc gccaggtgac cgtgcaggag

30003000

ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg

30603060

gagcgcaact gccgcgcccc ctgcaacatc cagatggagg accccacctt caaggagaac gagcgcaact gccgcgcccc ctgcaacatc cagatggagg accccacctt caaggagaac

31203120

taccgcttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc taccgcttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc

31803180

caggaccagc gcatccgctg gtacctgctg agcatgggca gcaacgagaa catccacagc caggaccagc gcatccgctg gtacctgctg agcatgggca gcaacgagaa catccacagc

32403240

atccacttca gcggccacgt gttcaccgtg cgcaagaagg aggagtacaa gatggccctg atccacttca gcggccacgt gttcaccgtg cgcaagaagg aggagtacaa gatggccctg

33003300

tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc

33603360

tggcgcgtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg tggcgcgtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg

34203420

gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgcgacttc gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgcgacttc

34803480

cagatcaccg ccagcggcca gtacggccag tgggccccca agctggcccg cctgcactac cagatcaccg ccagcggcca gtacggccag tgggccccca agctggcccg cctgcactac

35403540

agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

36003600

ctggccccca tgatcatcca cggcatcaag acccagggcg cccgccagaa gttcagcagc ctggccccca tgatcatcca cggcatcaag acccagggcg cccgccagaa gttcagcagc

36603660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac

37203720

cgcggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc cgcggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc

37803780

aagcacaaca tcttcaaccc ccccatcatc gcccgctaca tccgcctgca ccccacccac aagcacaaca tcttcaaccc ccccatcatc gcccgctaca tccgcctgca cccccaccac

38403840

tacagcatcc gcagcaccct gcgcatggag ctgatgggct gcgacctgaa cagctgcagc tacagcatcc gcagcaccct gcgcatggag ctgatgggct gcgacctgaa cagctgcagc

39003900

atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac

39603960

ttcaccaaca tgttcgccac ctggagcccc agcaaggccc gcctgcacct gcaaggccgc ttcaccaaca tgttcgccac ctggagcccc agcaaggccc gcctgcacct gcaaggccgc

40204020

agcaacgcct ggcgccccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag agcaacgcct ggcgccccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag

40804080

aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg

41404140

tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc

42004200

cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac

42604260

agcctggacc cccccctgct gacccgctac ctgcgcatcc acccccagag ctgggtgcac agcctggacc cccccctgct gacccgctac ctgcgcatcc acccccagag ctgggtgcac

43204320

cagatcgccc tgcgcatgga ggtgctgggc tgcgaggccc aggacctgta ctaa cagatcgccc tgcgcatgga ggtgctgggc tgcgaggccc aggacctgta ctaa

43744374

<210> 391<210> 391

<211> 7056<211> 7056

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 391<400> 391

atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc

60 60

accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg

120 120

ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac

180 180

acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc

240 240

gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac

300 300

gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg

360 360

ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga

420 420

gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg

480 480

aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac

540 540

gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa

600 600

ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg

660 660

ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat

720 720

gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc

780 780

ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc

840 840

acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac

900 900

agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg

960 960

gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa

10201020

gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag

10801080

gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac

11401140

gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc

12601260

cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg

13201320

aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc

13801380

atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg

14401440

ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc

15001500

gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc

15601560

cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc

16201620

accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc

16801680

gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag

17401740

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag

18001800

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg

18601860

caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg

19201920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc

19801980

attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag

20402040

atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc

21002100

atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc

21602160

atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac

22202220

agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc

22802280

ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc

23402340

cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag

24002400

atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac

24602460

ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct

25202520

cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accaccagctg

25802580

caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag

26402640

aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc

27002700

agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca

27602760

tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg

28202820

ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa

28802880

aacaacgaca gcaagctgct ggaatccggc ctgatgaaca gccaagagtc ctcctggggc aacaacgaca gcaagctgct ggaatccggc ctgatgaaca gccaagagtc ctcctggggc

29402940

aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gaaagagagc ccacggacct aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gaaagagagc ccacggacct

30003000

gctctgctga ccaaggataa cgccctgttc aaagtgtcca tcagcctgct caagaccaac gctctgctga ccaaggataa cgccctgttc aaagtgtcca tcagcctgct caagaccaac

30603060

aagacctcca acaactccgc caccaacaga aagacccaca tcgacggccc tagcctgctg aagacctcca acaactccgc caccaacaga aagacccaca tcgacggccc tagcctgctg

31203120

atcgagaata gccctagcgt ctggcagaat atcctggaaa gcgacaccga gttcaagaaa atcgagaata gccctagcgt ctggcagaat atcctggaaa gcgacaccga gttcaagaaa

31803180

gtgacccctc tgatccacga ccggatgctc atggacaaga acgccaccgc tctgcggctg gtgacccctc tgatccacga ccggatgctc atggacaaga acgccaccgc tctgcggctg

32403240

aaccacatga gcaacaagac aaccagcagc aagaatatgg aaatggtgca gcagaagaaa aaccacatga gcaacaagac aaccagcagc aagaatatgg aaatggtgca gcagaagaaa

33003300

gagggcccca ttcctccaga cgctcagaac cccgatatga gcttcttcaa gatgctcttt gagggcccca ttcctccaga cgctcagaac cccgatatga gcttcttcaa gatgctcttt

33603360

ctgcccgaga gcgcccggtg gattcagaga acacacggca agaactccct gaactccggc ctgcccgaga gcgcccggtg gattcagaga acacacggca agaactccct gaactccggc

34203420

cagggacctt ctccaaagca gctggtttcc ctgggacctg agaagtccgt ggaaggacag cagggacctt ctccaaagca gctggtttcc ctgggacctg agaagtccgt ggaaggacag

34803480

aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg gcgagttcac caaggatgtg aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg gcgagttcac caaggatgtg

35403540

ggcctgaaag agatggtctt tcccagcagc cggaacctgt tcctgaccaa cctggacaac ggcctgaaag agatggtctt tcccagcagc cggaacctgt tcctgaccaa cctggacaac

36003600

ctgcacgaga acaacaccca caatcaagag aagaagatcc aagaggaaat cgaaaagaaa ctgcacgaga acaacaccca caatcaagag aagaagatcc aagaggaaat cgaaaagaaa

36603660

gagacactca tccaagagaa cgtggtgctg cctcagatcc acacagtgac cggcaccaag gagacactca tccaagagaa cgtggtgctg cctcagatcc acacagtgac cggcaccaag

37203720

aactttatga agaatctgtt cctgctgagt acccggcaga acgtggaagg cagctacgat aactttatga agaatctgtt cctgctgagt acccggcaga acgtggaagg cagctacgat

37803780

ggcgcttatg cccctgtgct gcaggacttc agatccctga acgactccac caatcggaca ggcgcttatg cccctgtgct gcaggacttc agatccctga acgactccac caatcggaca

38403840

aagaagcaca cagcccactt ctccaagaag ggcgaagaag agaacctgga aggactgggc aagaagcaca cagcccactt ctccaagaag ggcgaagaag agaacctgga aggactgggc

39003900

aatcagacca agcagatcgt cgagaagtac gcctgcacca ccagaatcag ccccaacaca aatcagacca agcagatcgt cgagaagtac gcctgcacca ccagaatcag ccccaacaca

39603960

agccagcaga acttcgtgac ccagcggagc aaaagagccc tgaagcagtt tcggctgccc agccagcaga acttcgtgac ccagcggagc aaaagagccc tgaagcagtt tcggctgccc

40204020

ctggaagaaa ccgagctgga aaagcggatc atcgtggacg acaccagcac acagtggtcc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg acaccagcac acagtggtcc

40804080

aagaacatga agcacttgac ccctagcaca ctgacccaga tcgactacaa cgagaaagag aagaacatga agcacttgac ccctagcaca ctgacccaga tcgactacaa cgagaaagag

41404140

aagggcgcta tcacacagag cccactgagc gactgtctga ccagaagcca cagcatccct aagggcgcta tcacacagag cccactgagc gactgtctga ccagaagcca cagcatccct

42004200

caggccaaca gatcccctct gccaatcgcc aaagtgtcta gcttccccag catcagaccc caggccaaca gatcccctct gccaatcgcc aaagtgtcta gcttccccag catcagaccc

42604260

atctacctga ccagagtgct gttccaggac aacagcagcc atctgccagc cgccagctac atctacctga ccagagtgct gttccaggac aacagcagcc atctgccagc cgccagctac

43204320

cggaagaaag attctggcgt gcaagagagc agccactttc tgcagggcgc taagaagaac cggaagaaag attctggcgt gcaagagagc agccactttc tgcagggcgc taagaagaac

43804380

aatctgagcc tggctattct gaccctggaa atgaccggcg atcagagaga agtcggctct aatctgagcc tggctattct gaccctggaa atgaccggcg atcagagaga agtcggctct

44404440

ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg tggaaaacac cgtgctgcct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg tggaaaacac cgtgctgcct

45004500

aagcctgacc tgccaaagac aagcggcaag gtggaactgc tgccaaaggt gcacatctac aagcctgacc tgccaaagac aagcggcaag gtggaactgc tgccaaaggt gcacatctac

45604560

cagaaggacc tgtttcctac cgagacaagc aacggctctc ccggccatct ggatctggtg cagaaggacc tgtttcctac cgagacaagc aacggctctc ccggccatct ggatctggtg

46204620

gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ggaacgaggc caatagacct gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ggaacgaggc caatagacct

46804680

ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ccaagacacc ctctaaactg ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ccaagacacc ctctaaactg

47404740

ctggaccctc tggcctggga caaccactat ggcactcaga tccccaaaga ggaatggaag ctggaccctc tggcctggga caaccactat ggcactcaga tccccaaaga ggaatggaag

48004800

tcccaagaga agtcccctga aaagaccgcc ttcaagaaga aggacaccat tctgtccctg tcccaagaga agtcccctga aaagaccgcc ttcaagaaga aggacaccat tctgtccctg

48604860

aatgcctgcg agagcaacca cgccattgcc gccatcaatg agggccagaa caagcccgag aatgcctgcg agagcaacca cgccattgcc gccatcaatg agggccagaa caagcccgag

49204920

atcgaagtga cctgggccaa gcagggaaga accgagagac tgtgtagcca gaatcctcct atcgaagtga cctggggccaa gcagggaaga accgagagac tgtgtagcca gaatcctcct

49804980

gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgcagagcga ccaagaagag gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgcagagcga ccaagaagag

50405040

atcgattacg acgataccat cagcgtcgag atgaagaaag aagatttcga catctacgac atcgattacg acgataccat cagcgtcgag atgaagaaag aagatttcga catctacgac

51005100

gaggacgaga atcagagccc tcggagcttc cagaagaaaa ccaggcacta ctttattgcc gaggacgaga atcagagccc tcggagcttc cagaagaaaa ccaggcacta ctttattgcc

51605160

gccgtcgagc ggctgtggga ctacggaatg tctagctctc ctcacgtgct gcggaataga gccgtcgagc ggctgtggga ctacggaatg tctagctctc ctcacgtgct gcggaataga

52205220

gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt tccaagagtt caccgacggc gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt tccaagagtt caccgacggc

52805280

agcttcaccc agccactgta tagaggcgag ctgaacgagc atctgggcct gctgggccct agcttcaccc agccactgta tagaggcgag ctgaacgagc atctgggcct gctgggccct

53405340

tatatcagag ccgaagtgga agataacatc atggtcacct tccggaatca ggctagccgg tatatcagag ccgaagtgga agataacatc atggtcacct tccggaatca ggctagccgg

54005400

ccttacagct tctacagctc cctgatctcc tacgaagagg accagagaca gggcgcagag ccttacagct tctacagctc cctgatctcc tacgaagagg accagagaca gggcgcagag

54605460

ccccggaaga atttcgtgaa gcccaacgag actaagacct acttttggaa ggtgcagcac ccccggaaga atttcgtgaa gcccaacgag actaagacct acttttggaa ggtgcagcac

55205520

catatggccc ctacaaagga cgagttcgac tgcaaagcct gggcctactt ctccgatgtg catatggccc ctacaaagga cgagttcgac tgcaaagcct gggcctactt ctccgatgtg

55805580

gacctcgaaa aggacgtgca cagcggactc atcggcccac tgcttgtgtg ccacaccaac gacctcgaaa aggacgtgca cagcggactc atcggcccac tgcttgtgtg ccacaccaac

56405640

acactgaacc ccgctcacgg cagacaagtg acagtgcaag agttcgccct gtttttcacc acactgaacc ccgctcacgg cagacaagtg acagtgcaag agttcgccct gtttttcacc

57005700

atcttcgacg aaacgaagtc ctggtacttc accgaaaaca tggaaagaaa ctgcagggcc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca tggaaagaaa ctgcagggcc

57605760

ccttgcaaca ttcagatgga agatcccacc ttcaaagaga actaccggtt ccacgccatc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga actaccggtt ccacgccatc

58205820

aacggctaca tcatggacac actgcccggc ctggttatgg cccaggatca gagaatccgg aacggctaca tcatggacac actgcccggc ctggttatgg cccaggatca gagaatccgg

58805880

tggtatctgc tgtccatggg ctccaacgag aatatccact ccatccactt cagcggccac tggtatctgc tgtccatggg ctccaacgag aatatccact ccatccactt cagcggccac

59405940

gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc tgtacaatct gtaccctggg gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc tgtacaatct gtaccctggg

60006000

gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tttggagagt ggaatgtctg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tttggagagt ggaatgtctg

60606060

attggagagc acctccacgc cgggatgagc accctgtttc tggtgtactc caacaagtgt attggagagc acctccacgc cgggatgagc accctgtttc tggtgtactc caacaagtgt

61206120

cagacccctc tcggcatggc ctctggccac attagagact tccagatcac cgccagcgga cagacccctc tcggcatggc ctctggccac attagagact tccagatcac cgccagcgga

61806180

cagtatggac agtgggcccc taaactggcc agactgcact actccggcag catcaatgcc cagtatggac agtgggcccc taaactggcc agactgcact actccggcag catcaatgcc

62406240

tggtccacca aagagccttt cagctggatc aaagtggacc tgctggctcc catgatcatc tggtccacca aagagccttt cagctggatc aaagtggacc tgctggctcc catgatcatc

63006300

cacggaatca agacccaggg cgccagacaa aagttcagca gcctgtacat cagccagttc cacggaatca agacccagg cgccagacaa aagttcagca gcctgtacat cagccagttc

63606360

atcatcatgt acagcctgga cggaaagaag tggcagacct accggggcaa tagcaccggc atcatcatgt acagcctgga cggaaagaag tggcagacct accggggcaa tagcaccggc

64206420

acactgatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa catcttcaac acactgatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa catcttcaac

64806480

cctccaatca ttgcccggta catccggctg caccccacac actacagcat caggtctacc cctccaatca ttgcccggta catccggctg caccccacac actacagcat caggtctacc

65406540

ctgagaatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct cggaatggaa ctgagaatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct cggaatggaa

66006600

agcaaggcca tcagcgacgc ccagatcaca gcctctagct acttcaccaa catgttcgcc agcaaggcca tcagcgacgc ccagatcaca gcctctagct acttcaccaa catgttcgcc

66606660

acttggagcc cctctaaggc ccggcttcat ctgcaaggca gaagcaacgc ttggaggccc acttggagcc cctctaaggc ccggcttcat ctgcaaggca gaagcaacgc ttggaggccc

67206720

caagtgaaca accccaaaga atggctccag gtggactttc agaaaaccat gaaagtgaca caagtgaaca accccaaaga atggctccag gtggactttc agaaaaccat gaaagtgaca

67806780

ggcgtgacca cacagggcgt caagtccctg ctgacctcta tgtacgtgaa agagtttctg ggcgtgacca cacagggcgt caagtccctg ctgacctcta tgtacgtgaa agagtttctg

68406840

atcagctcca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaagtgaaa atcagctcca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaagtgaaa

69006900

gtgttccagg gaaatcagga cagcttcaca cccgtggtca atagtctgga cccaccactg gtgttccagg gaaatcagga cagcttcaca cccgtggtca atagtctgga cccaccactg

69606960

ctgacccgct acctgcgaat tcaccctcag tcttgggtgc accagattgc cctgcggatg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc accagattgc cctgcggatg

70207020

gaagtgctgg gctgtgaagc tcaggacctc tactag gaagtgctgg gctgtgaagc tcaggacctc tactag

70567056

<210> 392<210> 392

<211> 4980<211> 4980

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 392<400> 392

atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc

60 60

accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg

120 120

ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac

180 180

acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc

240 240

gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac

300 300

gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg

360 360

ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga

420 420

gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg

480 480

aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac

540 540

gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa

600 600

ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg

660 660

ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat

720 720

gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc

780 780

ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc

840 840

acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac

900 900

agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg

960 960

gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa

10201020

gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag

10801080

gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac

11401140

gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc

12001200

tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc

12601260

cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg

13201320

aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc

13801380

atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg

14401440

ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc

15001500

gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc

15601560

cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc

16201620

accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc

16801680

gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag

17401740

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag

18001800

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg

18601860

caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg

19201920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc

19801980

attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag

20402040

atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc

21002100

atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc

21602160

atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac

22202220

agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc

22802280

ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc

23402340

cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag

24002400

atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac

24602460

ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct

25202520

cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accaccagctg

25802580

caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag

26402640

aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc

27002700

agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca

27602760

tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg

28202820

ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa

28802880

aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc agcgggaaat caccagaacc aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc agcgggaaat caccagaacc

29402940

acactgcaga gcgaccaaga ggaaatcgat tacgacgaca ccatcagcgt cgagatgaag acactgcaga gcgaccaaga ggaaatcgat tacgacgaca ccatcagcgt cgagatgaag

30003000

aaagaagatt tcgacatcta cgacgaggac gagaatcaga gccccagatc ctttcagaaa aaagaagatt tcgacatcta cgacgaggac gagaatcaga gccccagatc ctttcagaaa

30603060

aagacccggc actacttcat tgccgccgtc gagagactgt gggactacgg catgtctagc aagacccggc actacttcat tgccgccgtc gagagactgt gggactacgg catgtctagc

31203120

agccctcacg tgctgagaaa tagagcccag agcggcagcg tgccccagtt caagaaagtg agccctcacg tgctgagaaa tagagcccag agcggcagcg tgccccagtt caagaaagtg

31803180

gtgttccaag agttcaccga cggcagcttc acccagccac tgtatagagg cgagctgaac gtgttccaag agttcaccga cggcagcttc acccagccac tgtatagagg cgagctgaac

32403240

gagcatctgg gcctgctggg cccttatatc agagccgaag tggaagataa catcatggtc gagcatctgg gcctgctggg cccttatatc agagccgaag tggaagataa catcatggtc

33003300

accttccgga atcaggctag ccggccttac agcttctaca gctccctgat ctcctacgaa accttccgga atcaggctag ccggccttac agcttctaca gctccctgat ctcctacgaa

33603360

gaggaccaga gacagggcgc tgagccccgg aagaatttcg tgaagcccaa cgagactaag gaggaccaga gacagggcgc tgagccccgg aagaatttcg tgaagcccaa cgagactaag

34203420

acctactttt ggaaggtgca gcaccacatg gcccctacaa aggacgagtt cgactgcaaa acctactttt ggaaggtgca gcaccacatg gcccctacaa aggacgagtt cgactgcaaa

34803480

gcctgggcct acttctccga tgtggatctg gaaaaggacg tgcacagcgg gctcatcgga gcctgggcct acttctccga tgtggatctg gaaaaggacg tgcacagcgg gctcatcgga

35403540

ccactgcttg tgtgccacac caacacactg aaccccgctc acggcagaca agtgacagtg ccactgcttg tgtgccacac caacacactg aaccccgctc acggcagaca agtgacagtg

36003600

caagagttcg ccctgttctt caccatcttc gacgaaacaa agagctggta cttcaccgag caagagttcg ccctgttctt caccatcttc gacgaaacaa agagctggta cttcaccgag

36603660

aatatggaac ggaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa aatatggaac ggaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa

37203720

gagaactacc ggttccacgc catcaacggc tacatcatgg acacactgcc cggcctggtt gagaactacc ggttccacgc catcaacggc tacatcatgg acacactgcc cggcctggtt

37803780

atggcccagg atcagagaat ccggtggtat ctgctgtcca tgggctccaa cgagaatatc atggcccagg atcagagaat ccggtggtat ctgctgtcca tgggctccaa cgagaatatc

38403840

cacagcatcc acttcagcgg ccacgtgttc accgtgcgga aaaaagaaga gtacaaaatg cacagcatcc acttcagcgg ccacgtgttc accgtgcgga aaaaagaaga gtacaaaatg

39003900

gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaatgctgcc ttccaaggcc gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaatgctgcc ttccaaggcc

39603960

ggcatttgga gagtggaatg tctgattgga gagcacctcc acgccggaat gagcaccctg ggcatttgga gagtggaatg tctgattgga gagcacctcc acgccggaat gagcaccctg

40204020

tttctggtgt actccaacaa gtgtcagacc cctctcggca tggcctctgg acacatcaga tttctggtgt actccaacaa gtgtcagacc cctctcggca tggcctctgg acacatcaga

40804080

gacttccaga tcaccgcctc tggccagtac ggacagtggg ctcctaaact ggctcggctg gacttccaga tcaccgcctc tggccagtac ggacagtggg ctcctaaact ggctcggctg

41404140

cactactccg gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg cactactccg gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg

42004200

gacctgctgg ctcccatgat catccacgga atcaagaccc agggcgcaag acagaagttc gacctgctgg ctcccatgat catccacgga atcaagaccc agggcgcaag acagaagttc

42604260

agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggaaa gaagtggcag agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggaaa gaagtggcag

43204320

acctaccggg gcaatagcac cggcacactc atggtgttct tcggcaacgt ggactccagc acctaccggg gcaatagcac cggcacactc atggtgttct tcggcaacgt ggactccagc

43804380

ggcattaagc acaacatctt caaccctcca atcattgccc ggtacatccg gctgcacccc ggcattaagc acaacatctt caaccctcca atcattgccc ggtacatccg gctgcacccc

44404440

acacactaca gcatccggtc taccctgaga atggaactga tgggctgcga cctgaacagc acacactaca gcatccggtc taccctgaga atggaactga tgggctgcga cctgaacagc

45004500

tgctctatgc ccctcggaat ggaaagcaag gccatcagcg acgcccagat cacagccagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg acgcccagat cacagccagc

45604560

agctacttca ccaacatgtt cgccacttgg agcccctcca aggctagact gcatctgcag agctacttca ccaacatgtt cgccacttgg agcccctcca aggctagact gcatctgcag

46204620

ggcagaagca acgcttggag gccccaagtg aacaacccca aagagtggct gcaggttgac ggcagaagca acgcttggag gccccaagtg aacaacccca aagagtggct gcaggttgac

46804680

tttcaaaaga ccatgaaagt gaccggcgtg accacacagg gcgtcaagtc tctgctgacc tttcaaaaga ccatgaaagt gaccggcgtg accacacagg gcgtcaagtc tctgctgacc

47404740

tctatgtacg tgaaagagtt cctgattagc agcagccagg acggccacca gtggaccctg tctatgtacg tgaaagagtt cctgattagc agcagccagg acggccacca gtggaccctg

48004800

tttttccaga acggcaaagt gaaagtgttc cagggcaatc aggacagctt cacacccgtg tttttccaga acggcaaagt gaaagtgttc cagggcaatc aggacagctt cacacccgtg

48604860

gtcaattctc tggaccctcc actgctgacc agatacctgc ggattcaccc tcagtcttgg gtcaattctc tggaccctcc actgctgacc agatacctgc ggattcaccc tcagtcttgg

49204920

gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg aagctcagga cctctactag gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg aagctcagga cctctactag

49804980

<210> 393<210> 393

<211> 4374<211> 4374

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 393<400> 393

atgcagatag aattatctac ttgttttttt ctttgtctgc tcaggttctg cttctctgct atgcagatag aattatctac ttgttttttt ctttgtctgc tcaggttctg cttctctgct

60 60

acaaggaggt attacttagg tgctgtagag ttatcttggg actacatgca gtctgatctt acaaggaggt attacttagg tgctgtagag ttatcttggg actacatgca gtctgatctt

120 120

ggggagctcc ctgtggatgc aagatttccc cctagagtac ctaaaagttt ccctttcaac ggggagctcc ctgtggatgc aagatttccc cctagagtac ctaaaagttt ccctttcaac

180 180

acaagtgtgg tgtataagaa gactctgttt gttgagttca cagatcacct tttcaatatt acaagtgtgg tgtataagaa gactctgttt gttgagttca cagatcacct tttcaatatt

240 240

gccaagccca gacccccctg gatgggtcta ctggggccaa caattcaagc agaggtatat gccaagccca gacccccctg gatgggtcta ctggggccaa caattcaagc agaggtatat

300 300

gatacagtgg tgatcacatt aaagaacatg gcatcccacc ctgtaagcct gcatgctgtt gatacagtgg tgatcacatt aaagaacatg gcatcccacc ctgtaagcct gcatgctgtt

360 360

ggtgtgtcct attggaaagc aagtgaaggt gctgaatatg atgatcaaac atcccaaaga ggtgtgtcct attggaaagc aagtgaaggt gctgaatatg atgatcaaac atcccaaaga

420 420

gagaaggaag atgacaaagt cttcccaggt ggctctcaca cctatgtgtg gcaagtgctc gagaaggaag atgacaaagt cttcccaggt ggctctcaca cctatgtgtg gcaagtgctc

480 480

aaggaaaatg ggcctatggc tagtgatcca ttgtgcctca catatagcta cctgtcccat aaggaaaatg ggcctatggc tagtgatcca ttgtgcctca catatagcta cctgtcccat

540 540

gtggacttag ttaaagatct gaactcaggt ctgattggtg ccctgctggt ctgtagggaa gtggacttag ttaaagatct gaactcaggt ctgattggtg ccctgctggt ctgtagggaa

600 600

ggatcactag ctaaagaaaa aacccagact ttacacaagt tcatcttatt atttgctgtt ggatcactag ctaaagaaaa aacccagact ttacacaagt tcatcttatt atttgctgtt

660 660

tttgatgagg gaaagagctg gcactcagag actaagaatt cactcatgca ggatagagat tttgatgagg gaaagagctg gcactcagag actaagaatt cactcatgca ggatagat

720 720

gcagcttctg ctagagcatg gccaaaaatg catactgtga atgggtatgt taacaggagt gcagcttctg ctagagcatg gccaaaaatg catactgtga atgggtatgt taacaggagt

780 780

ctgcctggcc tcataggctg ccatagaaaa tcagtgtact ggcatgtcat aggtatgggc ctgcctggcc tcataggctg ccatagaaaa tcagtgtact ggcatgtcat aggtatgggc

840 840

actactcctg aggtgcattc catttttttg gaggggcata ctttccttgt aagaaaccac actactcctg aggtgcattc catttttttg gaggggcata ctttccttgt aagaaaccac

900 900

aggcaggctt cattggaaat tagtccaata acctttctca cagcccagac tctgctaatg aggcaggctt cattggaaat tagtccaata acctttctca cagcccagac tctgctaatg

960 960

gacttggggc agtttttatt attttgtcac attagctctc atcagcatga tggaatggaa gacttggggc agtttttatt attttgtcac attagctctc atcagcatga tggaatggaa

10201020

gcctatgtta aggttgattc ctgcccagaa gagccccagt tgagaatgaa gaacaatgag gcctatgtta aggttgattc ctgcccagaa gagccccagt tgagaatgaa gaacaatgag

10801080

gaagcagaag actatgatga tgatctaaca gactcagaaa tggatgttgt gagatttgat gaagcagaag actatgatga tgatctaaca gactcagaaa tggatgttgt gagatttgat

11401140

gatgataact ccccaagttt tattcagatc aggtcagtgg ccaagaaaca tccaaaaaca gatgataact ccccaagttt tattcagatc aggtcagtgg ccaagaaaca tccaaaaaca

12001200

tgggttcatt atattgcagc agaagaagaa gactgggatt atgcaccctt ggtattagcc tgggttcatt atattgcagc agaagaagaa gactgggatt atgcaccctt ggtattagcc

12601260

cctgatgaca gaagctataa gtcacaatat ctcaacaatg gaccccagag aattggcaga cctgatgaca gaagctataa gtcacaatat ctcaacaatg gaccccagag aattggcaga

13201320

aagtacaaaa aagtcaggtt tatggcttat actgatgaga ctttcaaaac tagagaggct aagtacaaaa aagtcaggtt tatggcttat actgatgaga ctttcaaaac tagagaggct

13801380

attcaacatg aatctggcat cctaggtcct ttgttatatg gggaagtagg ggacacctta attcaacatg aatctggcat cctaggtcct ttgttatatg gggaagtagg ggacacctta

14401440

ttaattatat ttaaaaacca ggccagtagg ccttacaaca tttaccccca cggtataaca ttaattatat ttaaaaacca ggccagtagg ccttacaaca tttaccccca cggtataaca

15001500

gatgtcagac cactgtactc aaggaggcta ccaaaagggg tgaagcacct aaaagacttc gatgtcagac cactgtactc aaggaggcta ccaaaagggg tgaagcacct aaaagacttc

15601560

cccatcctac ctggtgagat tttcaagtat aagtggacag tgactgtaga agatggtcca cccatcctac ctggtgagat tttcaagtat aagtggacag tgactgtaga agatggtcca

16201620

accaaatcag atcccagatg cctgacaagg tactacagta gctttgtaaa tatggagaga accaaatcag atcccagatg cctgacaagg tactacagta gctttgtaaa tatggagaga

16801680

gacctggcct cagggttaat agggccccta ctgatctgct acaaggagag tgtagaccaa gacctggcct cagggttaat agggccccta ctgatctgct acaagggagag tgtagaccaa

17401740

agaggcaacc aaattatgtc agacaagaga aatgtcatcc tctttagtgt ttttgatgag agaggcaacc aaattatgtc agacaagaga aatgtcatcc tctttagtgt ttttgatgag

18001800

aataggtcct ggtacctgac agaaaatatc caaagattcc ttccaaatcc agcaggggta aataggtcct ggtacctgac agaaaatatc caaagattcc ttccaaatcc agcaggggta

18601860

caactggagg accctgagtt ccaggcctcc aatatcatgc acagcatcaa tggttatgtg caactggagg accctgagtt ccaggcctcc aatatcatgc acagcatcaa tggttatgtg

19201920

tttgacagtt tgcaactttc agtgtgcctt catgaggttg catactggta tatactttct tttgacagtt tgcaactttc agtgtgcctt catgaggttg catactggta tatactttct

19801980

ataggggccc agacagactt cttgtcagtt ttcttttcag gctatacttt caagcataag ataggggccc agacagactt cttgtcagtt ttcttttcag gctatacttt caagcataag

20402040

atggtatatg aagataccct gactcttttt ccctttagtg gtgagacagt tttcatgtca atggtatatg aagataccct gactcttttt ccctttagtg gtgagacagt tttcatgtca

21002100

atggaaaacc cagggctttg gatcttggga tgccacaact ctgactttag aaacagaggc atggaaaacc cagggctttg gatcttggga tgccacaact ctgactttag aaacagaggc

21602160

atgactgccc ttttaaaggt gtcctcttgt gataagaata ctggagacta ctatgaggac atgactgccc ttttaaaggt gtcctcttgt gataagaata ctggagacta ctatgaggac

22202220

agctatgagg acatttcagc ctatctgctg tcaaaaaata atgctataga gccaaggtca agctatgagg acatttcagc ctatctgctg tcaaaaaata atgctataga gccaaggtca

22802280

ttttctcaaa atcctcctgt cctgaagagg caccaaagag agataaccag gactacctta ttttctcaaa atcctcctgt cctgaagagg caccaaagag agataaccag gactacctta

23402340

cagtctgacc aggaggaaat tgattatgat gacacaataa gtgtggagat gaaaaaggag cagtctgacc aggaggaaat tgattatgat gacacaataa gtgtggagat gaaaaaggag

24002400

gattttgata tttatgatga ggatgaaaac caatctccaa gatctttcca gaagaagact gattttgata tttatgatga ggatgaaaac caatctccaa gatctttcca gaagaagact

24602460

agacactatt tcattgctgc agtggaaaga ctgtgggact atggaatgtc ctccagccct agacactatt tcattgctgc agtggaaaga ctgtgggact atggaatgtc ctccagccct

25202520

catgttctca ggaatagggc tcaaagtggt tctgtgccac agttcaagaa ggtggtgttt catgttctca ggaatagggc tcaaagtggt tctgtgccac agttcaagaa ggtggtgttt

25802580

caggaattca cagatgggtc ctttactcaa ccactgtata ggggagaact caatgaacat caggaattca cagatgggtc ctttactcaa ccactgtata ggggagaact caatgaacat

26402640

ctaggattac taggtcccta cattagagct gaggtggagg acaatatcat ggtcactttc ctaggattac taggtcccta cattagagct gaggtggagg acaatatcat ggtcactttc

27002700

aggaaccagg catctagacc atactctttt tacagctcct tgatatctta tgaagaggac aggaaccagg catctagacc atactctttt tacagctcct tgatatctta tgaagaggac

27602760

cagagacagg gtgcagaacc caggaagaac tttgtgaaac ccaatgagac caaaacatac cagagacagg gtgcagaacc caggaagaac tttgtgaaac ccaatgagac caaaacatac

28202820

ttctggaagg tccagcatca tatggctcct accaaggatg aatttgactg caaagcctgg ttctggaagg tccagcatca tatggctcct accaaggatg aatttgactg caaagcctgg

28802880

gcttacttct cagatgtgga tttggagaaa gatgtgcaca gtggcttgat tgggcctctt gcttacttct cagatgtgga tttggagaaa gatgtgcaca gtggcttgat tgggcctctt

29402940

ttggtatgtc ataccaacac cttaaaccct gctcatggaa gacaagtaac agtgcaagag ttggtatgtc ataccaacac cttaaaccct gctcatggaa gacaagtaac agtgcaagag

30003000

tttgccctct ttttcactat atttgatgag acaaaaagtt ggtactttac tgagaatatg tttgccctct ttttcactat atttgatgag acaaaaagtt ggtactttac tgagaatatg

30603060

gagaggaact gcagggctcc ctgcaatata cagatggagg atcctacttt caaggaaaac gagaggaact gcagggctcc ctgcaatata cagatggagg atcctacttt caaggaaaac

31203120

tataggtttc atgccattaa tggctatatc atggatacat tgcctggctt agttatggcc tataggtttc atgccattaa tggctatatc atggatacat tgcctggctt agttatggcc

31803180

caggatcaga gaatcagatg gtacctcctt agtatgggaa gcaatgaaaa catacattct caggatcaga gaatcagatg gtacctcctt agtatgggaa gcaatgaaaa catacattct

32403240

attcacttca gtggacatgt ctttactgtg agaaaaaagg aagagtacaa gatggcactg attcacttca gtggacatgt ctttactgtg agaaaaaagg aagagtacaa gatggcactg

33003300

tacaatctgt accctggagt gtttgagaca gttgagatgc tgcccagcaa ggctgggatc tacaatctgt accctggagt gtttgagaca gttgagatgc tgcccagcaa ggctgggatc

33603360

tggagggtag aatgcctgat tggagaacac ttacatgcag gtatgtccac tctattcttg tggagggtag aatgcctgat tggagaacac ttacatgcag gtatgtccac tctattcttg

34203420

gtctattcca acaagtgtca gaccccccta ggcatggcat ctggccatat tagagatttc gtctattcca acaagtgtca gaccccccta ggcatggcat ctggccatat tagagatttc

34803480

cagataactg cttctggtca gtatggccag tgggccccca agcttgctag acttcactac cagataactg cttctggtca gtatggccag tgggccccca agcttgctag acttcactac

35403540

agtggttcaa taaatgcctg gtccaccaag gagcccttca gctggattaa agtggacttg agtggttcaa taaatgcctg gtccaccaag gagcccttca gctggattaa agtggacttg

36003600

ctagccccca tgatcattca tgggataaaa acacagggtg ccagacagaa attttcatct ctagccccca tgatcattca tgggataaaa acacagggtg cgacagaa attttcatct

36603660

ctgtacatca gccagtttat catcatgtac agtctggatg gcaaaaaatg gcagacctac ctgtacatca gccagtttat catcatgtac agtctggatg gcaaaaaatg gcagacctac

37203720

agaggtaact ctacaggtac actaatggta ttttttggca atgtagattc atcaggtatc agaggtaact ctacaggtac actaatggta ttttttggca atgtagattc atcaggtatc

37803780

aagcataata tctttaatcc tcccattatt gccagataca tcaggttgca cccaactcat aagcataata tctttaatcc tcccattatt gccagataca tcaggttgca cccaactcat

38403840

tacagtataa gatccacttt aaggatggag cttatggggt gtgaccttaa tagctgcagt tacagtataa gatccacttt aaggatggag cttatggggt gtgaccttaa tagctgcagt

39003900

atgcccttgg gaatggaaag taaggccata tcagatgccc agattactgc aagcagctac atgcccttgg gaatggaaag taaggccata tcagatgccc agattactgc aagcagctac

39603960

tttacaaaca tgtttgcaac ctggtctcct agtaaagcca ggctgcactt gcagggtagg tttacaaaca tgtttgcaac ctggtctcct agtaaagcca ggctgcactt gcagggtagg

40204020

agcaatgcat ggagacccca ggtcaataac ccaaaagagt ggcttcaagt tgactttcaa agcaatgcat ggagacccca ggtcaataac ccaaaagagt ggcttcaagt tgactttcaa

40804080

aagacaatga aggtaacagg ggtaaccacc caaggggtaa agagtctgct gacatctatg aagacaatga aggtaacagg ggtaaccacc caaggggtaa agagtctgct gacatctatg

41404140

tatgtaaaag aattcctcat ctcaagtagt caagatgggc accagtggac actgttcttc tatgtaaaag aattcctcat ctcaagtagt caagatgggc accagtggac actgttcttc

42004200

cagaatggaa aagttaaggt gttccaaggt aatcaagaca gcttcactcc agtggtgaac cagaatggaa aagttaaggt gttccaaggt aatcaagaca gcttcactcc agtggtgaac

42604260

agtctggatc caccactcct aaccaggtac ctgaggatcc accctcagtc ctgggtccac agtctggatc caccactcct aaccaggtac ctgaggatcc accctcagtc ctgggtccac

43204320

cagatagctc tgagaatgga agtgctgggc tgtgaagctc aggacctata ctga cagatagctc tgagaatgga agtgctgggc tgtgaagctc aggacctata ctga

43744374

<210> 394<210> 394

<211> 7056<211> 7056

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 394<400> 394

atgcaaattg aattgagtac ctgttttttc ctctgtctat taaggttttg tttcagtgca atgcaaattg aattgagtac ctgttttttc ctctgtctat taaggttttg tttcagtgca

60 60

acaagaaggt attatctggg agctgttgag ttatcctggg actacatgca gtctgacctg acaagaaggt attatctggg agctgttgag ttatcctggg actacatgca gtctgacctg

120 120

ggagagctcc cagtggatgc taggtttccc ccaagagtac ccaaaagctt ccctttcaac ggagagctcc cagtggatgc taggtttccc ccaagagtac ccaaaagctt ccctttcaac

180 180

acttctgttg tctataaaaa gactctgttt gtagaattca cagatcatct gtttaacatt acttctgttg tctataaaaa gactctgttt gtagaattca cagatcatct gtttaacatt

240 240

gccaagccta gacctccatg gatggggctg ctgggaccaa ctattcaggc agaggtttat gccaagccta gacctccatg gatggggctg ctgggaccaa ctattcaggc agaggtttat

300 300

gacactgtgg tgattacact taagaatatg gcatcccacc cagtgagcct gcatgctgtt gacactgtgg tgattacact taagaatatg gcatcccacc cagtgagcct gcatgctgtt

360 360

ggggtttcct actggaaggc aagtgaagga gctgagtatg atgaccagac tagccaaaga ggggtttcct actggaaggc aagtgaagga gctgagtatg atgaccagac tagccaaaga

420 420

gagaaggagg atgacaaggt ctttccaggt ggcagccaca cctatgtctg gcaggtgctg gagaaggagg atgacaaggt ctttccaggt ggcagccaca cctatgtctg gcaggtgctg

480 480

aaggagaatg gccctatggc ctctgatcct ttgtgtctaa cctacagtta tttgtctcat aaggagaatg gccctatggc ctctgatcct ttgtgtctaa cctacagtta tttgtctcat

540 540

gtggacctgg tgaaggacct taactcaggg ctgatagggg ccttgctggt gtgtagggag gtggacctgg tgaaggacct taactcaggg ctgatagggg ccttgctggt gtgtagggag

600 600

ggaagcctgg ctaaggaaaa gacacagact ctgcataagt ttattctctt gtttgcagtg ggaagcctgg ctaaggaaaa gacacagact ctgcataagt ttattctctt gtttgcagtg

660 660

tttgatgagg gtaaaagctg gcactctgaa acaaaaaaca gcttgatgca ggacagggat tttgatgagg gtaaaagctg gcactctgaa acaaaaaaca gcttgatgca ggacagggat

720 720

gctgccagtg ctagggcttg gcctaagatg cacacagtca atggctatgt taacagatca gctgccagtg ctagggcttg gcctaagatg cacacagtca atggctatgt taacagatca

780 780

ctgcctggtt tgattggctg ccacagaaag tctgtttact ggcatgtaat tgggatgggg ctgcctggtt tgattggctg ccacagaaag tctgtttact ggcatgtaat tgggatgggg

840 840

acaaccccag aagttcactc tatcttcctg gaagggcaca ccttcctggt tagaaatcat acaaccccag aagttcactc tatcttcctg gaagggcaca ccttcctggt tagaaatcat

900 900

agacaggcat ccttagagat ttctcctatt acattcctga ctgcccagac cctcctcatg agacaggcat ccttagagat ttctcctatt acattcctga ctgccgac cctcctcatg

960 960

gacctgggtc agttcctgct tttttgccac atttcctccc accagcatga tggcatggag gacctgggtc agttcctgct tttttgccac atttcctccc accagcatga tggcatggag

10201020

gcctatgtga aagttgattc ttgccctgag gagcctcagc ttaggatgaa gaacaatgaa gcctatgtga aagttgattc ttgccctgag gagcctcagc ttaggatgaa gaacaatgaa

10801080

gaggctgagg actatgatga tgacctaaca gacagtgaga tggatgttgt gaggtttgat gaggctgagg actatgatga tgacctaaca gacagtgaga tggatgttgt gaggtttgat

11401140

gatgacaatt cacctagttt catccagatt aggtctgtgg ctaagaaaca tccaaagacc gatgacaatt cacctagttt catccagatt aggtctgtgg ctaagaaaca tccaaagacc

12001200

tgggttcact acattgcagc agaggaggag gactgggatt atgcccccct ggttctggca tgggttcact acattgcagc agaggaggag gactgggatt atgcccccct ggttctggca

12601260

cctgatgaca gaagctataa gtcccagtat ctcaacaatg gcccccagag gattggaaga cctgatgaca gaagctataa gtcccagtat ctcaacaatg gcccccagag gattggaaga

13201320

aaatacaaaa aagtcagatt tatggcctat acagatgaga cttttaaaac tagggaagct aaatacaaaa aagtcagatt tatggcctat acagatgaga cttttaaaac tagggaagct

13801380

attcagcatg agtcagggat cctgggacct cttctttatg gagaggtggg ggacactctt attcagcatg agtcagggat cctgggacct cttctttatg gagaggtggg ggacactctt

14401440

ctgataattt ttaaaaatca ggcaagtaga ccttataaca tctaccccca tgggatcact ctgataattt ttaaaaatca ggcaagtaga ccttataaca tctaccccca tgggatcact

15001500

gatgtcaggc ctctgtactc aagaaggctg cccaagggtg tcaaacacct caaggatttc gatgtcaggc ctctgtactc aagaaggctg cccaagggtg tcaaacacct caaggatttc

15601560

cctattcttc ctggggagat cttcaaatac aagtggacag ttactgtgga ggatggcccc cctattcttc ctggggagat cttcaaatac aagtggacag ttactgtgga ggatggcccc

16201620

accaaatctg acccaaggtg cctcaccaga tattacagct cctttgtgaa tatggaaaga accaaatctg acccaaggtg cctcaccaga tattacagct cctttgtgaa tatggaaaga

16801680

gacctagcta gtggtctcat tggcccactg ctcatctgtt acaaggagtc agtggaccag gacctagcta gtggtctcat tggcccactg ctcatctgtt acaaggagtc agtggaccag

17401740

agagggaatc aaattatgtc tgacaagaga aatgtgatcc ttttctcagt gtttgatgag agagggaatc aaattatgtc tgacaagaga aatgtgatcc ttttctcagt gtttgatgag

18001800

aacagaagct ggtatctgac agagaacatt caaaggtttc tgccaaaccc agctggagtt aacagaagct ggtatctgac agagaacatt caaaggtttc tgccaaaccc agctggagtt

18601860

cagctggagg accctgaatt ccaggcatct aatattatgc attctatcaa tggatatgtg cagctggagg accctgaatt ccaggcatct aatattatgc attctatcaa tggatatgtg

19201920

tttgatagtc tgcagctgtc tgtgtgcctg catgaagtgg cctactggta tatcctctct tttgatagtc tgcagctgtc tgtgtgcctg catgaagtgg cctactggta tatcctctct

19801980

attggtgccc agacagattt cttgtctgtg tttttcagtg gttacacatt taaacataaa attggtgccc agacagattt cttgtctgtg tttttcagtg gttacacatt taaacataaa

20402040

atggtgtatg aggacacact tacattattc ccttttagtg gagagacagt gtttatgtcc atggtgtatg aggacacact tacattattc ccttttagtg gagagacagt gtttatgtcc

21002100

atggagaatc caggcctgtg gatcttgggg tgtcataata gtgactttag gaatagaggt atggagaatc caggcctgtg gatcttgggg tgtcataata gtgactttag gaatagaggt

21602160

atgacagctc tgctcaaagt gtcttcctgt gacaagaaca caggggacta ttatgaggac atgacagctc tgctcaaagt gtcttcctgt gacaagaaca caggggacta ttatgaggac

22202220

tcttatgagg acatttcagc ctatttactg tccaagaaca atgccattga accaagatct tcttatgagg acatttcagc ctatttactg tccaagaaca atgccattga accaagatct

22802280

ttctctcaga actcaagaca ccccagcacc aggcagaagc agttcaatgc aaccaccatc ttctctcaga actcaagaca ccccagcacc aggcagaagc agttcaatgc aaccaccatc

23402340

ccagagaatg atattgaaaa aactgaccct tggtttgccc acaggactcc catgcctaag ccagagaatg atattgaaaa aactgaccct tggtttgccc acaggactcc catgcctaag

24002400

attcagaatg tatcttcatc agacttgctg atgctcctga gacagagccc aactcctcat attcagaatg tatcttcatc agacttgctg atgctcctga gacagagccc aactcctcat

24602460

ggcctgagct taagtgacct ccaggaggct aagtatgaaa ctttctcaga tgatcccagt ggcctgagct taagtgacct caccagggct aagtatgaaa ctttctcaga tgatcccagt

25202520

cctggtgcca ttgattctaa taattccctg tctgagatga cacacttcag accccagctc cctggtgcca ttgattctaa taattccctg tctgagatga cacacttcag accccagctc

25802580

caccactctg gagatatggt ctttactcct gaatcaggcc tgcagctgag gctgaatgaa caccactctg gagatatggt ctttactcct gaatcaggcc tgcagctgag gctgaatgaa

26402640

aagcttggca ccacagcagc tactgaactg aaaaagctgg attttaaagt gagctccaca aagcttggca ccacagcagc tactgaactg aaaaagctgg attttaaagt gagctccaca

27002700

tccaacaacc tgatttccac tatcccctca gataacttgg cagcagggac tgataacaca tccaacaacc tgatttccac tatcccctca gataacttgg cagcagggac tgataacaca

27602760

agctcactgg gtcccccttc catgcctgtc cattatgata gtcagctgga tactactctg agctcactgg gtcccccttc catgcctgtc cattatgata gtcagctgga tactactctg

28202820

tttggtaaga aatcctctcc cctgactgaa agtggaggcc ctctttccct gtcagaggag tttggtaaga aatcctctcc cctgactgaa agtggaggcc ctctttccct gtcagaggag

28802880

aacaatgaca gcaaactgtt agagtctgga ctcatgaact cacaggaaag ttcttggggc aacaatgaca gcaaactgtt agagtctgga ctcatgaact cacaggaaag ttcttggggc

29402940

aagaatgtgt ctagcactga gtctgggaga ctgtttaagg gcaagagggc ccatggacca aagaatgtgt ctagcactga gtctgggaga ctgtttaagg gcaagagggc ccatggacca

30003000

gccctgctga caaaggataa tgcactgttt aaggtctcaa tcagcctgtt gaagaccaac gccctgctga caaaggataa tgcactgttt aaggtctcaa tcagcctgtt gaagaccaac

30603060

aaaaccagta ataattctgc aacaaacagg aagacccaca ttgatggacc ctctcttctc aaaaccagta ataattctgc aacaaacagg aagacccaca ttgatggacc ctctcttctc

31203120

attgagaatt ccccttctgt ctggcagaac atcttggaat cagatacaga gttcaagaag attgagaatt ccccttctgt ctggcagaac atcttggaat cagatacaga gttcaagaag

31803180

gtgactcccc tgatccatga taggatgctc atggataaga atgccacagc actcaggctc gtgactcccc tgatccatga taggatgctc atggataaga atgccacagc actcaggctc

32403240

aatcacatga gcaacaagac tacctcctcc aaaaatatgg agatggtgca gcagaagaag aatcacatga gcaacaagac tacctcctcc aaaaatatgg agatggtgca gcagaagaag

33003300

gaaggtccca ttccccctga tgcacagaat ccagatatga gcttctttaa gatgctgttt gaaggtccca ttccccctga tgcacagaat ccagatatga gcttctttaa gatgctgttt

33603360

ttgcctgagt ctgccaggtg gattcagagg acacatggga agaactcact taactctggc ttgcctgagt ctgccaggtg gattcagagg acacatggga agaactcact taactctggc

34203420

caaggtccca gtcctaagca gttggtgagc ttggggcctg agaaaagtgt ggagggacag caaggtccca gtcctaagca gttggtgagc ttggggcctg agaaaagtgt ggagggacag

34803480

aatttcctgt ctgaaaagaa caaagtggtt gtgggcaaag gagagttcac taaagatgtg aatttcctgt ctgaaaagaa caaagtggtt gtgggcaaag gagagttcac taaagatgtg

35403540

ggactgaagg agatggtgtt tcctagttca agaaatctct ttcttaccaa tcttgataac ggactgaagg agatggtgtt tcctagttca agaaatctct ttcttaccaa tcttgataac

36003600

ctgcatgaga acaacaccca caatcaggaa aagaagatcc aggaggaaat tgagaagaag ctgcatgaga acaacaccca caatcaggaa aagaagatcc aggaggaaat tgagaagaag

36603660

gaaaccctga tccaggaaaa tgttgtgctg ccacagatcc acactgttac tgggaccaaa gaaaccctga tccaggaaaa tgttgtgctg ccacagatcc acactgttac tgggaccaaa

37203720

aatttcatga aaaacctgtt tctcctgtct accagacaga atgtagaggg aagctatgat aatttcatga aaaacctgtt tctcctgtct accagacaga atgtagaggg aagctatgat

37803780

ggggcctatg cccctgttct ccaggacttc agatccctga atgactccac caacaggact ggggcctatg cccctgttct ccaggacttc agatccctga atgactccac caacaggact

38403840

aagaaacata ctgcacactt tagtaagaag ggggaggagg agaacctgga gggattggga aagaaacata ctgcacactt tagtaagaag ggggaggagg agaacctgga gggattggga

39003900

aaccagacca agcagattgt ggagaaatat gcttgcacca ctagaatctc acctaacaca aaccagacca agcagattgt ggagaaatat gcttgcacca ctagaatctc acctaacaca

39603960

agccagcaga actttgtgac ccagaggtct aagagggccc tcaaacagtt tagattgcct agccagcaga actttgtgac ccagaggtct aagagggccc tcaaacagtt tagattgcct

40204020

ttggaggaga ctgagctgga aaagaggatt attgtggatg acacctctac ccagtggagc ttggaggaga ctgagctgga aaagaggatt attgtggatg acacctctac ccagtggagc

40804080

aagaatatga agcacctgac cccaagcacc cttactcaga ttgattacaa tgaaaaagaa aagaatatga agcacctgac cccaagcacc cttactcaga ttgattacaa tgaaaaagaa

41404140

aagggtgcca tcacccagag ccccttgagt gactgtttga caaggtccca cagtatccca aagggtgcca tcacccagag ccccttgagt gactgtttga caaggtccca cagtatccca

42004200

caggctaaca gatctcctct gcctattgcc aaggtcagct ccttcccttc catcagaccc caggctaaca gatctcctct gcctattgcc aaggtcagct ccttcccttc catcagaccc

42604260

atctatctga ccagagtgct gttccaggac aactcctctc atctgccagc tgcctcctat atctatctga ccagagtgct gttccaggac aactcctctc atctgccagc tgcctcctat

43204320

aggaagaagg atagtggtgt gcaggaatca tctcactttc tgcagggagc caagaagaac aggaagaagg atagtggtgt gcaggaatca tctcactttc tgcagggagc caagaagaac

43804380

aatctgagcc tggcaattct cacacttgag atgacaggag accagaggga agtgggaagt aatctgagcc tggcaattct cacacttgag atgacaggag accagaggga agtgggaagt

44404440

ctgggcactt ctgctaccaa ttctgtcacc tacaagaaag tggagaatac agttctgccc ctgggcactt ctgctaccaa ttctgtcacc tacaagaaag tggagaatac agttctgccc

45004500

aagccagacc tgcctaaaac atctggaaag gttgagctgc tgcctaaggt gcacatatac aagccagacc tgcctaaaac atctggaaag gttgagctgc tgcctaaggt gcacatatac

45604560

cagaaggacc tattccctac agagacatcc aatggctccc caggccacct ggacttggta cagaaggacc tattccctac agagacatcc aatggctccc caggccacct ggacttggta

46204620

gaggggtctc tcctgcaggg cactgaaggt gctatcaagt ggaatgaggc taatagacct gaggggtctc tcctgcaggg cactgaaggt gctatcaagt ggaatgaggc taatagacct

46804680

gggaaggtgc catttctgag ggtggccaca gagagctcag ctaagacacc cagcaagctg gggaaggtgc catttctgag ggtggccaca gagagctcag ctaagacacc cagcaagctg

47404740

cttgatcccc tggcctggga caatcactat ggaacccaga ttcctaagga ggagtggaag cttgatcccc tggcctggga caatcactat ggaacccaga ttcctaagga ggagtggaag

48004800

tcccaggaga agtccccaga gaagactgct ttcaagaaga aggacactat cctctccctg tcccaggaga agtccccaga gaagactgct ttcaagaaga aggacactat cctctccctg

48604860

aatgcctgtg agtctaacca tgctattgct gccatcaatg aaggccagaa caagcctgaa aatgcctgtg agtctaacca tgctattgct gccatcaatg aaggccagaa caagcctgaa

49204920

attgaggtga catgggccaa gcagggcaga acagagaggc tgtgcagcca gaacccacct attgaggtga catgggccaa gcagggcaga acagagaggc tgtgcagcca gaacccacct

49804980

gtgctcaaga ggcaccagag agagatcact agaaccactc tgcagtcaga ccaggaagag gtgctcaaga ggcaccagag agagatcact agaaccactc tgcagtcaga cccaggaagag

50405040

attgactatg atgacaccat ctcagttgag atgaaaaagg aggattttga tatttatgat attgactatg atgacaccat ctcagttgag atgaaaaagg aggattttga tatttatgat

51005100

gaggatgaga atcaatcccc aagatctttt cagaagaaga caagacatta cttcattgct gaggatgaga atcaatcccc aagatctttt cagaagaaga caagacatta cttcattgct

51605160

gcagtggaga gactgtggga ttatggcatg tcctcctcac ctcatgtgct gagaaataga gcagtggaga gactgtggga ttatggcatg tcctcctcac ctcatgtgct gagaaataga

52205220

gcccagtctg gctctgtgcc ccagttcaaa aaagtggtgt ttcaggagtt cacagatggt gcccagtctg gctctgtgcc ccagttcaaa aaagtggtgt ttcaggagtt cacagatggt

52805280

tccttcacac agcccctgta caggggtgag ctgaatgagc acctggggtt gctgggcccc tccttcacac agcccctgta caggggtgag ctgaatgagc acctggggtt gctgggcccc

53405340

tacatcagag ctgaagttga ggataatatt atggtgacct tcaggaatca ggccagtagg tacatcagag ctgaagttga ggataatatt atggtgacct tcaggaatca ggccagtagg

54005400

ccttactctt tctactccag cctgatctca tatgaggagg accagagaca gggggctgaa ccttactctt tctactccag cctgatctca tatgaggagg accagagaca gggggctgaa

54605460

cctaggaaga attttgtgaa gcccaatgaa acaaagacat acttctggaa ggtgcagcac cctaggaaga attttgtgaa gcccaatgaa acaaagacat acttctggaa ggtgcagcac

55205520

cacatggctc ctaccaagga tgaatttgat tgcaaggctt gggcctattt ttctgatgtg cacatggctc ctaccaagga tgaatttgat tgcaaggctt gggcctattt ttctgatgtg

55805580

gacctggaga aggatgtgca ttctggcctc attggccctc tcttggtgtg tcacaccaat gacctggaga aggatgtgca ttctggcctc attggccctc tcttggtgtg tcacaccaat

56405640

accttgaatc cagcccatgg cagacaggtg actgttcagg agtttgctct gtttttcacc accttgaatc cagcccatgg cagacaggtg actgttcagg agtttgctct gtttttcacc

57005700

atctttgatg agacaaagtc ctggtatttt acagagaata tggagaggaa ttgcagggcc atctttgatg agacaaagtc ctggtatttt acagagaata tggagaggaa ttgcagggcc

57605760

ccctgcaaca tccagatgga agacccaacc ttcaaggaga actacagatt ccatgcaatc ccctgcaaca tccagatgga agacccaacc ttcaaggaga actacagatt ccatgcaatc

58205820

aatggatata tcatggacac cctgcctggc ctggttatgg ctcaggatca gagaatcagg aatggatata tcatggacac cctgcctggc ctggttatgg ctcaggatca gagaatcagg

58805880

tggtatctgc tgtctatggg gtcaaatgag aacatccata gtatccactt ctctggccat tggtatctgc tgtctatggg gtcaaatgag aacatccata gtatccactt ctctggccat

59405940

gtgtttacag tgagaaagaa ggaagaatat aagatggccc tgtacaacct ctaccctgga gtgtttacag tgagaaagaa ggaagaatat aagatggccc tgtacaacct ctaccctgga

60006000

gtgtttgaaa ctgttgaaat gctgccttca aaggctggaa tctggagggt ggaatgcctg gtgtttgaaa ctgttgaaat gctgccttca aaggctggaa tctggagggt ggaatgcctg

60606060

attggagagc accttcatgc tggcatgtcc accctgtttc tggtgtacag caataagtgt attggagagc accttcatgc tggcatgtcc accctgtttc tggtgtacag caataagtgt

61206120

cagactcctc tgggtatggc ttcaggccac atcagggact tccagatcac tgcctcagga cagactcctc tgggtatggc ttcaggccac atcagggact tccagatcac tgcctcagga

61806180

cagtatggac agtgggctcc caaactggca aggctccact actcaggcag cattaatgcc cagtatggac agtgggctcc caaactggca aggctccact actcaggcag cattaatgcc

62406240

tggtccacca aagagccttt cagctggatt aaggtggatc tcctggcacc tatgatcatc tggtccacca aagagccttt cagctggatt aaggtggatc tcctggcacc tatgatcatc

63006300

catgggatca agactcaggg agctaggcag aagtttagca gcctgtacat ttctcagttt catgggatca agactcaggg agctaggcag aagtttagca gcctgtacat ttctcagttt

63606360

atcattatgt acagcctgga tggaaaaaag tggcagacct atagaggaaa ctccactgga atcattatgt acagcctgga tggaaaaaag tggcagacct atagaggaaa ctccactgga

64206420

acactgatgg tgttttttgg caatgtggac tcaagtggga tcaagcacaa tatcttcaac acactgatgg tgttttttgg caatgtggac tcaagtggga tcaagcacaa tatcttcaac

64806480

ccccctatca ttgccagata catcaggctc caccctacac actactctat cagatctaca ccccctatca ttgccagata catcaggctc caccctacac actactctat cagatctaca

65406540

cttaggatgg agctgatggg atgtgatctg aactcttgca gtatgcctct gggtatggag cttaggatgg agctgatggg atgtgatctg aactcttgca gtatgcctct gggtatggag

66006600

tccaaggcca tctctgatgc tcagatcaca gccagctctt actttactaa tatgtttgct tccaaggcca tctctgatgc tcagatcaca gccagctctt actttactaa tatgtttgct

66606660

acctggtccc caagcaaggc aagactgcac ctgcagggca gatccaatgc ttggagaccc acctggtccc caagcaaggc aagactgcac ctgcagggca gatccaatgc ttggagaaccc

67206720

caggtgaata acccaaaaga gtggcttcag gtggacttcc agaagactat gaaggtgact caggtgaata acccaaaaga gtggcttcag gtggacttcc agaagactat gaaggtgact

67806780

ggagtgacca cccagggggt gaagtcactg ctgacctcca tgtatgtgaa ggagttcctg ggagtgacca cccagggggt gaagtcactg ctgacctcca tgtatgtgaa ggagttcctg

68406840

atctccagct cccaggatgg ccaccagtgg accctgttct tccagaatgg aaaggtgaag atctccagct cccaggatgg ccaccagtgg accctgttct tccagaatgg aaaggtgaag

69006900

gtgttccagg gaaaccagga ctcctttacc cctgtggtga actccctgga ccccccactg gtgttccagg gaaaccagga ctcctttacc cctgtggtga actccctgga ccccccactg

69606960

ctgaccagat acctgagaat ccatccccag agctgggtgc accagattgc ccttaggatg ctgaccagat acctgagaat ccatccccag agctgggtgc accagattgc ccttaggatg

70207020

gaggtgctgg gatgtgaagc ccaggacctg tactaa gaggtgctgg gatgtgaagc ccaggacctg tactaa

70567056

<210> 395<210> 395

<211> 5013<211> 5013

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 395<400> 395

atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct

60 60

accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg

120 120

ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac

180 180

acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt

240 240

gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat

300 300

gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta

360 360

ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga

420 420

gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg

480 480

aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat

540 540

gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa

600 600

gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg

660 660

tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat

720 720

gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc gctgcatctg cccaggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc

780 780

ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc

840 840

accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat

900 900

agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg

960 960

gacttggggc agtttctgtt attctgccac atcagcagcc atcaacatga tggtatggaa gacttggggc agtttctgtt attctgccac atcagcagcc atcaacatga tggtatggaa

10201020

gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag

10801080

gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagattgat

11401140

gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc

12001200

tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc

12601260

cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga

13201320

aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc

13801380

atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg

14401440

ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca

15001500

gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt

15601560

ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct

16201620

actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga

16801680

gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag

17401740

agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag

18001800

aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg

18601860

cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg

19201920

tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct

19801980

attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag

20402040

atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct

21002100

atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt

21602160

atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat

22202220

tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc

22802280

ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc

23402340

ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag

24002400

attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat

24602460

ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc

25202520

ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc

25802580

caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag

26402640

aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact

27002700

tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca

27602760

agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt

28202820

tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag

28802880

aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc

29402940

aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt

30003000

gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag

30603060

gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct

31203120

gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct

31803180

cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt

32403240

tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat

33003300

atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc

33603360

tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct

34203420

agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac

34803480

atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat

35403540

ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca

36003600

ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt

36603660

tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct

37203720

tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat

37803780

ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg

38403840

tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg

39003900

ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg

39603960

tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt

40204020

ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag

40804080

acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag

41404140

tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg

42004200

tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat

42604260

gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc

43204320

attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc

43804380

ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct

44404440

cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt

45004500

aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc

45604560

aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc

46204620

tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag

46804680

gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga

47404740

gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc

48004800

tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg

48604860

tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg

49204920

accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag

49804980

gtgctgggct gtgaggccca ggacctgtac tga gtgctgggct gtgaggccca ggacctgtac tga

50135013

<210> 396<210> 396

<211> 5013<211> 5013

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полинуклеотидpolynucleotide

<400> 396<400> 396

atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct

60 60

accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg

120 120

ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac

180 180

acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt

240 240

gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat

300 300

gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta

360 360

ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga

420 420

gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg

480 480

aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat

540 540

gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa

600 600

gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg

660 660

tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat

720 720

gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc gctgcatctg cccaggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc

780 780

ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc

840 840

accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat

900 900

agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg

960 960

gacttggggc agtttctgtt aagctgccac atcagcagcc atcaacatga tggtatggaa gacttggggc agtttctgtt aagctgccac atcagcagcc atcaacatga tggtatggaa

10201020

gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag

10801080

gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagattgat

11401140

gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc

12001200

tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc

12601260

cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga

13201320

aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc

13801380

atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg

14401440

ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca

15001500

gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt

15601560

ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct

16201620

actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga

16801680

gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag

17401740

agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag

18001800

aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg

18601860

cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg

19201920

tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct

19801980

attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag

20402040

atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct

21002100

atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt

21602160

atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat

22202220

tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc

22802280

ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc

23402340

ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag

24002400

attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat

24602460

ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc

25202520

ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc

25802580

caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag

26402640

aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact

27002700

tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca

27602760

agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt

28202820

tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag

28802880

aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc

29402940

aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt

30003000

gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag

30603060

gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct

31203120

gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct

31803180

cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt

32403240

tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat

33003300

atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc

33603360

tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct

34203420

agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac

34803480

atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat

35403540

ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca

36003600

ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt

36603660

tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct

37203720

tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat

37803780

ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg

38403840

tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg

39003900

ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg

39603960

tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt

40204020

ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag

40804080

acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag

41404140

tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg

42004200

tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat

42604260

gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc

43204320

attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc

43804380

ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct

44404440

cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt

45004500

aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc

45604560

aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc

46204620

tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag

46804680

gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga

47404740

gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc

48004800

tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg

48604860

tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg

49204920

accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag

49804980

gtgctgggct gtgaggccca ggacctgtac tga gtgctgggct gtgaggccca ggacctgtac tga

50135013

<210> 397<210> 397

<211> 1670<211> 1670

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полипептидpolypeptide

<400> 397<400> 397

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 151 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu SerCys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30 20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala ArgTrp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45 35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val ValPhe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60 50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn IleTyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 8065 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile GlnAla Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95 85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala SerAla Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110 100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala SerHis Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125 115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu AspGlu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140 130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val LeuAsp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr SerLys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175 165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu IleTyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190 180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys ThrGly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205 195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu GlyGln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220 210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg AspLys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly TyrAla Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255 245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser ValVal Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270 260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser IleTyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285 275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala SerPhe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300 290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu MetLeu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln HisAsp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln His

325 330 335 325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu ProAsp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350 340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp AspGln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365 355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn SerLeu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380 370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys ThrPro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala ProTrp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415 405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu AsnLeu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430 420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe MetAsn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445 435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His GluAla Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460 450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr LeuSer Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr ProLeu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495 485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro LysHis Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510 500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile PheGly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525 515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser AspLys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540 530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu ArgPro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys GluAsp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575 565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn ValSer Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590 580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr GluIle Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605 595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu AspAsn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620 610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr ValPro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr TrpPhe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655 645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe PheTyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670 660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu ThrSer Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685 675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn ProLeu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700 690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg GlyGly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly AspMet Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735 725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser LysTyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750 740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His ProAsn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro

755 760 765 755 760 765

Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn AspSer Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp

770 775 780 770 775 780

Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro LysIle Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys

785 790 795 800785 790 795 800

Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln SerIle Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser

805 810 815 805 810 815

Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys TyrPro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr

820 825 830 820 825 830

Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn AsnGlu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn

835 840 845 835 840 845

Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser GlySer Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly

850 855 860 850 855 860

Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn GluAsp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu

865 870 875 880865 870 875 880

Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe LysLys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys

885 890 895 885 890 895

Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp AsnVal Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn

900 905 910 900 905 910

Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser MetLeu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met

915 920 925 915 920 925

Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys LysPro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys

930 935 940 930 935 940

Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu GluSer Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu

945 950 955 960945 950 955 960

Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln GluAsn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu

965 970 975 965 970 975

Ser Ser Trp Gly Lys Asn Val Ser Ser Arg Glu Ile Thr Arg Thr ThrSer Ser Trp Gly Lys Asn Val Ser Ser Arg Glu Ile Thr Arg Thr Thr

980 985 990 980 985 990

Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser ValLeu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val

995 1000 1005 995 1000 1005

Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu AsnGlu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn

1010 1015 1020 1010 1015 1020

Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe IleGln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile

1025 1030 1035 1025 1030 1035

Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser ProAla Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro

1040 1045 1050 1040 1045 1050

His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln PheHis Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe

1055 1060 1065 1055 1060 1065

Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr GlnLys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln

1070 1075 1080 1070 1075 1080

Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu GlyPro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly

1085 1090 1095 1085 1090 1095

Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr PhePro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe

1100 1105 1110 1100 1105 1110

Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu IleArg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile

1115 1120 1125 1115 1120 1125

Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys AsnSer Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn

1130 1135 1140 1130 1135 1140

Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val GlnPhe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln

1145 1150 1155 1145 1150 1155

His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala TrpHis His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp

1160 1165 1170 1160 1165 1170

Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser GlyAla Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly

1175 1180 1185 1175 1180 1185

Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn ProLeu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro

1190 1195 1200 1190 1195 1200

Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe PheAla His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe

1205 1210 1215 1205 1210 1215

Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn MetThr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met

1220 1225 1230 1220 1225 1230

Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp ProGlu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro

1235 1240 1245 1235 1240 1245

Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr IleThr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile

1250 1255 1260 1250 1255 1260

Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg IleMet Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile

1265 1270 1275 1265 1270 1275

Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His SerArg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser

1280 1285 1290 1280 1285 1290

Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu GluIle His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu

1295 1300 1305 1295 1300 1305

Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu ThrTyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr

1310 1315 1320 1310 1315 1320

Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu CysVal Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys

1325 1330 1335 1325 1330 1335

Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe LeuLeu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu

1340 1345 1350 1340 1345 1350

Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser GlyVal Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly

1355 1360 1365 1355 1360 1365

His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly GlnHis Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln

1370 1375 1380 1370 1375 1380

Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile AsnTrp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn

1385 1390 1395 1385 1390 1395

Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp LeuAla Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu

1400 1405 1410 1400 1405 1410

Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala ArgLeu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg

1415 1420 1425 1415 1420 1425

Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met TyrGln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr

1430 1435 1440 1430 1435 1440

Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser ThrSer Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr

1445 1450 1455 1445 1450 1455

Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly IleGly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile

1460 1465 1470 1460 1465 1470

Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile ArgLys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg

1475 1480 1485 1475 1480 1485

Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met GluLeu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu

1490 1495 1500 1490 1495 1500

Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly MetLeu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met

1505 1510 1515 1505 1510 1515

Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser TyrGlu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr

1520 1525 1530 1520 1525 1530

Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg LeuPhe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu

1535 1540 1545 1535 1540 1545

His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn AsnHis Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn

1550 1555 1560 1550 1555 1560

Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys ValPro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val

1565 1570 1575 1565 1570 1575

Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser MetThr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met

1580 1585 1590 1580 1585 1590

Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His GlnTyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln

1595 1600 1605 1595 1600 1605

Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln GlyTrp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly

1610 1615 1620 1610 1615 1620

Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro ProAsn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro

1625 1630 1635 1625 1630 1635

Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val HisLeu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His

1640 1645 1650 1640 1645 1650

Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln AspGln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp

1655 1660 1665 1655 1660 1665

Leu TyrLeu Tyr

1670 1670

<210> 398<210> 398

<211> 31<211> 31

<212> БЕЛОК<212> PROTEIN

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic

полипептидpolypeptide

<400> 398<400> 398

Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr SerSer Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser

1 5 10 151 5 10 15

Asn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln ArgAsn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln Arg

20 25 30 20 25 30

<---<---

Claims (55)

1. Бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК) для экспрессии белка фактора VIII (FVIII), содержащий:1. A non-capsid closed-end DNA (ccDNA) vector for the expression of factor VIII (FVIII) protein, containing: по меньшей мере одну последовательность нуклеиновой кислоты, расположенную между фланкирующими инвертированными концевыми повторами (ITR), причем указанная по меньшей мере одна последовательность нуклеиновой кислоты кодирует по меньшей мере один белок фактора VIII (FVIII), и оптимизирована по кодонам для экспрессии в клетке, при этом указанная по меньшей мере одна последовательность нуклеиновой кислоты, кодирующая указанный по меньшей мере один белок FVIII, имеет по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.at least one nucleic acid sequence located between flanking inverted terminal repeats (ITRs), wherein the at least one nucleic acid sequence encodes at least one factor VIII (FVIII) protein and is codon optimized for expression in a cell, wherein said at least one nucleic acid sequence encoding said at least one FVIII protein has at least 85% identity with a sequence selected from the group consisting of sequences SEQ ID NO: 380-397. 2. ЗкДНК-вектор по п. 1, отличающийся тем, что указанный по меньшей мере один белок FVIII имеет по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из SEQ IS NO: 380, 387 и 393.2. The cDNA vector according to claim 1, characterized in that said at least one FVIII protein has at least 85% identity with a sequence selected from the group consisting of SEQ IS NO: 380, 387 and 393. 3. ЗкДНК-вектор по п. 1, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 192-217.3. The cccDNA vector according to claim 1, wherein said ccDNA vector contains a nucleic acid sequence having at least 85% identity with a sequence selected from the group consisting of sequences SEQ ID NO: 192-217. 4. ЗкДНК-вектор по п. 1 или 3, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 210.4. The cccDNA vector according to claim 1 or 3, characterized in that said ccDNA vector contains a nucleic acid sequence that is at least 85% identical to SEQ ID NO: 210. 5. ЗкДНК-вектор по п. 1 или 3, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 214.5. The cccDNA vector according to claim 1 or 3, characterized in that said ccDNA vector contains a nucleic acid sequence that is at least 85% identical to SEQ ID NO: 214. 6. ЗкДНК-вектор по любому из пп. 1-5, отличающийся тем, что указанный зкДНК-вектор содержит промотор, функционально связанный по меньшей мере с указанной одной последовательностью нуклеиновой кислоты, которая кодирует указанный по меньшей мере один белок FVIII.6. CctDNA vector according to any one of paragraphs. 1-5, characterized in that said cDNA vector contains a promoter operably linked to at least one nucleic acid sequence that encodes said at least one FVIII protein. 7. ЗкДНК-вектор по любому из пп. 1-6, отличающийся тем, что указанный зкДНК-вектор содержит энхансер.7. CctDNA vector according to any one of paragraphs. 1-6, characterized in that said cDNA vector contains an enhancer. 8. ЗкДНК-вектор по любому из пп. 1-7, отличающийся тем, что указанный зкДНК-вектор содержит последовательность 5'-UTR и/или интрона.8. CctDNA vector according to any one of paragraphs. 1-7, characterized in that said cDNA vector contains a 5'-UTR and/or intron sequence. 9. ЗкДНК-вектор по любому из пп. 1-8, отличающийся тем, что указанный зкДНК-вектор содержит последовательность 3'-UTR.9. CctDNA vector according to any one of paragraphs. 1-8, characterized in that said cDNA vector contains a 3'-UTR sequence. 10. ЗкДНК-вектор по любому из пп. 1-9, отличающийся тем, что указанный зкДНК-вектор содержит по меньшей мере одну последовательность поли-(А).10. CctDNA vector according to any one of paragraphs. 1-9, characterized in that said cDNA vector contains at least one poly(A) sequence. 11. ЗкДНК-вектор по любому из пп. 1-10, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой кДНК.11. CctDNA vector according to any one of paragraphs. 1-10, characterized in that said at least one nucleic acid sequence is cDNA. 12. ЗкДНК-вектор по любому из пп. 1-11, отличающийся тем, что по меньшей мере один из указанных фланкирующих ITR содержит функциональный сайт концевого разрешения и сайт связывания репликационного белка (Rep).12. CctDNA vector according to any one of paragraphs. 1-11, characterized in that at least one of these flanking ITRs contains a functional end resolution site and a replication protein (Rep) binding site. 13. ЗкДНК-вектор по любому из пп. 1-12, отличающийся тем, что один или оба из указанных фланкирующих ITR происходят из вируса, выбранного из группы, состоящей из парвовируса, депендовируса и аденоассоциированного вируса (ААВ).13. CctDNA vector according to any one of paragraphs. 1-12, characterized in that one or both of said flanking ITRs are derived from a virus selected from the group consisting of parvovirus, dependovirus and adeno-associated virus (AAV). 14. ЗкДНК-вектор по любому из пп. 1-13, отличающийся тем, что указанные фланкирующие ITR являются симметричными или асимметричными.14. CctDNA vector according to any one of paragraphs. 1-13, characterized in that said flanking ITRs are symmetrical or asymmetrical. ] 5. ЗкДНК-вектор по п. 14, отличающийся тем, что указанные фланкирующие ITR являются симметричными или по существу симметричными.] 5. The cctDNA vector according to claim 14, characterized in that said flanking ITRs are symmetrical or substantially symmetrical. 16. ЗкДНК-вектор по п. 14, отличающийся тем, что указанные фланкирующие ITR являются асимметричными.16. CctDNA vector according to claim 14, characterized in that said flanking ITRs are asymmetric. 17. ЗкДНК-вектор по любому из пп. 1-16, отличающийся тем, что один из указанных ITR относится к дикому типу, или оба из указанных ITR являются ITR дикого типа.17. CctDNA vector according to any one of paragraphs. 1-16, characterized in that one of these ITRs is wild type, or both of these ITRs are wild type ITRs. 18. ЗкДНК-вектор по любому из пп. 1-17, отличающийся тем, что указанные фланкирующие ITR происходят из различных вирусных серотипов.18. CctDNA vector according to any one of paragraphs. 1-17, characterized in that said flanking ITRs come from different viral serotypes. 19. ЗкДНК-вектор по любому из пп. 1-18, отличающийся тем, что указанные фланкирующие ITR происходят из пары вирусных серотипов, выбранных из группы, состоящей из пар вирусных серотипов ААВ1, ААВ1; ААВ2, ААВ2; ААВ3, ААВ3; ААВ4, ААВ4; ААВ5, ААВ5; ААВ1, ААВ2; ААВ2, ААВ3; ААВ3, ААВ4; ААВ4, ААВ5; ААВ5, ААВ6; ААВ1, ААВ3; ААВ2, ААВ4; ААВ3, ААВ5; ААВ4, ААВ6; ААВ5, ААВ7; ААВ1, ААВ4; ААВ2, ААВ5; ААВ3, ААВ6; ААВ4, ААВ7; ААВ5, ААВ8; ААВ1, ААВ5; ААВ2, ААВ6; ААВ3, ААВ7; ААВ4, ААВ8; ААВ5, ААВ9; ААВ1, ААВ6; ААВ2, ААВ7; ААВ3, ААВ8; ААВ4, ААВ9; ААВ5, ААВ10; ААВ1, ААВ7; ААВ2, ААВ8; ААВ3, ААВ9; ААВ4, ААВ10; ААВ5, ААВ11; ААВ1, ААВ8; ААВ2, ААВ9; ААВ3, ААВ10; ААВ4, ААВН; ААВ5, ААВ12; ААВ1, ААВ9; ААВ2, ААВ10; ААВ3, ААВ11; ААВ4, ААВ12; ААВ5, AABRH8; ААВ1, ААВ10; ААВ2, ААВ11; ААВ3, ААВ12; ААВ4, AABRH8; ААВ5, AABRH10; ААВ1, ААВ11; ААВ2, ААВ12; ААВ3, AABRH8; ААВ4, AABRH10; ААВ5, ААВ13; ААВ1, ААВ12; ААВ2, AABRH8; ААВ3, AABRH10; ААВ4, ААВ13; ААВ5, AABDJ; ААВ1, AABRH8; ААВ2, AABRH10; ААВ3, ААВ13; ААВ4, AABDJ; ААВ5, AABDJ8; ААВ1, AABRH10; AAB2, AAB13; ААВ3, AABDJ; AAB4, AABDJ8; AAB5, птичий; AAB1, ААВ13; AAB2, AABDJ; ААВ3, AABDJ8; AAB4, птичий; AAB5, бычий; ААВ1, AABDJ; AAB2, AABDJ8; ААВ3, птичий; ААВ4, бычий; ААВ5, собачий; ААВ1, AABDJ8; ААВ2, птичий; ААВ3, бычий; ААВ4, собачий; ААВ5, лошадиный; ААВ1, птичий; ААВ2, бычий; ААВ3, собачий; ААВ4, лошадиный; ААВ5, козий; ААВ1, бычий; ААВ2, собачий; ААВ3, лошадиный; ААВ4, козий; ААВ5, креветки; ААВ1, собачий; ААВ2, лошадиный; ААВ3, козий; ААВ4, креветки; ААВ5, свиной; ААВ1, лошадиный; ААВ2, козий; ААВ3, креветки; ААВ4, свиной; ААВ5, насекомых; ААВ1, козий; ААВ2, креветки; ААВ3, свиной; ААВ4, насекомых; ААВ5, овечий; ААВ1, креветки; ААВ2, свиной; ААВ3, насекомых; ААВ4, овечий; ААВ5, В19; ААВ1, свиной; ААВ2, насекомых; ААВ3, овечий; ААВ4, В19; ААВ5, MVM; ААВ1, насекомых; ААВ2, овечий; ААВ3, В19; ААВ4, MVM; ААВ5, гусиный; ААВ1, овечий; ААВ2, В19; ААВ3, MVM; ААВ4, гусиный; ААВ5, змеиный; ААВ1, В19; ААВ2, MVM; ААВ3, гусиный; ААВ4, змеиный; ААВ1, MVM; ААВ2, гусиный; ААВ3, змеиный; ААВ1, гусиный; ААВ2, змеиный; ААВ1, змеиный; ААВ6, ААВ6; ААВ7, ААВ7; ААВ8, ААВ8; ААВ9, ААВ9; ААВ10, ААВ10; ААВ6, ААВ7; ААВ7, ААВ8; ААВ8, ААВ9; ААВ9, ААВ10; ААВ10, ААВ11; ААВ6, ААВ8; ААВ7, ААВ9; ААВ8, ААВ10; ААВ9, ААВ11; ААВ10, ААВ12; ААВ6, ААВ9; ААВ7, ААВ10; ААВ8, ААВ11; ААВ9, ААВ12; ААВ10, AABRH8; ААВ6, ААВ10; ААВ7, ААВ11; ААВ8, ААВ12; ААВ9, AABRH8; ААВ10, AABRH10; ААВ6, ААВ11; ААВ7, ААВ12; ААВ8, AABRH8; ААВ9, AABRH10; ААВ10, ААВ13; ААВ6, ААВ12; ААВ7, AABRH8; ААВ8, AABRH10; ААВ9, ААВ13; ААВ10, AABDJ; ААВ6, AABRH8; ААВ7, AABRH10; ААВ8, ААВ13; ААВ9, AABDJ; ААВ10, AABDJ8; ААВ6, AABRH10; ААВ7, ААВ13; ААВ8, AABDJ; ААВ9, AABDJ8; ААВ10, птичий; ААВ6, ААВ13; ААВ7, AABDJ; ААВ8, AABDJ8; ААВ9, птичий; ААВ10, бычий; ААВ6, AABDJ;19. CctDNA vector according to any one of paragraphs. 1-18, characterized in that said flanking ITRs come from a pair of viral serotypes selected from the group consisting of pairs of viral serotypes AAB1, AAB1; AAV2, AAV2; AAV3, AAV3; AAV4, AAV4; AAV5, AAV5; AAV1, AAV2; AAV2, AAV3; AAV3, AAV4; AAV4, AAV5; AAV5, AAV6; AAV1, AAV3; AAV2, AAV4; AAV3, AAV5; AAV4, AAV6; AAV5, AAV7; AAV1, AAV4; AAV2, AAV5; AAV3, AAV6; AAV4, AAV7; AAV5, AAV8; AAV1, AAV5; AAV2, AAV6; AAV3, AAV7; AAV4, AAV8; AAV5, AAV9; AAV1, AAV6; AAV2, AAV7; AAV3, AAV8; AAV4, AAV9; AAV5, AAV10; AAV1, AAV7; AAV2, AAV8; AAV3, AAV9; AAV4, AAV10; AAV5, AAV11; AAV1, AAV8; AAV2, AAV9; AAV3, AAV10; AAV4, AAVN; AAV5, AAV12; AAV1, AAV9; AAV2, AAV10; AAV3, AAV11; AAV4, AAV12; AAB5, AABRH8; AAV1, AAV10; AAV2, AAV11; AAV3, AAV12; AAB4, AABRH8; AAB5, AABRH10; AAV1, AAV11; AAV2, AAV12; AAB3, AABRH8; AAB4, AABRH10; AAV5, AAV13; AAV1, AAV12; AAB2, AABRH8; AAB3, AABRH10; AAV4, AAV13; AAB5, AABDJ; AAB1, AABRH8; AAB2, AABRH10; AAV3, AAV13; AAB4, AABDJ; AAB5, AABDJ8; AAB1, AABRH10; AAB2, AAB13; AAB3, AABDJ; AAB4, AABDJ8; AAB5, avian; AAB1, AAB13; AAB2,AABDJ; AAB3, AABDJ8; AAB4, avian; AAB5, bovine; AAB1, AABDJ; AAB2, AABDJ8; AAB3, avian; AAB4, bovine; AAB5, canine; AAB1, AABDJ8; AAV2, avian; AAB3, bovine; AAB4, canine; AAB5, equine; AAB1, avian; AAB2, bovine; AAB3, canine; AAB4, equine; AAB5, goat; AAB1, bovine; AAV2, canine; AAB3, equine; AAB4, goat; AAB5, shrimp; AAB1, canine; AAB2, equine; AAB3, goat; AAB4, shrimp; AAV5, porcine; AAB1, equine; AAB2, goat; AAB3, shrimp; AAB4, porcine; AAB5, insects; AAB1, goat; AAB2, shrimp; AAB3, porcine; AAB4, insects; AAB5, sheep; AAB1, shrimp; AAV2, porcine; AAB3, insects; AAB4, sheep; AAV5, B19; AAV1, porcine; AAB2, insects; AAB3, sheep; AAV4, B19; AAB5, MVM; AAB1, insects; AAB2, sheep; AAV3, B19; AAB4, MVM; AAB5, goose; AAB1, sheep; AAV2, B19; AAB3, MVM; AAB4, goose; AAB5, serpentine; AAV1, B19; AAB2, MVM; AAB3, anserine; AAB4, serpentine; AAB1, MVM; AAB2, anserine; AAB3, serpentine; AAB1, anserine; AAB2, serpentine; AAB1, serpentine; AAV6, AAV6; AAB7, AAV7; AAB8, AAV8; AAB9, AAV9; AAV10, AAV10; AAV6, AAV7; AAB7, AAV8; AAV8, AAV9; AAV9, AAV10; AAV10, AAV11; AAV6, AAV8; AAV7, AAV9; AAV8, AAV10; AAV9, AAV11; AAV10, AAV12; AAV6, AAV9; AAV7, AAV10; AAV8, AAV11; AAV9, AAV12; AAB10, AABRH8; AAV6, AAV10; AAV7, AAV11; AAV8, AAV12; AAB9, AABRH8; AAB10, AABRH10; AAV6, AAV11; AAV7, AAV12; AAB8, AABRH8; AAB9, AABRH10; AAV10, AAV13; AAV6, AAV12; AAB7, AABRH8; AAB8, AABRH10; AAV9, AAV13; AAB10, AABDJ; AAB6, AABRH8; AAB7, AABRH10; AAV8, AAV13; AAB9, AABDJ; AAB10, AABDJ8; AAB6, AABRH10; AAV7, AAV13; AAB8, AABDJ; AAB9, AABDJ8; AAB10, avian; AAV6, AAV13; AAB7, AABDJ; AAB8, AABDJ8; AAB9, avian; AAB10, bovine; AAB6, AABDJ; ААВ7, AABDJ8; ААВ8, птичий; ААВ9, бычий; ААВ10, собачий; ААВ6, AABDJ8; ААВ7, птичий; ААВ8, бычий; ААВ9, собачий; ААВ10, лошадиный; ААВ6, птичий; ААВ7, бычий; ААВ8, собачий; ААВ9, лошадиный; ААВ10, козий; ААВ6, бычий; ААВ7, собачий; ААВ8, лошадиный; ААВ9, козий; ААВ10, креветки; ААВ6, собачий; ААВ7, лошадиный; ААВ8, козий; ААВ9, креветки; ААВ10, свиной; ААВ6, лошадиный; ААВ7, козий; ААВ8, креветки; ААВ9, свиной; ААВ10, насекомых; ААВ6, козий; ААВ7, креветки; ААВ8, свиной; ААВ9, насекомых; ААВ10, овечий; ААВ6, креветки; ААВ7, свиной; ААВ8, насекомых; ААВ9, овечий; ААВ10, В19; ААВ6, свиной; ААВ7, насекомых; ААВ8, овечий; ААВ9, В19; ААВ10, MVM; ААВ6, насекомых; ААВ7, овечий; ААВ8, В19; ААВ9, MVM; ААВ10, гусиный; ААВ6, овечий; ААВ7, В19; ААВ8, MVM; ААВ9, гусиный; ААВ10, змеиный; ААВ6, В19; ААВ7, MVM; ААВ8, гусиный; ААВ9, змеиный; ААВ6, MVM; ААВ7, гусиный; ААВ8, змеиный; ААВ6, гусиный; ААВ7, змеиный; ААВ6, змеиный; ААВ11, ААВ11; ААВ12, ААВ12; AABRH8, AABRH8; AABRH10, AABRH10; ААВ13, ААВ13; ААВ11, ААВ12; ААВ12, AABRH8; AABRH8, AABRH10; AABRH10, ААВ13; ААВ13, AABDJ; ААВ11, AABRH8; ААВ12, AABRH10; AABRH8, ААВ13; AABRH10, AABDJ; ААВ13, AABDJ8; ААВ11, AABRH10; ААВ12, ААВ13; AABRH8, AABDJ; AABRH10, AABDJ8; ААВ13, птичий; ААВ11, ААВ13; ААВ12, AABDJ; AABRH8, AABDJ8; AABRH10, птичий; ААВ13, бычий; ААВ11, AABDJ; ААВ12, AABDJ8; AABRH8, птичий; AABRH10, бычий;ААВ13, собачий; ААВ11, AABDJ8; АВ12, птичий; AABRH8, бычий; AABRH10, собачий; ААВ13, лошадиный; ААВ11, птичий; ААВ12, бычий; AABRH8, собачий; AABRH10, лошадиный; ААВ13, козий; ААВ11, бычий; ААВ12, собачий; AABRH8, лошадиный; AABRH10, козий; ААВ13, креветки; ААВ11, собачий; ААВ12, лошадиный; AABRH8, козий; AABRH10, креветки; ААВ13, свиной; ААВ11, лошадиный; ААВ12, козий; AABRH8, креветки; AABRH10, свиной; ААВ13, насекомых; ААВ11, козий; ААВ12, креветки; AABRH8, свиной; AABRH10, насекомых; ААВ13, овечий; ААВ11, креветки; ААВ12, свиной; AABRH8, насекомых; AABRH10, овечий; ААВ13, В19; ААВ11, свиной; ААВ12, насекомых; AABRH8, овечий; AABRH10, В19; ААВ13, MVM; ААВ11, насекомых; ААВ12, овечий; AABRH8, В19; AABRH10, MVM; ААВ13, гусиный; ААВ11, овечий; ААВ12, В19; AABRH8, MVM; AABRH10, гусиный; ААВ13, змеиный; ААВ11, В19; ААВ12, MVM; AABRH8, гусиный; AABRH10, змеиный; ААВ11, MVM; ААВ12, гусиный; AABRH8, змеиный; ААВ11, гусиный; ААВ12, змеиный; ААВ11, змеиный; AABDJ, AABDJ; AABDJ8, AVVDJ8; птичий, птичий; бычий, бычий; собачий, собачий; AABDJ, AABDJ8; AABDJ8, птичий; птичий, бычий; бычий, собачий; собачий, лошадиный; AABDJ, птичий; AABDJ8, бычий; птичий, собачий; бычий, лошадиный; собачий, козий; AABDJ, бычий; AABDJ8, собачий; птичий, лошадиный; бычий, козий; собачий, креветки; AABDJ, собачий; AABDJ8, лошадиный; птичий, козий; бычий, креветки; собачий, свиной; AABDJ, лошадиный; AABDJ8, козий; птичий, креветки; бычий, свиной; собачий, насекомых; AABDJ, козий; AABDJ8, креветки; птичий, свиной; бычий, насекомых; собачий, овечий; AABDJ, креветки; AABDJ8, свиной; птичий, насекомых; бычий, овечий; собачий, В19; AABDJ, свиной; AABDJ8, насекомых; птичий, овечий; бычий, В19; собачий, MVM; AABDJ, насекомых; AABDJ8, овечий; птичий, В19; бычий, MVM; собачий, гусиный; AABDJ, овечий; AABDJ8, В19; птичий, MVM; бычий, гусиный; собачий, змеиный; AABDJ, В19; AABDJ8, MVM; птичий, гусиный; бычий, змеиный; AABDJ, MVM; AABDJ8, гусиный; птичий, змеиный; AABDJ, гусиный; AABDJ8, змеиный; AABDJ, змеиный; лошадиный, лошадиный; козий, козий; креветки, креветки; свиной, свиной; насекомых, насекомых; лошадиный, козий; козий, креветки; креветки, свиной; свиной, насекомых; насекомых, овечий; лошадиный, креветки; козий, свиной; креветки, насекомых; свиной, овечий; насекомых, В19; лошадиный, свиной; козий, насекомых; креветки, овечий; свиной, В19; насекомых, MVM; лошадиный, насекомых; козий, овечий; креветки, В19; свиной, MVM; насекомых, гусиный; лошадиный, овечий; козий, В19; креветки, MVM; свиной, гусиный; насекомых, змеиный; лошадиный, В19; козий, MVM; креветки, гусиный; свиной, змеиный; лошадиный, MVM; козий, гусиный; креветки, змеиный; лошадиный, гусиный; козий, змеиный; лошадиный, змеиный; овечий, овечий; В19, В19; MVM, MVM; гусиный, гусиный; змеиный, змеиный; овечий, В19; В19, MVM; MVM, гусиный; гусиный, змеиный; овечий, MVM; В19, гусиный; MVM, змеиный; овечий, гусиный; В19, змеиный; овечий, змеиный.AAB7, AABDJ8; AAB8, avian; AAB9, bull; AAB10, canine; AAB6, AABDJ8; AAB7, avian; AAB8, bovine; AAB9, canine; AAB10, equine; AAB6, avian; AAB7, bovine; AAB8, canine; AAB9, equine; AAB10, goat; AAB6, bovine; AAB7, canine; AAB8, equine; AAB9, goat; AAB10, shrimp; AAB6, canine; AAB7, equine; AAB8, goat; AAB9, shrimp; AAB10, porcine; AAB6, equine; AAB7, goat; AAB8, shrimp; AAB9, pork; AAB10, insects; AAB6, goat; AAB7, shrimp; AAB8, porcine; AAB9, insects; AAB10, sheep; AAB6, shrimp; AAV7, porcine; AAB8, insects; AAB9, sheep; AAV10, B19; AAV6, porcine; AAB7, insects; AAB8, sheep; AAV9, B19; AAB10, MVM; AAB6, insects; AAB7, sheep; AAB8, B19; AAB9, MVM; AAB10, goose; AAB6, sheep; AAV7, B19; AAB8, MVM; AAB9, goose; AAB10, serpentine; AAV6, B19; AAB7, MVM; AAB8, goose; AAB9, serpentine; AAB6, MVM; AAB7, goose; AAB8, serpentine; AAB6, goose; AAB7, serpentine; AAB6, serpentine; AAV11, AAV11; AAV12, AAV12; AABRH8, AABRH8; AABRH10, AABRH10; AAV13, AAV13; AAV11, AAV12; AAB12, AABRH8; AABRH8, AABRH10; AABRH10, AAB13; AAB13, AABDJ; AAB11, AABRH8; AAB12, AABRH10; AABRH8, AAB13; AABRH10, AABDJ; AAB13, AABDJ8; AAB11, AABRH10; AAV12, AAV13; AABRH8, AABDJ; AABRH10, AABDJ8; AAB13, avian; AAV11, AAV13; AAB12, AABDJ; AABRH8, AABDJ8; AABRH10, avian; AAB13, bovine; AAB11, AABDJ; AAB12, AABDJ8; AABRH8, avian; AABRH10, bovine; AAB13, canine; AAB11, AABDJ8; AB12, avian; AABRH8, bovine; AABRH10, canine; AAB13, equine; AAB11, avian; AAB12, bovine; AABRH8, canine; AABRH10, equine; AAB13, goat; AAB11, bovine; AAB12, canine; AABRH8, equine; AABRH10, goat; AAB13, shrimp; AAB11, canine; AAB12, equine; AABRH8, goat; AABRH10, shrimp; AAV13, porcine; AAB11, equine; AAB12, goat; AABRH8, shrimp; AABRH10, porcine; AAB13, insects; AAB11, goat; AAB12, shrimp; AABRH8, porcine; AABRH10, insects; AAB13, sheep; AAB11, shrimp; AAV12, porcine; AABRH8, insects; AABRH10, sheep; AAV13, B19; AAV11, porcine; AAB12, insects; AABRH8, sheep; AABRH10, B19; AAB13, MVM; AAB11, insects; AAB12, sheep; AABRH8, B19; AABRH10, MVM; AAB13, goose; AAB11, sheep; AAV12, B19; AABRH8, MVM; AABRH10, goose; AAB13, serpentine; AAV11, B19; AAB12, MVM; AABRH8, goose; AABRH10, serpentine; AAB11, MVM; AAB12, goose; AABRH8, serpentine; AAB11, goose; AAB12, serpentine; AAB11, serpentine; AABDJ, AABDJ; AABDJ8, AVVDJ8; avian, avian; bullish, bullish; canine, canine; AABDJ, AABDJ8; AABDJ8, avian; avian, bovine; bull, dog; canine, equine; AABDJ, avian; AABDJ8, bovine; bird, dog; bull, horse; canine, goat; AABDJ, bovine; AABDJ8, canine; bird, horse; bovine, goat; dog, shrimp; AABDJ, canine; AABDJ8, equine; bird, goat; bovine, shrimp; dog, pork; AABDJ, equine; AABDJ8, goat; bird, shrimp; bovine, pork; canine, insects; AABDJ, goat; AABDJ8, shrimp; poultry, pork; bovine, insects; canine, sheep; AABDJ, shrimp; AABDJ8, porcine; avian, insects; bovine, sheep; canine, B19; AABDJ, pork; AABDJ8, insects; bird, sheep; bullish, B19; canine, MVM; AABDJ, insects; AABDJ8, sheep; avian, B19; bullish, MVM; canine, goose; AABDJ, sheep; AABDJ8, B19; avian, MVM; bovine, goose; canine, snake; AABDJ, B19; AABDJ8, MVM; bird, goose; bull, snake; AABDJ, MVM; AABDJ8, goose; bird, snake; AABDJ, goose; AABDJ8, serpentine; AABDJ, serpentine; equine, equine; goat, goat; prawns, prawns; pork, pork; insects, insects; horse, goat; goat, shrimp; shrimp, pork; pork, insects; insects, sheep; horse, shrimp; goat, pork; shrimp, insects; pork, sheep; insects, B19; horse, pork; goat, insects; shrimp, sheep; pork, B19; insects, MVM; equine, insects; goat, sheep; shrimp, B19; pork, MVM; insects, goose; horse, sheep; goat, B19; shrimp, MVM; pork, goose; insects, snake; equine, B19; goat, MVM; shrimp, goose; pork, snake; equine, MVM; goat, goose; shrimp, snake; horse, goose; goat, snake; horse, snake; sheep, sheep; B19, B19; MVM, MVM; goose, goose; serpentine, serpentine; sheep, B19; B19, MVM; MVM, anserine; goose, snake; sheep, MVM; B19, goose; MVM, serpentine; sheep, goose; B19, serpentine; sheep, snake. 20. ЗкДНК-вектор по любому из пп. 1-19, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат последовательность, выбранную из группы, состоящей из последовательностей SEQ ID NO: 1-2, 5-48.20. CctDNA vector according to any one of paragraphs. 1-19, characterized in that one or both of said flanking ITRs contain a sequence selected from the group consisting of sequences SEQ ID NO: 1-2, 5-48. 21. ЗкДНК-вектор по любому из пп. 1-20, отличающийся тем, что по меньшей мере один из указанных фланкирующих ITR изменен относительно последовательности ITR дикого типа ААВ путем делеции, добавления или замены, которые влияют на общую трехмерную конформацию указанного ITR.21. CctDNA vector according to any one of paragraphs. 1-20, wherein at least one of said flanking ITRs is altered relative to the wild-type AAB ITR sequence by deletion, addition or substitution that affects the overall three-dimensional conformation of said ITR. 22. ЗкДНК-вектор по любому из пп. 1-21, отличающийся тем, что один или оба из указанных фланкирующих ITR происходят из серотипа ААВ, выбранного из группы, состоящей из ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11 и ААВ12.22. CctDNA vector according to any one of paragraphs. 1-21, characterized in that one or both of said flanking ITRs are derived from an AAV serotype selected from the group consisting of AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 and AAV12. 23. ЗкДНК-вектор по любому из пп. 1-22, отличающийся тем, что один или оба из указанных фланкирующих ITR являются синтетическими.23. CctDNA vector according to any one of paragraphs. 1-22, characterized in that one or both of said flanking ITRs are synthetic. 24. ЗкДНК-вектор по любому из пп. 1-23, отличающийся тем, что один из указанных фланкирующих ITR не является ITR дикого типа, или оба из указанных фланкирующих ITR не являются ITR дикого типа.24. CctDNA vector according to any one of paragraphs. 1-23, wherein one of the flanking ITRs is not a wild-type ITR, or both of the flanking ITRs are not a wild-type ITR. 25. ЗкДНК-вектор по любому из пп. 1-24, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены по меньшей мере в одной из областей указанных ITR, выбранных из группы, состоящей из А, А', В, В', С, С', D и D'.25. CctDNA vector according to any one of paragraphs. 1-24, characterized in that one or both of said flanking ITRs are modified by deletion, insertion and/or substitution in at least one of the regions of said ITRs selected from the group consisting of A, A', B, B', C, C', D and D'. 26. ЗкДНК-вектор по п. 25, отличающийся тем, что указанная делеция, вставка и/или замена приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями А, А', В, В', С или С'.26. The cctDNA vector according to claim 25, characterized in that said deletion, insertion and/or substitution results in the deletion of all or part of the stem-loop structure formed by said regions A, A', B, B', C or C' . 27. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями В и В'.27. CctDNA vector according to any one of paragraphs. 1-26, wherein one or both of said flanking ITRs is modified by deletion, insertion and/or substitution that results in the deletion of all or part of the stem-loop structure formed by said regions B and B'. 28. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями С и С'.28. CctDNA vector according to any one of paragraphs. 1-26, wherein one or both of said flanking ITRs is modified by deletion, insertion and/or substitution that results in the deletion of all or part of the stem-loop structure formed by said regions C and C'. 29. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями В и В', и/или всей или части структуры стебель-петля, образуемой указанными областями С и С'.29. CctDNA vector according to any one of paragraphs. 1-26, characterized in that one or both of said flanking ITRs are modified by deletion, insertion and/or substitution which results in the deletion of all or part of the stem-loop structure formed by said regions B and B' and/or all or part of the stem-loop structure formed by said regions C and C'. 30. ЗкДНК-вектор по любому из пп. 1-29, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат одну структуру стебель-петля в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.30. CctDNA vector according to any one of paragraphs. 1-29, characterized in that one or both of said flanking ITRs contain a single stem-loop structure in a region which, in a wild-type ITR, contains a first stem-loop structure formed by said regions B and B', and a second stem-loop structure -loop formed by the indicated regions C and C'. 31. ЗкДНК-вектор по любому из пп. 1-30, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат один стебель и две петли в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.31. CctDNA vector according to any one of paragraphs. 1-30, characterized in that one or both of said flanking ITRs comprise one stem and two loops in a region which, in a wild-type ITR, contains a first stem-loop structure formed by said regions B and B', and a second stem structure -loop formed by the indicated regions C and C'. 32. ЗкДНК-вектор по любому из пп. 1-31, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат один стебель и одну петлю в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.32. CctDNA vector according to any one of paragraphs. 1-31, characterized in that one or both of said flanking ITRs comprise one stem and one loop in a region which, in a wild-type ITR, contains a first stem-loop structure formed by said regions B and B', and a second stem structure -loop formed by the indicated regions C and C'. 33. ЗкДНК-вектор по любому из пп. 1-32, отличающийся тем, что оба фланкирующих ITR изменяют таким образом, что это приводит к общей трехмерной симметрии, при которой указанные ITR инвертированы по отношению друг к другу.33. CctDNA vector according to any one of paragraphs. 1-32, characterized in that both flanking ITRs are modified in such a way that this results in an overall three-dimensional symmetry in which said ITRs are inverted with respect to each other. 34. ЗкДНК-вектор по любому из пп. 1-33, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат последовательность, выбранную из группы, состоящей из последовательностей SEQ ID NO: 1-2, 5-48.34. CctDNA vector according to any one of paragraphs. 1-33, characterized in that one or both of said flanking ITRs contain a sequence selected from the group consisting of sequences SEQ ID NO: 1-2, 5-48. 35. ЗкДНК-вектор по любому из пп. 1-34, отличающийся тем, что указанный зкДНК-вектор включает по меньшей мере один регуляторный переключатель.35. CctDNA vector according to any one of paragraphs. 1-34, characterized in that said cDNA vector includes at least one regulatory switch. 36. ЗкДНК-вектор по п. 35, отличающийся тем, что указанный по меньшей мере один регуляторный переключатель выбран из группы, состоящей из бинарного регуляторного переключателя, низкомолекулярного регуляторного переключателя, регуляторного переключателя «с кодом доступа», регуляторного переключателя на основе нуклеиновой кислоты, посттранскрипционного регуляторного переключателя, контролируемого излучением или контролируемого ультразвуком регуляторного переключателя, опосредуемого гипоксией регуляторного переключателя, регуляторного переключателя воспалительного ответа, активируемого сдвигом регуляторного переключателя и аварийного выключателя («kill switch»).36. The cccDNA vector according to claim 35, characterized in that said at least one regulatory switch is selected from the group consisting of a binary regulatory switch, a small molecule regulatory switch, a passcode regulatory switch, a nucleic acid-based regulatory switch, post-transcriptional regulatory switch, radiation-controlled or ultrasound-controlled regulatory switch, hypoxia-mediated regulatory switch, inflammatory response regulatory switch, shift-activated regulatory switch and kill switch. 37. Способ экспрессии белка FVIII в клетке, включающий приведение указанной клетки в контакт с зкДНК-вектором по любому из пп. 1-36.37. A method for expressing FVIII protein in a cell, including bringing said cell into contact with a cDNA vector according to any one of claims. 1-36. 38. Способ по п. 37, отличающийся тем, что указанная клетка представляет собой клетку печени.38. The method according to claim 37, characterized in that said cell is a liver cell. 39. Способ по п. 37 или 38, отличающийся тем, что указанная клетка находится в условиях in vitro или in vivo.39. The method according to claim 37 or 38, characterized in that said cell is in vitro or in vivo. 40. Способ по любому из пп. 37-39, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой последовательность, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.40. Method according to any one of paragraphs. 37-39, characterized in that said at least one nucleic acid sequence is a sequence having at least 85% identity with a sequence selected from the group consisting of sequences SEQ ID NO: 380-397. 41. Способ лечения субъекта, страдающего гемофилией А, включающий введение указанному субъекту зкДНК-вектора по любому из пп. 1-36, отличающийся тем, что по меньшей мере одна гетерологичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII.41. A method of treating a subject suffering from hemophilia A, comprising administering to said subject a cccDNA vector according to any one of claims. 1-36, characterized in that at least one heterologous nucleotide sequence encodes at least one FVIII protein. 42. Способ по п. 41, отличающийся тем, что уровни FVIII в сыворотке субъекта повышены у субъектов, которым ввели зкДНК-вектор, по сравнению с контролем.42. The method of claim 41, wherein the levels of FVIII in the subject's serum are increased in subjects administered the cccDNA vector compared to controls. 43. Способ по п. 42, отличающийся тем, что указанное повышение уровней FVIII составляет более примерно 40% по сравнению с контролем.43. The method of claim 42, wherein said increase in FVIII levels is greater than about 40% compared to the control. 44. Способ по п. 41, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой последовательность, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.44. The method of claim 41, wherein said at least one nucleic acid sequence is a sequence having at least 85% identity with a sequence selected from the group consisting of sequences SEQ ID NO: 380-397. 45. Способ по любому из пп. 41-44, отличающийся тем, что указанный зкДНК-вектор вводят в клетку печени.45. Method according to any one of paragraphs. 41-44, characterized in that said cDNA vector is introduced into a liver cell. 46. Способ по любому из пп. 41-45, отличающийся тем, что указанный зкДНК-вектор экспрессирует указанный белок FVIII в клетке печени.46. Method according to any one of paragraphs. 41-45, characterized in that said cDNA vector expresses said FVIII protein in a liver cell. 47. Способ по любому из пп. 41-46, отличающийся тем, что указанный зкДНК-вектор вводят с помощью любого одного или более из путей, выбранных из группы, состоящей из: внутривенная инъекция, внутримышечная инъекция и инфузия.47. Method according to any one of paragraphs. 41-46, characterized in that said cccDNA vector is administered via any one or more routes selected from the group consisting of: intravenous injection, intramuscular injection and infusion. 48. Фармацевтическая композиция для генной терапии, содержащая зкДНК-вектор по любому из пп. 1-36.48. Pharmaceutical composition for gene therapy containing a cccDNA vector according to any one of paragraphs. 1-36. 49. Клетка для продуцирования белка FVIII, содержащая зкДНК-вектор по любому из пп. 1-36.49. A cell for producing FVIII protein, containing a cDNA vector according to any one of claims. 1-36. 50. Клетка по п. 49, отличающаяся тем, что указанная клетка представляет собой клетку печени.50. The cell according to claim 49, characterized in that said cell is a liver cell. 51. Композиция для доставки зкДНК-вектора, содержащая зкДНК-вектор по любому из пп. 1-36 и липид.51. A composition for delivering a cDNA vector, containing a cDNA vector according to any one of claims. 1-36 and lipid. 52. Композиция по п. 51, отличающаяся тем, что указанный липид представляет собой липидную наночастицу (ЛНЧ).52. The composition according to claim 51, characterized in that said lipid is a lipid nanoparticle (LNP). 53. Набор для доставки зкДНК-вектора, содержащий зкДНК-вектор по любому из пп. 1-36, фармацевтическую композицию по п. 48, клетку по п. 49 или 50, или композицию по п. 51 или 52 и инструкции по применению.53. A kit for delivering a cDNA vector, containing a cDNA vector according to any one of claims. 1-36, a pharmaceutical composition according to claim 48, a cell according to claim 49 or 50, or a composition according to claim 51 or 52 and instructions for use.
RU2021129628A 2019-03-13 2020-03-13 Non-viral dna vectors and options for their use for expression of therapeutic agent based on factor viii (fviii) RU2812852C2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/817,904 2019-03-13
US62/856,432 2019-06-03

Publications (2)

Publication Number Publication Date
RU2021129628A RU2021129628A (en) 2023-06-28
RU2812852C2 true RU2812852C2 (en) 2024-02-02

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017075619A1 (en) * 2015-10-30 2017-05-04 Spark Therapeutics, Inc. Cpg reduced factor viii variants, compositions and methods and uses for treatment of hemostasis disorders
RU2653444C2 (en) * 2012-02-17 2018-05-08 Дзе Чилдрен'З Хоспитал Оф Филадельфия Aav vector compositions and methods for gene transfer to cells, organs and tissues
US20190032083A1 (en) * 2016-03-03 2019-01-31 University Of Massachusetts Closed-ended linear duplex dna for non-viral gene transfer
WO2019032898A1 (en) * 2017-08-09 2019-02-14 Bioverativ Therapeutics Inc. Nucleic acid molecules and uses thereof
WO2019051255A1 (en) * 2017-09-08 2019-03-14 Generation Bio Co. Modified closed-ended dna (cedna)

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2653444C2 (en) * 2012-02-17 2018-05-08 Дзе Чилдрен'З Хоспитал Оф Филадельфия Aav vector compositions and methods for gene transfer to cells, organs and tissues
WO2017075619A1 (en) * 2015-10-30 2017-05-04 Spark Therapeutics, Inc. Cpg reduced factor viii variants, compositions and methods and uses for treatment of hemostasis disorders
US20190032083A1 (en) * 2016-03-03 2019-01-31 University Of Massachusetts Closed-ended linear duplex dna for non-viral gene transfer
WO2019032898A1 (en) * 2017-08-09 2019-02-14 Bioverativ Therapeutics Inc. Nucleic acid molecules and uses thereof
WO2019051255A1 (en) * 2017-09-08 2019-03-14 Generation Bio Co. Modified closed-ended dna (cedna)

Similar Documents

Publication Publication Date Title
AU2021204620A1 (en) Central nervous system targeting polynucleotides
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
KR20230019843A (en) Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
KR20210149060A (en) RNA-induced DNA integration using TN7-like transposons
KR20210143230A (en) Methods and compositions for editing nucleotide sequences
CN108753824B (en) Viral vectors for the treatment of retinal dystrophy
KR20200093635A (en) Gene editing using modified closed terminal DNA (CEDNA)
CN113271955A (en) Enhanced systems for cell-mediated oncolytic viral therapy
CN111344395A (en) Methods of generating modified natural killer cells and methods of use
KR20200064129A (en) Transgenic selection methods and compositions
KR20180097631A (en) Materials and methods for delivering nucleic acids to Wow and vestibular cells
KR102628872B1 (en) Tools and methods for using cell division loci to control proliferation of cells
JP2023036921A (en) Materials and methods for delivering nucleic acids to cochlear and vestibular cells
US20200188531A1 (en) Single-vector gene construct comprising insulin and glucokinase genes
CN111733174B (en) Isolated nucleic acid molecule and application thereof
CN112313334A (en) Homologous directed repair template design and delivery to edit hemoglobin-related mutations
CN112041334A (en) Expression of human FOXP3 in gene-edited T cells
KR20220130093A (en) Compositions and methods for treating sensorineural hearing loss using the autopurin dual vector system
CN111094569A (en) Light-controlled viral protein, gene thereof, and viral vector containing same
KR20230035689A (en) Engineered cascade components and cascade complexes
US11129890B1 (en) Non-integrating HIV-1 comprising mutant RT/IN proteins and the SARS-CoV-2 spike protein
CN110637090A (en) Plasmid vectors for expression of large nucleic acid transgenes
KR20210151785A (en) Non-viral DNA vectors and their use for expression of FVIII therapeutics
KR20240004253A (en) Method for treating sensorineural hearing loss using the Autoperlin Dual Vector System