EA045868B1 - REGULATION OF GENE EXPRESSION USING CONSTRUCTED NUCLEASES - Google Patents

REGULATION OF GENE EXPRESSION USING CONSTRUCTED NUCLEASES Download PDF

Info

Publication number
EA045868B1
EA045868B1 EA201990568 EA045868B1 EA 045868 B1 EA045868 B1 EA 045868B1 EA 201990568 EA201990568 EA 201990568 EA 045868 B1 EA045868 B1 EA 045868B1
Authority
EA
Eurasian Patent Office
Prior art keywords
cell
cells
dna
globin
sequence
Prior art date
Application number
EA201990568
Other languages
Russian (ru)
Inventor
Джеффри К. МИЛЛЕР
Эдвард Дж. Ребар
Original Assignee
Сангамо Терапьютикс, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сангамо Терапьютикс, Инк. filed Critical Сангамо Терапьютикс, Инк.
Publication of EA045868B1 publication Critical patent/EA045868B1/en

Links

Description

Перекрестные ссылки на родственные заявкиCross references to related applications

Данная заявка испрашивает приоритет по предварительной заявке США № 62/378978, поданной 24 августа 2016 г.; предварительной заявке США № 62/443981, поданной 9 января 2017 г.; и предварительной заявке США № 62/545778, поданной 15 августа 2017 г., раскрытие которых включено в данный документ в качестве ссылки в полном объеме.This application claims priority to US Provisional Application No. 62/378978, filed August 24, 2016; US Provisional Application No. 62/443981, filed January 9, 2017; and US Provisional Application No. 62/545,778, filed August 15, 2017, the disclosures of which are incorporated herein by reference in their entirety.

Область техникиTechnical field

Данное изобретение относится к области геномной инженерии, в частности к направленной модификации генома гемопоэтической клетки.This invention relates to the field of genomic engineering, in particular to targeted modification of the genome of a hematopoietic cell.

Уровень техникиState of the art

Если учесть, что усилия по сиквенированию генома показали, что геном человека содержит от 20000 до 25000 генов, но менее 2000 регуляторов транскрипции, становится ясно, что многие факторы должны взаимодействовать для контроля экспрессии генов во всех ее различных проявлениях во времени и процессе развития и тканеспецифических проявлениях. Экспрессия генов контролируется очень сложной смесью общих и специфических регуляторов транскрипции, которые взаимодействуют с ДНКэлементами. Эти ДНК-элементы включают как локальные ДНК-элементы, такие как основной промотор и связанные с ним сайты связывания транскрипционных факторов, так и дистальные элементы, такие как энхансеры, сайленсеры, инсуляторы и области контроля локуса (LCR) (см. Matson et al. (2006) Ann Rev Genome Hum Genet 7: 29-50).When one considers that genome sequencing efforts have revealed that the human genome contains between 20,000 and 25,000 genes but fewer than 2,000 transcriptional regulators, it is clear that many factors must interact to control gene expression in all its various manifestations over time, development and tissue specificity. manifestations. Gene expression is controlled by a very complex mixture of general and specific transcriptional regulators that interact with DNA elements. These DNA elements include both local DNA elements, such as the core promoter and its associated transcription factor binding sites, and distal elements, such as enhancers, silencers, insulators, and locus control regions (LCRs) (see Matson et al. (2006) Ann Rev Genome Hum Genet 7: 29-50).

Энхансерные элементы были сначала идентифицированы в вирусном геноме SV40, а затем обнаружены в локусе тяжелой цепи человеческого иммуноглобулина. В настоящее время известно, что они играют регуляторную роль в экспрессии многих генов, и, по-видимому, энхансеры в основном влияют на временные и пространственные характеристики экспрессии генов. Также было обнаружено, что энхансеры могут функционировать для регуляции экспрессии на больших расстояниях от основного промотора целевого гена и не зависят от какой-либо конкретной ориентации последовательности по отношению к промотору. Энхансеры могут быть расположены в нескольких сотнях килобаз выше или ниже ядра промоторной области, где они могут быть расположены в последовательности интрона или даже за 3'концом гена.Enhancer elements were first identified in the SV40 viral genome and then found in the human immunoglobulin heavy chain locus. They are now known to play a regulatory role in the expression of many genes, and enhancers appear to primarily influence the temporal and spatial patterns of gene expression. It has also been found that enhancers can function to regulate expression over large distances from the core promoter of the target gene and are not dependent on any particular sequence orientation with respect to the promoter. Enhancers can be located several hundred kilobases upstream or downstream of the core promoter region, where they can be located in the intronic sequence or even beyond the 3' end of the gene.

Были описаны различные способы и композиции для целевого разрезания геномной ДНК. Такие целевые разрезания можно использовать, например, для индукции целевого мутагенеза, индукции целевых делеций последовательностей клеточной ДНК и облегчения направленной рекомбинации в заранее определенном локусе хромосомы. См., например, патенты США №№ 9255250; 9200266; 9045763; 9005973; 9150847; 8956828; 8945868; 8703489; 8586526; 6534261; 6599692; 6503717; 6689558; 7067317; 7262054; 7888121; 7972854; 7914796; 7951925; 8110379; 8409861; патентные публикации США №№ 2003/0232410; 2005/0208489; 2005/0026157; 2005/0064474; 2006/0063231; 2008/0159996; 2010/00218264; 2012/0017290; 2011/02 65198; 2013/0137104; 2013/0122591; 2013/0177983; 2013/0196373; 2015/0056705 и 2015/0335708, раскрытие которых включено в качестве ссылки во всей их полноте.Various methods and compositions for targeted cutting of genomic DNA have been described. Such targeted cuts can be used, for example, to induce targeted mutagenesis, induce targeted deletions of cellular DNA sequences, and facilitate targeted recombination at a predetermined chromosomal locus. See, for example, US Pat. Nos. 9,255,250; 9200266; 9045763; 9005973; 9150847; 8956828; 8945868; 8703489; 8586526; 6534261; 6599692; 6503717; 6689558; 7067317; 7262054; 7888121; 7972854; 7914796; 7951925; 8110379; 8409861; US Patent Publications No. 2003/0232410; 2005/0208489; 2005/0026157; 2005/0064474; 2006/0063231; 2008/0159996; 2010/00218264; 2012/0017290; 2011/02 65198; 2013/0137104; 2013/0122591; 2013/0177983; 2013/0196373; 2015/0056705 and 2015/0335708, the disclosure of which is incorporated by reference in its entirety.

Эти методы часто включают использование сконструированных систем разрезания для индукции двойного разрыва цепи (DSB) или надреза в последовательности ДНК-мишени таким образом, что восстановление разрывов вызванных ошибкой, такой как негомологичное соединение концов (NHEJ), негомологично направленный концевой захват доноров или репарация с использованием репаративной матрицы (направляемое гомологией восстановление или HDR) может привести к выключению (нокауту) гена или вставке последовательности представляющей интерес (целевая интеграция). См., например, патенты США №№ 9045763; 9200266; 9005973 и 8703489. Эти методы могут также использоваться для введения сайт-специфических изменений в последовательность генома посредством использования донорного олигонуклеотида, включая введение специфических делеций геномных областей или специфических точечных мутаций или локализованных изменений (также известных как коррекция генов). Разрезание может происходить посредством использования специфических нуклеаз, таких как сконструированные нуклеазы цинкового пальца (ZFN), эффекторные нуклеазы, подобные активатору транскрипции (TALEN), или с помощью системы CRISPR/Cas с сконструированной crPHK/tracrPHK (одиночная направляющая РНК) для направления конкретного разрезания. Кроме того, целевые нуклеазы разрабатываются на основе системы Аргонавт (Argonaute) (например, из Т. thermophilus, известной как TtAgo, см. Swarts et al. (2014) Nature 507 (7491): 258-261), которая также может иметь потенциал для использования в редактировании генома и генной терапии.These methods often involve the use of engineered cutting systems to induce a double strand break (DSB) or cut in the target DNA sequence in such a way that the breaks caused by an error such as non-homologous end joining (NHEJ), non-homologous end-hijacking, or repair using repair template (homology-directed repair or HDR) can result in gene knockout or insertion of a sequence of interest (targeted integration). See, for example, US Pat. Nos. 9,045,763; 9200266; 9005973 and 8703489. These methods can also be used to introduce site-specific changes to the genome sequence through the use of a donor oligonucleotide, including the introduction of specific deletions of genomic regions or specific point mutations or localized changes (also known as gene correction). Cutting can occur through the use of specific nucleases such as engineered zinc finger nucleases (ZFNs), transcription activator-like effector nucleases (TALENs), or using the CRISPR/Cas system with an engineered crRNA/tracrRNA (single guide RNA) to direct the specific cut. In addition, target nucleases are being developed based on the Argonaute system (for example, from T. thermophilus, known as TtAgo, see Swarts et al. (2014) Nature 507 (7491): 258-261), which may also have the potential for use in genome editing and gene therapy.

Красные кровяные клетки (KKK, RBC), или эритроциты, являются основным клеточным компонентом крови и составляют четверть всех клеток человека. У зрелых эритроцитов отсутствует ядро и многие другие органеллы, и они полны гемоглобина, металлопротеина, который выполняет функцию переноса кислорода из легких в ткани, а также выведения углекислого газа из тканей и обратно в легкие для удаления из организма. Этот белок составляет примерно 97% от сухой массы эритроцитов и увеличивает способность крови переносить кислород примерно в семьдесят раз. Гемоглобин представляет собой гетеротетрамер, включающий две альфа (а)-подобные глобиновые цепи и две бета (в)-подобные глобиноRed blood cells (KKK, RBC), or erythrocytes, are the main cellular component of blood and make up a quarter of all human cells. Mature red blood cells lack a nucleus and many other organelles and are full of hemoglobin, a metalloprotein that has the function of carrying oxygen from the lungs to the tissues and carrying carbon dioxide out of the tissues and back to the lungs for removal from the body. This protein makes up approximately 97% of the dry mass of red blood cells and increases the blood's ability to carry oxygen by approximately seventy times. Hemoglobin is a heterotetramer consisting of two alpha (a)-like globin chains and two beta (b)-like globin chains

- 1 045868 вые цепи и 4 гемовые группы. У взрослых, α2β2 тетрамер называется гемоглобином А (HbA) или гемоглобина взрослых. Как правило, альфа- и бета-глобиновые цепи синтезируются в приблизительном соотношении 1:1, и это соотношение представляется критическим с точки зрения стабилизации гемоглобина и эритроцитов. У развивающегося плода вырабатывается другая форма гемоглобина, фетальный гемоглобин (HbF), который обладает более высокой аффинностью связывания с кислородом, чем гемоглобин А, так что кислород может доставляться в систему ребенка через кровоток матери. Есть два гена, которые кодируют эмбриональный глобин, которые очень похожи по последовательности и называются HBG1 (также называемый Ggamma) и HBG2 (Agamma), что основано на их порядке расположения в локусе гена бета-глобина.- 1 045868 chains and 4 heme groups. In adults, the α2β2 tetramer is called hemoglobin A (HbA) or adult hemoglobin. Typically, alpha and beta globin chains are synthesized in an approximate ratio of 1:1, and this ratio appears to be critical for the stabilization of hemoglobin and red blood cells. The developing fetus produces another form of hemoglobin, fetal hemoglobin (HbF), which has a higher binding affinity for oxygen than hemoglobin A so that oxygen can be delivered to the baby's system through the mother's bloodstream. There are two genes that encode embryonic globin that are very similar in sequence and are called HBG1 (also called Ggamma) and HBG2 (Agamma), based on their order in the beta globin gene locus.

Как и гемоглобин взрослых, фетальный гемоглобиновый белок содержит две α-глобиновые цепи, но вместо β-глобиновых цепей взрослых он имеет две фетальные гамма^)-глобиновые цепи (например, фетальный гемоглобин представляет собой α2γ2). Примерно через 30 недель беременности синтез гаммаглобина у плода начинает снижаться, а выработка бета-глобина увеличивается. Примерно к 10месячному возрасту гемоглобин новорожденного почти весь представляет собой α2β2, хотя некоторый HbF сохраняется в зрелом возрасте (примерно 1-3% от общего количества гемоглобина). Регуляция перехода от продуцирования гамма- к бета-глобину довольно сложна и, главным образом, включает подавление транскрипции гамма-глобина с одновременным повышением транскрипции бета-глобина.Like adult hemoglobin, fetal hemoglobin protein contains two α-globin chains, but instead of the adult β-globin chains, it has two fetal gamma^)-globin chains (eg, fetal hemoglobin is α2γ2). After about 30 weeks of pregnancy, fetal gammaglobin synthesis begins to decrease, and beta-globin production increases. By approximately 10 months of age, the newborn's hemoglobin is almost all α2β2, although some HbF persists into adulthood (approximately 1-3% of total hemoglobin). The regulation of the transition from gamma to beta globin production is quite complex and mainly involves suppression of gamma globin transcription while simultaneously increasing beta globin transcription.

Генетические дефекты в последовательностях, кодирующих цепи гемоглобина, могут быть ответственны за группу заболеваний, известных как гемоглобинопатии, которые включают серповидноклеточную анемию и альфа- и бета- талассемии. У большинства пациентов с гемоглобинопатиями гены, кодирующие гамма-глобин, остаются, но экспрессия относительно низкая из-за нормальной репрессии генов, происходящей в период родов, как описано выше.Genetic defects in the sequences coding for hemoglobin chains may be responsible for a group of diseases known as hemoglobinopathies, which include sickle cell anemia and alpha and beta thalassemias. In most patients with hemoglobinopathies, the genes encoding gamma globin remain, but expression is relatively low due to the normal gene repression that occurs during childbirth, as described above.

По оценкам 1 из 5000 человек в США страдает серповидноклеточной анемией (SCD), в основном она наблюдается у людей африканского происхождения из региона к югу от Сахары (Roseff (2009) Immunohematology 25(2):67). Есть польза для гетерозиготных носителей мутации серповидноклеточной анемии, которая состоит в защите от малярии, так что эта черта, возможно, была отобрана в результате позитивной селекции с течением времени, в итоге, как оценивают, в странах Африки к югу от Сахары мутацию серповидноклеточной анемии имеют до 28% населения (Elguero et al., (2015) PNAS USA 112(22):7051). Болезнь серповидноклеточной анемии вызвана мутацией в гене β-глобина вследствие замещения валина на глутаминовую кислоту в аминокислотной позиции № 6 (мутация GAG-GTG на уровне ДНК), причем полученный гемоглобин называется гемоглобин S или HbS. В условиях пониженного содержания кислорода конформационный сдвиг в дезокси-форме HbS обнажает гидрофобную область на белке между спиралями Е и F. Гидрофобные остатки валина в позиции 6 бета-цепи в гемоглобине способны связываться с гидрофобной областью, вызывая агрегацию молекул HbS и образование волокнистых преципитатов. Эти агрегаты, в свою очередь, вызывают аномалию или серповидность эритроцитов, что приводит к потере гибкости клеток. Серповидные эритроциты больше не могут втиснуться в капиллярные ложа и могут привести к вазо-окклюзионному кризису у пациентов с серповидноклеточной анемией. Кроме того, серповидные эритроциты являются более хрупкими, чем нормальные эритроциты, и имеют тенденцию к гемолизу, что в конечном итоге приводит к анемии у пациента.An estimated 1 in 5,000 people in the United States have sickle cell disease (SCD), mostly seen in people of sub-Saharan African descent (Roseff (2009) Immunohematology 25(2):67). There is a benefit to heterozygous carriers of the sickle cell mutation in protection against malaria, so this trait may have been selected through positive selection over time, resulting in the sickle cell mutation being estimated to be present in sub-Saharan Africa up to 28% of the population (Elguero et al., (2015) PNAS USA 112(22):7051). Sickle cell disease is caused by a mutation in the β-globin gene due to the substitution of valine for glutamic acid at amino acid position No. 6 (GAG-GTG mutation at the DNA level), and the resulting hemoglobin is called hemoglobin S or HbS. Under low oxygen conditions, a conformational shift in the deoxy form of HbS exposes a hydrophobic region on the protein between helices E and F. Hydrophobic valine residues at position 6 of the beta chain in hemoglobin are able to bind to the hydrophobic region, causing aggregation of HbS molecules and the formation of fibrous precipitates. These aggregates, in turn, cause abnormal or sickled red blood cells, which results in loss of cell flexibility. Sickle red blood cells can no longer squeeze into the capillary beds and can lead to vaso-occlusive crisis in patients with sickle cell disease. In addition, sickle red blood cells are more fragile than normal red blood cells and tend to undergo hemolysis, which ultimately leads to anemia in the patient.

Лечение и забота о пациентах с серповидноклеточной анемией продолжается всю жизнь и включает обработку антибиотиками, обезболивание и переливание крови во время острых эпизодов. Одним из подходов является использование гидроксимочевины, которая оказывает влияние частично за счет увеличения выработки гамма-глобина. Однако долгосрочные побочные эффекты продолжительной терапии гидроксимочевиной до сих пор неизвестны, и обработка дает нежелательные побочные эффекты, которые приводят к низкой степени соблюдения режима лечения, и имеет различную эффективность от пациента к пациенту (Brandow and Panepinto (2011) Am J Hematol 86(9):804-806). Несмотря на повышение эффективности способов лечения серповидноклеточной анемии, ожидаемая продолжительность жизни пациентов все еще только в середине и конце 50 лет, и связанные с этим заболеванием патологические состояния оказывают сильное влияние на качество жизни пациентов.Treatment and care for patients with sickle cell disease is lifelong and includes antibiotic treatment, pain relief, and blood transfusions during acute episodes. One approach is the use of hydroxyurea, which works in part by increasing gamma globin production. However, the long-term side effects of long-term hydroxyurea therapy are still unknown, and the treatment produces unwanted side effects that lead to low compliance rates, and has varying effectiveness from patient to patient (Brandow and Panepinto (2011) Am J Hematol 86(9) :804-806). Despite improvements in the effectiveness of treatments for sickle cell disease, life expectancy for patients is still only in the mid to late 50s, and the disease-related conditions have a profound impact on patients' quality of life.

Талассемии также являются заболеваниями, связанными с гемоглобином, и обычно включают снижение экспрессии цепей глобина. Это может происходить посредством мутаций в регуляторных областях генов или из-за мутации в последовательности, кодирующей глобин, которая приводит к снижению экспрессии или снижению уровня функционального белка глобина. Альфа-талассемии, вызванные мутациями в локусе альфа-глобина, в основном связаны с людьми из Западной Африки и южно- азиатского происхождения и могут вызывать устойчивость к малярии. Бета-талассемия, вызванная мутациями в локусе бета-глобина, в основном связана с людьми средиземноморского происхождения, как правило, из Греции и прибрежных районов Турции и Италии. При малой талассемии только один из аллелей βглобина несет мутацию. Эти люди страдают от микроцитарной анемии, и ее обнаружение обычно связано с меньшим, чем обычно, средним корпускулярным объемом (<80 фл). Аллели субъектов с малой талассемией представляют собой β+/β или β0/β3 (где β+ относится к аллелям, которые позволяют образовывать некоторое количество β-цепи, β относится к аллелям β-глобина дикого типа и β0 относитсяThalassemias are also hemoglobin-related diseases and usually involve decreased expression of globin chains. This may occur through mutations in the regulatory regions of genes or due to a mutation in the globin coding sequence that results in decreased expression or reduced levels of functional globin protein. Alpha thalassemias, caused by mutations in the alpha globin locus, are mainly associated with people of West African and South Asian descent and can cause resistance to malaria. Beta thalassemia, caused by mutations in the beta globin locus, is mainly associated with people of Mediterranean origin, typically from Greece and coastal areas of Turkey and Italy. In thalassemia minor, only one of the βglobin alleles carries a mutation. These individuals suffer from microcytic anemia, and its finding is usually associated with a smaller than normal mean corpuscular volume (<80 fL). The alleles of subjects with thalassemia minor are β+/β or β0/β3 (where β+ refers to alleles that allow the formation of some β chain, β refers to wild-type β-globin alleles, and β0 refers

- 2 045868 к мутациям β-глобина, связанным с полным отсутствием экспрессии бета-глобина). Субъекты с промежуточной талласемией часто могут вести нормальный образ жизни, но могут нуждаться время от времени в переливании крови, особенно во время болезни или беременности, в зависимости от тяжести их анемии. Аллели этих пациентов могут быть β+/β+ или β0/β+. Большая талассемия возникает, когда оба аллеля имеют мутации талассемии. Это сильно микроцитарная и гипохромная анемия. Без лечения он вызывает анемию, спленомегалию и тяжелые деформации костей и приводит к смерти в возрасте до 20 лет. Лечение состоит из периодического переливания крови; спленэктомии для лечения спленомегалии и хелатирования перегрузки железом вызванной трансфузией. Трансплантация костного мозга также используется для лечения людей с тяжелой талассемией, если можно идентифицировать подходящего донора, но эта процедура может иметь значительные риски.- 2 045868 to β-globin mutations associated with a complete lack of beta-globin expression). Subjects with thallasemia intermedia can often lead a normal life, but may require blood transfusions from time to time, especially during illness or pregnancy, depending on the severity of their anemia. The alleles of these patients may be β+/β+ or β0/β+. Thalassemia major occurs when both alleles have thalassemia mutations. This is a highly microcytic and hypochromic anemia. Without treatment, it causes anemia, splenomegaly and severe bone deformities and leads to death before the age of 20 years. Treatment consists of periodic blood transfusions; splenectomy to treat splenomegaly and chelate transfusion-induced iron overload. Bone marrow transplantation is also used to treat people with thalassemia major if a suitable donor can be identified, but the procedure can have significant risks.

Один из подходов, который был предложен для лечения как SCD, так и бета-талассемии, заключается в повышении экспрессии гамма-глобина с целью функциональной замены аберрантного гемоглобина взрослых на HbF. Как упомянуто выше, считается, что обработка пациентов с SCD гидроксимочевиной является успешной отчасти из-за ее влияния на увеличение экспрессии гамма-глобина. Первой группой соединений, обнаруженных в качестве влияющих на экспрессию гамма-глобина, были цитотоксические препараты. Способность вызывать синтез гамма-глобина de novo путем фармакологических манипуляций была впервые продемонстрирована с использованием 5-азацитидина у экспериментальных животных (DeSimone (1982) Proc Nat'l Acad Sci USA 79(14):4428-31). Последующие исследования подтвердили способность 5-азацитидина повышать HbF у пациентов с β-талассемией и серповидноклеточной анемией (Ley, et al., (1982) N. Engl. J. Medicine, 307:1469-1475, and Ley, et al., (1983) Blood 62: 370-380). Кроме того, в экспериментальных системах было показано, что короткоцепочечные жирные кислоты (например, бутират и производные) повышают уровень HbF (Constantoulakis et al., (1988) Blood 72(6):1961-1967). Кроме того, существует часть человеческой популяции с состоянием, известным как наследственная персистенция фетального плода (HPFH), при котором повышенные количества HbF сохраняются в зрелом возрасте (10-40% у гетерозигот HPFH (см. Thein et al. (2009) Hum. Mol. Genet 18 (R2): R216-R223). Это редкое физиологическое состояние, но в отсутствии каких - либо связанных бета глобин-аномалий, оно не связано с какими - либо значительными клиническими проявлениями, даже если 100% гемоглобина индивида является HbF. Когда у людей, страдающих бета-талассемией, также имеется сопутствующий HPFH, экспрессия HbF может снизить тяжесть заболевания (Potoka and Gladwin (2015) A MJ Physiol Lung Cell Mol Physiol. 308(4): L314-L324). Кроме того, тяжесть естественного течения серповидноклеточной анемии может значительно варьироваться от пациента к пациенту, и эта изменчивость, отчасти, может быть связана с тем фактом, что некоторые люди с более легкой формой заболевания экспрессируют более высокие уровни HbF.One approach that has been proposed for the treatment of both SCD and beta thalassemia is to increase gamma globin expression to functionally replace aberrant adult hemoglobin with HbF. As mentioned above, treating patients with SCD with hydroxyurea is believed to be successful in part due to its effect on increasing gamma globin expression. The first group of compounds discovered to affect gamma-globin expression were cytotoxic drugs. The ability to induce de novo gamma-globin synthesis by pharmacological manipulation was first demonstrated using 5-azacytidine in experimental animals (DeSimone (1982) Proc Nat'l Acad Sci USA 79(14):4428-31). Subsequent studies confirmed the ability of 5-azacytidine to increase HbF in patients with β-thalassemia and sickle cell disease (Ley, et al., (1982) N. Engl. J. Medicine, 307:1469-1475, and Ley, et al., ( 1983) Blood 62: 370-380). In addition, short-chain fatty acids (eg, butyrate and derivatives) have been shown to increase HbF levels in experimental systems (Constantoulakis et al., (1988) Blood 72(6):1961-1967). Additionally, there is a portion of the human population with a condition known as hereditary persistence of fetal fetal disease (HPFH), in which elevated amounts of HbF persist into adulthood (10-40% in HPFH heterozygotes (see Thein et al. (2009) Hum. Mol Genet 18 (R2): R216-R223) This is a rare physiological condition, but in the absence of any associated beta globin abnormalities, it is not associated with any significant clinical manifestations, even if 100% of an individual's hemoglobin is HbF. When In people with beta thalassemia also have concomitant HPFH, expression of HbF may reduce the severity of the disease (Potoka and Gladwin (2015) A MJ Physiol Lung Cell Mol Physiol. 308(4): L314-L324). In addition, the severity of the natural history Sickle cell disease can vary significantly from patient to patient, and this variability, in part, may be due to the fact that some people with milder forms of the disease express higher levels of HbF.

Один из подходов к увеличению экспрессии HbF включает идентификацию генов, чьи продукты играют роль в регуляции экспрессии гамма-глобина. Одним из таких генов является BCL11A, впервые идентифицированный из-за его роли в развитии лимфоцитов. BCL11A кодирует белок цинкового пальца, который, как полагают, участвует в специфической регуляции экспрессии гамма- глобина на стадии развития. BCL11A экспрессируется в эритроидных клетках-предшественниках взрослых, и подавление его экспрессии приводит к увеличению экспрессии гамма-глобина. Кроме того, сплайсинг мРНК BCL11A регулируется в зависимости от стадии развития организма. В эмбриональных клетках в основном экспрессируются более короткие варианты мРНК BCL11A, известные как BCL11A-S и BCL11A-XS, тогда как в клетках взрослых преимущественно экспрессируются более длинные варианты мРНК BCL11A-L и BCL11A-XL. См. Sankaran et al. (2008) Science 322 p. 1839. Белок BCL11A, по-видимому, взаимодействует с локусом бета- глобина, изменяя его конформацию и, следовательно, его экспрессию на разных стадиях развития. Было предложено использование ингибирующей РНК, нацеленной на ген BCL11A (см., например, публикацию патента США № 2011/0182867), но эта технология имеет несколько потенциальных недостатков, которые состоят в том, что полный нокдаун не может быть достигнут, доставка таких РНК может быть проблематичной, и РНК должны присутствовать постоянно, требуя многократных обработок в течении всей жизни.One approach to increasing HbF expression involves identifying genes whose products play a role in regulating gamma-globin expression. One such gene is BCL11A, first identified for its role in lymphocyte development. BCL11A encodes a zinc finger protein that is believed to be involved in the specific regulation of gamma globin expression during development. BCL11A is expressed in adult erythroid progenitor cells, and downregulation of its expression results in increased gamma-globin expression. In addition, BCL11A mRNA splicing is regulated depending on the developmental stage of the organism. Fetal cells predominantly express shorter variants of BCL11A mRNA, known as BCL11A-S and BCL11A-XS, whereas adult cells predominantly express longer variants of BCL11A-L and BCL11A-XL mRNA. See Sankaran et al. (2008) Science 322 p. 1839. The BCL11A protein appears to interact with the beta-globin locus, changing its conformation and, consequently, its expression at different stages of development. The use of inhibitory RNA targeting the BCL11A gene has been proposed (see, for example, US Patent Publication No. 2011/0182867), but this technology has several potential disadvantages in that complete knockdown cannot be achieved; delivery of such RNAs may be problematic, and the RNA must be constantly present, requiring multiple treatments throughout life.

Нацеливание на энхансерные последовательности BCL11A обеспечивает механизм увеличения количества HbF. См., например, публикацию патента США № 2015/0132269 и публикацию РСТ № WO 2016/183298. Исследования геномных ассоциаций выявили ряд генетических вариаций в локусе гена BCL11A, которые связаны с повышенным уровнем HbF. Эти вариации представляют собой совокупность небольших (единичных) нуклеотидных полиморфизмов (SNP), обнаруженных в некодирующих областях BCL11A, которые функционируют как специфичная для стадии ограниченная по линии происхождения энхансерная область. Дальнейшие исследования показали, что этот энхансер BCL11A необходим в эритроидных клетках для экспрессии BCL11A, но не требуется для его экспрессии в В-клетках (см. Bauer et al. (2013) Science 343:253-257). Область энхансера была обнаружена в интроне 2 гена BCL11A, и были идентифицированы три области гиперчувствительности к ДНКзе I (часто свидетельствующие о состоянии хроматина, которое связано с регуляторным потенциалом) в интроне 2. Эти три области были определены как +62, +58 и +55 в соответствии с расстоянием в килобазах от стартового сайта трансTargeting BCL11A enhancer sequences provides a mechanism for increasing HbF abundance. See, for example, US Patent Publication No. 2015/0132269 and PCT Publication No. WO 2016/183298. Genomic association studies have identified a number of genetic variations at the BCL11A gene locus that are associated with elevated HbF levels. These variations are a collection of small (single) nucleotide polymorphisms (SNPs) found in the noncoding regions of BCL11A that function as a stage-specific lineage-restricted enhancer region. Further studies showed that this BCL11A enhancer is required in erythroid cells for BCL11A expression, but is not required for its expression in B cells (see Bauer et al. (2013) Science 343:253-257). An enhancer region was found in intron 2 of the BCL11A gene, and three DNase I hypersensitive regions (often indicative of a chromatin state that is associated with regulatory potential) were identified in intron 2. These three regions were identified as +62, +58, and +55 according to the distance in kilobases from the trans start site

- 3 045868 крипции BCL11A.- 3 045868 BCL11A transcriptions.

Эти энхансерные области примерно 350(+55); 550(+58) и 350(+62) нуклеотидов в длину (Bauer 2013, там же).These enhancer regions are approximately 350(+55); 550(+58) and 350(+62) nucleotides in length (Bauer 2013, ibid).

При разработке нуклеазы для использования в терапевтическом лечении людей важно, чтобы нуклеаза имела максимальные характеристики безопасности для пациентов. В частности, нуклеазы должны иметь очень низкий уровень разрезания вне мишени. Значительное количество двухцепочечных разрезов в местах, отличных от указанной пользователем мишени, может привести к репрессии нецелевых генов, а в редких случаях - к появлению хромосомных транслокаций (см. Hoban and Bauer (2016) Blood, 127(21):2525-2535 и Tsang et al. (2017) Nature Methods, в печати). Улучшения в специфичности могут быть достигнуты путем устранения неспецифических взаимодействий между сконструированной нуклеазой и геномной ДНК (см. предварительные заявки на патент США №№ 62/378978 и 62/443981).When developing a nuclease for use in human therapeutics, it is important that the nuclease has maximum safety characteristics for patients. In particular, nucleases must have very low levels of off-target cutting. Significant numbers of double-stranded cuts at locations other than the user-specified target can lead to repression of off-target genes and, in rare cases, to the occurrence of chromosomal translocations (see Hoban and Bauer (2016) Blood, 127(21):2525-2535 and Tsang et al (2017) Nature Methods, in press). Improvements in specificity can be achieved by eliminating nonspecific interactions between the engineered nuclease and genomic DNA (see US Provisional Patent Application Nos. 62/378978 and 62/443981).

Таким образом, остается потребность в дополнительных высокоспецифичных способах и композициях для изменения экспрессии гена BCL11A, например, для лечения гемоглобинопатий, таких как серповидноклеточная анемия и бета-талассемия.Thus, there remains a need for additional highly specific methods and compositions for altering the expression of the BCL11A gene, for example, for the treatment of hemoglobinopathies such as sickle cell anemia and beta thalassemia.

Сущность изобретенияThe essence of the invention

Данное изобретение описывает высокоспецифичные композиции и способы для применения в генной терапии и геномной инженерии. В частности, описанные способы и композиции относятся к инактивации (например, путем полной или частичной отмены его экспрессии) гена BCL11A, например, гена, который действует как регулятор одного или более дополнительных генов. В частности, изобретение описывает способы и композиции для воздействия на функцию энхансера в гене BCL11A для уменьшения или подавления его активности в специфических клеточных линиях (например, эритроидных). Кроме того, изобретение предлагает способы и композиции для вмешательства в функции энхансера BCL11A, причем последовательности энхансера не локализованы в кодирующих последовательностях гена BCL11A, и причем предложенные реагенты проявляют высокоспецифичную активность. Результирующее подавление гена BCL11A в этих обстоятельствах приводит к увеличению экспрессии гаммаглобина, и количество явлений разрезания вне мишени снижается.This invention describes highly specific compositions and methods for use in gene therapy and genome engineering. In particular, the described methods and compositions relate to the inactivation (eg, by completely or partially abrogating its expression) of the BCL11A gene, for example, a gene that acts as a regulator of one or more additional genes. In particular, the invention describes methods and compositions for influencing the function of an enhancer in the BCL11A gene to reduce or suppress its activity in specific cell lines (eg, erythroid). In addition, the invention provides methods and compositions for interfering with the functions of the BCL11A enhancer, wherein the enhancer sequences are not located in the coding sequences of the BCL11A gene, and wherein the proposed reagents exhibit highly specific activity. The resulting suppression of the BCL11A gene under these circumstances results in increased gammaglobin expression and the incidence of off-target cutting events is reduced.

В некоторых аспектах изобретение включает не встречающийся в природе белок цинкового пальца, содержащий белок цинкового пальца (ZFP), содержащий 4, 5 или 6 пальцев, причем каждый палец содержит область спирали распознавания, которая распознает второстепенный сайт-мишень в ДНК, причем области спирали распознавания содержат последовательности в порядке, указанном в одной строке табл. 1. Внутри каждого цинкового пальца спираль распознаванияная область из 7 аминокислот пронумерована от -1 до + 6 в остове цинкового пальца (приблизительно из 30 остатков, включая координирующие остатки для цинка). В определенных вариантах осуществления 1, 2, 3 или более компонентных цинковых пальцев белков цинковых пальцев, описанных в данном документе, дополнительно содержат мутации в одном или более остатках вне области спирали распознавания, включая, но не ограничиваясь этим, мутации аминокислот в позиции -5 позиции -14 или мутации в обоих позициях -5 и -14 (нумерация продолжается от нумерации от -1 до + 6, используемой для области распознающей спирали). См., например, мутации Qm4 и Qm14, описанные в предварительных патентных заявках США 62/378978 и 62/443981. Компонентные цинковые пальцы белка цинковых пальцев могут быть связаны любыми линкерами, например, как описано в патенте США № 8772453. В некоторых вариантах осуществления ZFP (белок цинкового пальца) содержит распознающие спирали, показанные в табл. 1 для белков, обозначенных следующим образом: 63014 (который связывается с сайтом-мишенью, показанным в SEQ ID NO: 1) и 65722 (который связывается с сайтом-мишенью, показанным в SEQ ID NO: 2).In some aspects, the invention includes a non-naturally occurring zinc finger protein comprising a zinc finger protein (ZFP) comprising 4, 5 or 6 fingers, wherein each finger contains a recognition helix region that recognizes a minor target site in DNA, wherein the recognition helix regions contain sequences in the order specified in one row of the table. 1. Within each zinc finger helix recognition region of 7 amino acids is numbered -1 to +6 in the zinc finger backbone (of approximately 30 residues, including the coordinating residues for zinc). In certain embodiments, the 1, 2, 3, or more zinc finger components of the zinc finger proteins described herein further comprise mutations at one or more residues outside the recognition helix region, including, but not limited to, amino acid mutations at the -5 position -14 or mutations at both positions -5 and -14 (numbering continues from the -1 to +6 numbering used for the recognition helix region). See, for example, the Qm4 and Qm14 mutations described in US Provisional Patent Applications 62/378978 and 62/443981. The component zinc fingers of a zinc finger protein may be linked by any linkers, for example, as described in US Pat. No. 8,772,453. In some embodiments, ZFP (zinc finger protein) comprises the recognition helices shown in Table 1. 1 for proteins designated as follows: 63014 (which binds to the target site shown in SEQ ID NO: 1) and 65722 (which binds to the target site shown in SEQ ID NO: 2).

В определенных вариантах осуществления белки цинкового пальца, как описано в данном документе, слиты с функциональным доменом (например, доменом активации транскрипции, доменом репрессии транскрипции, доменом разрезания (для образования нуклеазы цинкового пальца) и т.д.). Любой линкер может быть использован для осуществления функциональной связи домена разрезания и белка цинкового пальца, включая, но не ограничиваясь этим, линкеры, описанные в патентах США №№ 9394531 и 9567609. Кроме того, когда используется домен разрезания FokI, могут присутствовать дальнейшие мутации в каталитическом домене, домене димеризации в фосфат-контактных остатках (не присутствующих в димеризационном или каталитическом домене), и комбинации мутаций в любом одном из каталитического домена, домена димеризации в фосфат-контактных остатках, включая, но не ограничиваясь этим, мутации ELD или KKR в домене димеризации, мутации в остатках 525 (K-S) домена FokI и комбинации мутаций ELD или KKR в домене димеризации и мутации в остатки 525 (от K до S) домена FokI, пронумерованные относительно дикого типа. См. патенты США № 7888121; 7914796; 8034598; 8623618 и публикации патента США № 2011/0201055 и предварительные заявки на патент США №№ 62/378978 и 62/443981.In certain embodiments, zinc finger proteins as described herein are fused to a functional domain (eg, a transcriptional activation domain, a transcriptional repression domain, a cutting domain (to form a zinc finger nuclease), etc.). Any linker can be used to operably link the cutting domain and the zinc finger protein, including, but not limited to, the linkers described in US Pat. Nos. 9,394,531 and 9,567,609. Additionally, when a FokI cutting domain is used, further mutations in the catalytic protein may be present. domain, dimerization domain at phosphate contact residues (not present in the dimerization or catalytic domain), and combinations of mutations in any one of the catalytic domain, dimerization domain at phosphate contact residues, including, but not limited to, ELD or KKR mutations in the domain dimerization, mutations in residues 525 (K to S) of the FokI domain, and combinations of ELD or KKR mutations in the dimerization domain and mutations in residues 525 (K to S) of the FokI domain, numbered relative to the wild type. See US Patent No. 7888121; 7914796; 8034598; 8623618 and US Patent Publications No. 2011/0201055 and US Provisional Patent Applications Nos. 62/378978 and 62/443981.

В некоторых вариантах осуществления нуклеазы цинковых пальцев (ZFN) можно использовать в димеризующихся парах для разрезания в одном или обоих целевых сайтах для ZFN пары, например, левый партнер в табл. 1 (например, 63014) может образовывать димер с правым партнером из табл. 1 (например, 65722) для разрезания энхансерных последовательностей BCL11A. В определенных вариантах осуществления пара ZFN содержит следующие аминокислотные последовательности:In some embodiments, zinc finger nucleases (ZFNs) can be used in dimerizing pairs to cut at one or both target sites for the ZFN pair, for example, the left partner in Table. 1 (for example, 63014) can form a dimer with the right partner from the table. 1 (e.g. 65722) to cut BCL11A enhancer sequences. In certain embodiments, the ZFN pair contains the following amino acid sequences:

- 4 045868- 4 045868

63014:63014:

MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAAMAERPFQCRICMQNFSDQSNLRAH IRTHTGEKPFACDICGRKFARNFSLTMHTKIHTGSQKPFQCRICMQNFSSTGNLTNHIRTHTGE KPFACDICGRKFATSGSLTRHTKIHTHPRAPIPKPFQCRICMQNFSDQSNLRAHIRTHTGEKPF ACDICGRKFAAQCCLFHHTKIH- Линкер ELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRMDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAAMAERPFQCRICMQNFSDQSNLRAH IRTHTGEKPFACDICGRKFARNFSLTMHTKIHTGSQKPFQCRICMQNFSSTGNLTNHIRTHTGE KPFACDICGRKFATSGSLTRHTKIHTHPRAPIPKPFQCRICMQNFSDQSNLRAHIRTHTGEKPF ACDIC GRKFAAQCCLFHHTKIH- Linker ELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSR

KPDGAIYTVGS PIDYGVIVDTKAYS GGYNLPIGQADEMERYVEENQTRDKHLNPNEWWKVYPS S VTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNG EINFRS (SEQ ID NO:3) ; а такжеKPDGAIYTVGS PIDYGVIVDTKAYS GGYNLPIGQADEMERYVEENQTRDKHLNPNEWWKVYPS S VTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNG EINFRS (SEQ ID NO:3) ; and

MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAAMAERP FQCRICMQKFARND HRTTHTKIHTGEKPFQCRICMQNFSQKAHLIRHIRTHTGEKPFACDICGRKFAQKGTLGEHTKI HTGSQKPFQCRICMQNFSRGRDLSRHIRTHTGEKPFACDICGRKFARRDNLHSHTKIHЛинкерELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRMDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAAMAERP FQCRICMQKFARND HRTTHTKIHTGEKPFQCRICMQNFSQKAHLIRHIRTHTGEKPFACDICGRKFAQKGTLGEHTKI HTGSQKPFQCRICMQNFSRGRDLSRHIRTHTGEKPFACDICGRKFARRDNLHSHTKIHLinkerELEE KKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSR

KPDGAIYTVGS PIDYGVIVDTKAYS GGYNLPIGQADEMQRYVKENQTRNKHINPNEWWKVYPS SKPDGAIYTVGS PIDYGVIVDTKAYS GGYNLPIGQADEMQRYVKENQTRNKHINPNEWWKVYPS S

VTEFKFLFVSGHFSGNYKAQLTRLNRKTNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGVTEFKFLFVSGHFSGNYKAQLTRLNRKTNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNG

EINF (SEQ ID NO: 4), в которых последовательность линкера может быть любой последовательностью линкера известной в данной области, например, как описано в патентах США №№ 9394531 и 9567609. В некоторых вариантах осуществления линкер для 63014 содержит или состоит из линкера L7c5 (LRGSISRARPLNPHP (SEQ ID NO: 5)), и линкер, используемый в 65722, содержит или состоит из линкера LO (LRGSQLVKS (SEQ ID NO: 6), см. патент США № 9567609). Последовательность домена разрезания FokI, которая является С-концевой относительно линкера последовательностей, показанных выше, также может содержать альтернативные домены FokI, функционально связанные с белком цинкового пальца. В некоторых вариантах осуществления домен разрезания FokI может включать альтернативные или дополнительные мутации в каталитическом домене, домене димеризации, фосфатконтактных остатках и комбинации мутаций в любом одном из каталитического домена, домена димеризации и фосфат-контактных остатках.EINF (SEQ ID NO: 4), wherein the linker sequence may be any linker sequence known in the art, for example, as described in US Pat. Nos. 9,394,531 and 9,567,609. In some embodiments, the linker for 63014 comprises or consists of a L7c5 linker ( LRGSISRARPLNPHP (SEQ ID NO: 5)), and the linker used in 65722 contains or consists of a LO linker (LRGSQLVKS (SEQ ID NO: 6), see US Patent No. 9567609). The FokI cutting domain sequence that is C-terminal to the linker sequences shown above may also contain alternative FokI domains operably linked to the zinc finger protein. In some embodiments, the FokI cutting domain may include alternative or additional mutations in the catalytic domain, dimerization domain, phosphate contact residues, and combinations of mutations in any one of the catalytic domain, dimerization domain, and phosphate contact residues.

В другом аспекте изобретение включает доставку по меньшей мере одной нуклеазы (например, нуклеазы, которая связывается с последовательностью энхансера BCL11A) в стволовую клетку человека или клетку-предшественник (HSC/PC) с целью инженерии генома. В некоторых вариантах осуществления нуклеаза содержит белок цинкового пальца (ZFP), содержащий 4, 5 или 6 пальцев, каждый палец содержит область спирали распознавания, которая распознает целевой сайт, причем области спирали распознавания содержат последовательности в порядке, показанном в одном ряду табл. 1. В других вариантах осуществления нуклеаза ZFN содержит пару нуклеаз, обозначенных 63014/65722. Нуклеаза(ы), как описано в данном документе, может дополнительно содержать линкер (например, между ДНКсвязывающим доменом и доменом разрезания), например линкер, как показано в 9567609, включая, но не ограничиваясь этим, LRGSISRARPLNPHP (SEQ ID NO: 5) или (LRGSQLVKS (SEQ ID NO: 6)).In another aspect, the invention includes delivering at least one nuclease (eg, a nuclease that binds to a BCL11A enhancer sequence) into a human stem or progenitor cell (HSC/PC) for the purpose of genome engineering. In some embodiments, the nuclease comprises a zinc finger protein (ZFP) containing 4, 5, or 6 fingers, each finger containing a recognition helix region that recognizes a target site, the recognition helix regions containing sequences in the order shown in one row of the table. 1. In other embodiments, the ZFN nuclease contains a pair of nucleases designated 63014/65722. The nuclease(s) as described herein may further comprise a linker (e.g., between a DNA binding domain and a cleavage domain), such as a linker as shown in 9567609, including, but not limited to, LRGSISRARPLNPHP (SEQ ID NO: 5) or (LRGSQLVKS (SEQ ID NO: 6)).

В некоторых вариантах осуществления нуклеаза доставляется в виде пептида, тогда как в других она доставляется в виде нуклеиновой кислоты, кодирующей по меньшей мере одну нуклеазу. В некоторых вариантах осуществления используется более одной нуклеазы. В некоторых предпочтительных вариантах осуществления нуклеиновая кислота, кодирующая нуклеазу, представляет собой мРНК, а в некоторых случаях мРНК защищена. В некоторых аспектах мРНК может быть химически модифицирована (см., например, Kormann et al. (2011) Nature Biotechnology 29(2):154-157). В других аспектах мРНК может содержать ARCA кэп (см. патенты США №№ 7074596 и 8153773). В других вариантах осуществления мРНК может содержать смесь немодифицированных и модифицированных нуклеотидов (см. публикацию патента США № 2012/0195936). В предпочтительном варианте осуществления нуклеиновая кислота, кодирующая нуклеазу(ы), доставляется в HSC/PC посредством электропорации. В некоторых вариантах осуществления нуклеаза разрезает в сайте или вблизи сайта связывания фактора транскрипции. В некоторых аспектах фактором транскрипции является GATA-1.In some embodiments, the nuclease is delivered as a peptide, while in others it is delivered as a nucleic acid encoding at least one nuclease. In some embodiments, more than one nuclease is used. In some preferred embodiments, the nucleic acid encoding the nuclease is mRNA, and in some cases the mRNA is protected. In some aspects, the mRNA can be chemically modified (see, for example, Kormann et al. (2011) Nature Biotechnology 29(2):154-157). In other aspects, the mRNA may contain an ARCA cap (see US Pat. Nos. 7,074,596 and 8,153,773). In other embodiments, the mRNA may contain a mixture of unmodified and modified nucleotides (see US Patent Publication No. 2012/0195936). In a preferred embodiment, the nucleic acid encoding the nuclease(s) is delivered to the HSC/PC via electroporation. In some embodiments, the nuclease cuts at or near a transcription factor binding site. In some aspects, the transcription factor is GATA-1.

В других аспектах изобретение включает клетку или клеточную линию, в которой эндогенная энхансерная последовательность BCL11A генетически модифицирована нуклеазой, как описано в данном документе (например, показаной в табл. 1), например, по сравнению с последовательностью дикого типа клетки. Генетическая модификация энхансера BCL11A приводит к модификации экспрессии гена глобина (бета и гамма). Модифицированные нуклеазой клетки или клеточные линии, как описано в данном документе, отличаются по структуре, функции и сочетаниям как структуры, так и функции от дикого типа. Генетически модифицированные клетки или клеточные линии могут быть гетерозиготными или гомозиготными по модификации. Модификации могут включать вставки (например, вставки трансгена) и комбинации вставок и делеций; такие вставки (инсерции), делеции и комбинации вставок и делеций обычно упоминаются как инделы (indel). В некоторых предпочтительных вариантах осуществления изобретения инделы приводят к разрушению сайта связывания фактора транскрипции. В некоторых ваIn other aspects, the invention includes a cell or cell line in which the endogenous BCL11A enhancer sequence is genetically modified by a nuclease as described herein (eg, shown in Table 1), for example, compared to the sequence of a wild-type cell. Genetic modification of the BCL11A enhancer results in modification of globin gene expression (beta and gamma). Nuclease-modified cells or cell lines, as described herein, differ in structure, function, and combinations of both structure and function from the wild type. Genetically modified cells or cell lines can be heterozygous or homozygous for the modification. Modifications may include insertions (eg, transgene insertions) and combinations of insertions and deletions; such insertions, deletions, and combinations of insertions and deletions are commonly referred to as indels. In some preferred embodiments, indels result in disruption of the transcription factor binding site. In some va

- 5 045868 риантах осуществления модификация происходит в или около сайта(ов) связывания нуклеазы(нуклеаз), сайта(ов) разрезания и комбинаций сайтов связывания и разрезания, например, в пределах 1-300 (или любого значения между ними) пар оснований выше- или нижерасположенных от сайта(ов) разрезания, более предпочтительно в пределах 1-100 пар оснований (или любого значения между ними) с любой стороны от сайта(ов) связывания, сайта(ов) разрезания и комбинаций сайтов связывания и разрезания как показано в табл. 1, еще более предпочтительно в пределах от 1 до 50 пар оснований (или любого значения между ними) на любой стороне сайта(ов) связывания, сайта(ов) разрезания и комбинаций сайтов связывания и разрезания. В определенных вариантах осуществления генетическая модификация последовательности энхансера BCL11A находится внутри и/или между последовательностями, показанными в табл. 1 (сайты-мишени). Модификация также может включать модификации одного или более нуклеотидов в сайтах разрезания. Модификация также может включать модификации одного или более нуклеотидов в сайтах связывания. Модификация может дополнительно включать модификации одного или более нуклеотидов в сайтах разрезания и в одном или более сайтах связывания. В определенных вариантах осуществления один или более сайтов-мишеней нуклеазы не модифицированы. В других вариантах осуществления, по меньшей мере, один из сайтов-мишеней для нуклеазы(нуклеаз) модифицирован. В некоторых вариантах осуществления модификация находится в или около области +58 энхансера BCL11A, например, в или около сайта связывания нуклеазы, показанного в любом из SEQ ID NO: 1 и SEQ ID NO: 2. Любая клетка или клеточная линия может быть модифицирована нуклеазами, как описано в данном документе, например, стволовая клетка (гемопоэтическая стволовая клетка, такая как CD34+ гемопоэтическая стволовая клетка) или клетка-предшественник эритроцитов (RBC).- 5 045868 embodiments, the modification occurs at or near the nuclease(s) binding site(s), cutting site(s), and combinations of binding and cutting sites, for example, within 1-300 (or any value in between) base pairs above- or downstream of the cleavage site(s), more preferably within 1-100 base pairs (or any value in between) on either side of the binding site(s), cleavage site(s), and combinations of binding and cleavage sites as shown in Table . 1, even more preferably ranging from 1 to 50 base pairs (or any value in between) on either side of the binding site(s), cutting site(s), and combinations of binding and cutting sites. In certain embodiments, the genetic modification of the BCL11A enhancer sequence is within and/or between the sequences shown in table. 1 (target sites). The modification may also include modifications to one or more nucleotides at the cutting sites. The modification may also include modifications to one or more nucleotides at the binding sites. The modification may further include modifications to one or more nucleotides at the cutting sites and at one or more binding sites. In certain embodiments, one or more nuclease target sites are unmodified. In other embodiments, at least one of the target sites for the nuclease(s) is modified. In some embodiments, the modification is at or near the +58 region of the BCL11A enhancer, for example, at or near the nuclease binding site shown in either SEQ ID NO: 1 and SEQ ID NO: 2. Any cell or cell line can be modified with nucleases, as described herein, for example, a stem cell (hematopoietic stem cell, such as a CD34+ hematopoietic stem cell) or a red blood cell progenitor cell (RBC).

Также описаны клетки или клеточные линии, полученные после модификации нуклеазой, как описано в данном документе, например клетки или клеточные линии, происходящие от модифицированной нуклеазой клетки или клеточной линии, как описано в данном документе. Также предложены частично или полностью дифференцированные клетки, происходящие от модифицированных стволовых клеток, как описано в данном документе (например, эритроциты или клетки-предшественники эритроцитов). Клетки, происходящие от модифицированных нуклеазой(ами) клеток, могут размножаться, дифференцироваться и комбинациями как с размноженных, так и дифференцированных в культуре in vitro или могут дифференцироваться в живом субъекте, например, после введения ex vivo модифицированной нуклеазой(ами) стволовой клетки. Любые из генетически модифицированных клеток или клеточных линий, раскрытых в данном документе, могут демонстрировать повышенную экспрессию гамма-глобина. Композиции, такие как фармацевтические композиции, содержащие генетически модифицированные клетки, как описано в данном документе, также предлагаются.Also described are cells or cell lines obtained after modification with a nuclease as described herein, for example cells or cell lines derived from a nuclease modified cell or cell line as described herein. Also provided are partially or fully differentiated cells derived from modified stem cells as described herein (eg, red blood cells or red blood cell progenitor cells). Cells derived from nuclease(s) modified cells may be expanded, differentiated, and combinations from both those expanded and differentiated in in vitro culture, or may be differentiated in a living subject, for example, following ex vivo administration of the nuclease(s) modified stem cell. Any of the genetically modified cells or cell lines disclosed herein may exhibit increased expression of gamma globin. Compositions, such as pharmaceutical compositions, containing genetically modified cells, as described herein, are also provided.

В других аспектах изобретение включает доставку донорной нуклеиновой кислоты в клеткумишень, чтобы обеспечить генетически модифицированную клетку, в которой указанный донор интегрирован в клетку. Донор может быть доставлен до, после или вместе с нуклеиновой кислотой, кодирующей нуклеазу(ы) из табл. 1. Донорная нуклеиновая кислота может содержать экзогенную последовательность (трансген) для интеграции в геном клетки, например, эндогенный локус. В некоторых вариантах осуществления донор может содержать полноразмерный ген или его фрагмент, фланкированные областями гомологии с целевым сайтом разрезания. В некоторых вариантах осуществления донор не имеет гомологичных областей и интегрируется в локус-мишень посредством механизма, независимого от гомологии (т.е. NHEJ). Донор может содержать любую последовательность нуклеиновой кислоты, например нуклеиновую кислоту, которая при использовании в качестве субстрата для гомологически направленной репарации нуклеазо-индуцированного двухцепочечного разрыва приводит к генерации указанной донором делеции на эндогенной локусе хромосомы (например, энхансерная область BCL11A) или, альтернативно (или в дополнение к), новые аллельные формы (например, точечные мутации, которые инактивируют сайт связывания фактора транскрипции) создаваемого эндогенного локуса. В некоторых аспектах донорная нуклеиновая кислота представляет собой олигонуклеотид, причем интеграция приводит к явлению коррекции гена или целевой делеции.In other aspects, the invention includes delivering a donor nucleic acid to a target cell to provide a genetically modified cell in which the donor is integrated into the cell. The donor may be delivered before, after, or together with the nucleic acid encoding the nuclease(s) from Table. 1. The donor nucleic acid may contain an exogenous sequence (transgene) for integration into the cell genome, for example, an endogenous locus. In some embodiments, the donor may contain a full-length gene or fragment thereof flanked by regions of homology to the target cutting site. In some embodiments, the donor has no homologous regions and is integrated into the target locus through a homology-independent mechanism (ie, NHEJ). The donor may contain any nucleic acid sequence, for example a nucleic acid that, when used as a substrate for homology-directed nuclease-induced double-strand break repair, results in the generation of a donor-specified deletion at an endogenous chromosomal locus (e.g., the BCL11A enhancer region) or, alternatively (or in addition to), new allelic forms (eg, point mutations that inactivate the transcription factor binding site) of the endogenous locus created. In some aspects, the donor nucleic acid is an oligonucleotide, wherein integration results in the phenomenon of gene correction or targeted deletion.

В других аспектах нуклеаза, донор и комбинации как нуклеазы, так и донора доставляется(доставляются) вирусными, невирусными и комбинациями вирусных и невирусных способов переноса генов. В предпочтительных вариантах осуществления донор доставляется в клетку посредством аденоассоциированного вируса (AAV). В некоторых случаях AAV содержит LTR, которые принадлежат гетерологичному серотипу по сравнению с серотипом капсида.In other aspects, the nuclease, donor, and combinations of both nuclease and donor are delivered by viral, nonviral, and combinations of viral and nonviral gene transfer methods. In preferred embodiments, the donor is delivered into the cell via an adeno-associated virus (AAV). In some cases, AAV contains LTRs that are of a heterologous serotype compared to the capsid serotype.

В некоторых аспектах содержащие делеции области внутри гиперчувствительных к ДНКазе I областей энхансера (например, области +58 энхансера BCL11A), получают с использованием одной или большего количества нуклеаз, как показано в табл. 1. Эти делеции могут содержать от около 1 нуклеотида до около 551 нуклеотида. Таким образом, делеции могут содержать 1, 5, 10, 15, 20, 25, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550 нуклеотидов или любое значение между ними. В некоторых вариантах осуществления делеции содержат области связывания для одного или более факторов транскрипции. В некоторых предпочтительных вариантах осуществления делеции содержат сайт связывания GATA-1 или сайт связывания для GATA-1 в сочетании с другими факторами.In some aspects, deletion-containing regions within DNase I hypersensitive enhancer regions (eg, the +58 region of the BCL11A enhancer) are generated using one or more nucleases, as shown in Table 1. 1. These deletions can range from about 1 nucleotide to about 551 nucleotides. Thus, deletions may contain 1, 5, 10, 15, 20, 25, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550 nucleotides, or any value in between. In some embodiments, the deletions contain binding regions for one or more transcription factors. In some preferred embodiments, the deletions contain a GATA-1 binding site or a binding site for GATA-1 in combination with other factors.

В некоторых вариантах осуществления ДНК-связывающие домены из табл. 1 слиты с функциоIn some embodiments, the DNA binding domains from Table. 1 merged with function

- 6 045868 нальным доменом. Некоторые аспекты включают в себя слияние ДНК-связывающих доменов с доменами способными регулировать экспрессию гена. В некоторых вариантах осуществления слитые белки содержат ДНК-связывающий домен из табл. 1, слитый с доменом модуляции экспрессии гена, причем модулятор подавляет экспрессию гена.- 6 045868 local domain. Some aspects include fusion of DNA-binding domains with domains capable of regulating gene expression. In some embodiments, the fusion proteins comprise the DNA binding domain from Table 1. 1 fused to a gene expression modulation domain, wherein the modulator suppresses gene expression.

В некоторых вариантах осуществления HSC/PC клеткаи приводят в контакт с нуклеазами, ДНКсвязывающими белками и комбинациями нуклеаз и ДНК-связывающих белков по данному изобретению (т.е. ZFP, как показано в табл. 1). В некоторых вариантах осуществления нуклеазы, ДНК-связывающие белки и комбинации нуклеаз и ДНК-связывающих белков доставляются в виде нуклеиновых кислот, а в других вариантах осуществления они доставляются в виде белков. В некоторых вариантах осуществления нуклеиновые кислоты представляют собой мРНК, кодирующие ДНК-связывающие белки и комбинации нуклеаз и ДНК-связывающих белков, и в дополнительных вариантах осуществления мРНК могут быть защищены. В некоторых вариантах осуществления мРНК может быть химически модифицирована и может включать ARCA кэп, смесь немодифицированных и модифицированных нуклеотидов и комбинации ARCA кэпа и смеси немодифицированных и модифицированных нуклеотидов. Также предусмотрены клетки или клеточные линии, происходящие от этих клеток, включая частично или полностью дифференцированные клетки.In some embodiments, HSC/PC cells are contacted with nucleases, DNA-binding proteins, and combinations of nucleases and DNA-binding proteins of the invention (ie, ZFPs, as shown in Table 1). In some embodiments, nucleases, DNA-binding proteins, and combinations of nucleases and DNA-binding proteins are delivered as nucleic acids, and in other embodiments, they are delivered as proteins. In some embodiments, the nucleic acids are mRNAs encoding DNA-binding proteins and combinations of nucleases and DNA-binding proteins, and in additional embodiments, the mRNAs may be protected. In some embodiments, the mRNA may be chemically modified and may include an ARCA cap, a mixture of unmodified and modified nucleotides, and combinations of an ARCA cap and a mixture of unmodified and modified nucleotides. Also provided are cells or cell lines derived from these cells, including partially or fully differentiated cells.

В некоторых аспектах HSC/PC приводятся в контакт с нуклеазами, ДНК-связывающими белками и комбинациями нуклеаз и ДНК-связывающих белков по данному изобретению ex vivo, после афереза HSC/PC от субъекта или очистки из полученного костного мозга. В некоторых вариантах осуществления нуклеазы, описанные в данном документе, вызывают модификации в областях энхансера BCL11A, например, приводя к генетически модифицированной клетке, которая структурно, функционально, и комбинированно структурно и функционально, отлична от клеток дикого типа, других модифицированных (например, модифицированных нуклеазой(ами)) клеток и комбинации дикого типа и других модифицированных клеток. В других вариантах осуществления HSC/PC, содержащие модификации энхансерной области BCL11A, вводят обратно субъекту. В некоторых случаях HSC/PC, содержащие модификации энхансерной области BCL11A, размножают перед введением. В других аспектах генетически модифицированные HSC/PC вводят субъекту в составе трансплантата костного мозга, причем HSC/PC приживаются, дифференцируются и созревают in vivo. В некоторых вариантах осуществления HSC/PC выделяют у субъекта после мобилизации, индуцированной G-CSF, мобилизации, индуцированной плериксафором (plerixafor), и комбинаций мобилизации, индуцированной G-CSF, и плериксафором, а в других клетки выделяют из костного мозга человека или пуповин человека. В некоторых аспектах субъекта подвергают мягкой миелоабляционной (myeloablative) процедуре до введения трансплантата, содержащего модифицированный HSC/PC, в то время как в других аспектах субъекта подвергают интенсивным условиям миелоабляционного режима. В некоторых вариантах осуществления способы и композиции по данному изобретению используются для лечения или профилактики гемоглобинопатии. В некоторых аспектах гемоглобинопатия представляет собой талассемию. В некоторых аспектах гемоглобинопатия представляет собой бета-талассемию, в то время как в других аспектах гемоглобинопатия представляет собой серповидноклеточную анемию.In some aspects, HSC/PCs are contacted with nucleases, DNA-binding proteins, and combinations of nucleases and DNA-binding proteins of the invention ex vivo, following apheresis of the HSC/PC from the subject or purification from the resulting bone marrow. In some embodiments, the nucleases described herein cause modifications in BCL11A enhancer regions, for example, resulting in a genetically modified cell that is structurally, functionally, and combined structurally and functionally different from wild-type cells, otherwise modified (e.g., nuclease-modified (s)) cells and combinations of wild type and other modified cells. In other embodiments, HSC/PC containing modifications of the BCL11A enhancer region are administered back to the subject. In some cases, HSC/PCs containing modifications of the BCL11A enhancer region are expanded before injection. In other aspects, genetically modified HSC/PCs are administered to a subject as part of a bone marrow transplant, wherein the HSC/PCs engraft, differentiate and mature in vivo. In some embodiments, HSC/PCs are isolated from a subject following G-CSF-induced mobilization, plerixafor-induced mobilization, and combinations of G-CSF and plerixafor-induced mobilization, and in others, the cells are isolated from human bone marrow or human umbilical cords . In some aspects, the subject is subjected to a mild myeloablative procedure prior to receiving a graft containing the modified HSC/PC, while in other aspects, the subject is subjected to an intense myeloablative regimen. In some embodiments, the methods and compositions of this invention are used to treat or prevent hemoglobinopathies. In some aspects, the hemoglobinopathy is thalassemia. In some aspects, the hemoglobinopathy is beta thalassemia, while in other aspects, the hemoglobinopathy is sickle cell anemia.

В некоторых вариантах осуществления HSC/PC дополнительно приводят в контакт с донорной молекулой. В некоторых вариантах осуществления донорная молекула доставляется вирусным вектором. Донорная молекула может содержать одну или более последовательностей, кодирующих функциональный полипептид (например, кДНК или его фрагмент), с промотором или без него. Дополнительные последовательности (кодирующие или некодирующие последовательности) могут быть включены, когда донорная молекула используются для инактивации, в том числе, но не ограничиваясь ими, последовательности, кодирующие пептид 2А, сайт SA, IRES и др.In some embodiments, the HSC/PC is further contacted with a donor molecule. In some embodiments, the donor molecule is delivered by a viral vector. The donor molecule may contain one or more sequences encoding a functional polypeptide (eg, cDNA or fragment thereof), with or without a promoter. Additional sequences (coding or non-coding sequences) may be included when the donor molecule is used for inactivation, including, but not limited to, sequences encoding the 2A peptide, SA site, IRES, etc.

В одном аспекте способы и композиции по данному изобретению включают способы приведения в контакт с HSC/PC in vivo. Нуклеазы, ДНК-связывающие белки или комбинация нуклеаз и ДНКсвязывающих белков доставляются в HSC/PC in situ способами, известными в данной области техники. В некоторых вариантах осуществления нуклеазы и/или ДНК-связывающие белки по данному изобретению содержат вирусную частицу, которую вводят нуждающемуся субъекту, тогда как в других нуклеазы, ДНК-связывающие белки или комбинация нуклеаз и ДНК-связывающих белков содержат наночастицу (например, липосому). В некоторых вариантах осуществления вирусные частицы, наночастицы или комбинация вирусных частиц и наночастиц доставляются в орган (например, костный мозг), в котором находятся HSC/PC.In one aspect, the methods and compositions of this invention include methods of contacting HSC/PC in vivo. Nucleases, DNA-binding proteins, or a combination of nucleases and DNA-binding proteins are delivered to HSC/PC in situ by methods known in the art. In some embodiments, the nucleases and/or DNA-binding proteins of the present invention comprise a viral particle that is administered to a subject in need, while in others, the nucleases, DNA-binding proteins, or a combination of nucleases and DNA-binding proteins comprise a nanoparticle (eg, a liposome). In some embodiments, viral particles, nanoparticles, or a combination of viral particles and nanoparticles are delivered to the organ (eg, bone marrow) in which the HSC/PC resides.

В другом аспекте описанном в данном документе описаны способы интеграции донорной нуклеиновой кислоты в геном клетки посредством механизмов независимых от гомологии. Указанные способы включают создание двуцепочеченого разрыва (DSB) в геноме клетки и разрезание донорной молекулы с использованием нуклеазы, как описано в данном документе, так что донорная нуклеиновая кислота интегрируется в сайт DSB. В некоторых вариантах осуществления донорная нуклеиновая кислота интегрируется посредством способов независящих от гомологии (например, NHEJ). Как отмечено выше, после разрезания in vivo донорные последовательности могут быть целенаправленно интегрированы в геном клетки в месте расположения DSB. Донорная последовательность может включать один или более одиIn another aspect described herein, methods are described for integrating a donor nucleic acid into the genome of a cell through homology-independent mechanisms. These methods involve creating a double-strand break (DSB) in the genome of a cell and cutting the donor molecule using a nuclease as described herein so that the donor nucleic acid is integrated into the DSB site. In some embodiments, the donor nucleic acid is integrated through homology-independent methods (eg, NHEJ). As noted above, after cutting in vivo, donor sequences can be specifically integrated into the cell genome at the location of the DSB. The donor sequence may include one or more

- 7 045868 наковых сайтов-мишеней для одной или большего количества нуклеаз, используемых для создания DSB. Таким образом, донорная последовательность может быть разрезана одной или более одинаковыми нуклеазами, используемыми для разрезания эндогенного гена, в который желательна интеграция. В некоторых вариантах осуществления донорная последовательность включает сайты-мишени нуклеазы, отличных от нуклеаз, используемых для индукции DSB. DSB в геноме клетки-мишени могут быть созданы по любому механизму. В некоторых вариантах осуществления DSB создается одной или более нуклеазами цинковых пальцев (ZFN), слитыми белками, содержащими домен связывания цинковых пальцев, который сконструирован для связывания последовательности в пределах области представляющей интерес, и доменом разрезания или полудоменом разрезания.- 7 045868 unique target sites for one or more nucleases used to create DSBs. Thus, the donor sequence can be cut by one or more of the same nucleases used to cut the endogenous gene into which integration is desired. In some embodiments, the donor sequence includes nuclease target sites other than the nucleases used to induce DSBs. DSBs in the target cell genome can be created by any mechanism. In some embodiments, the DSB is created by one or more zinc finger nucleases (ZFNs), fusion proteins containing a zinc finger binding domain that is designed to bind a sequence within the region of interest, and a cutting domain or cutting half-domain.

В одном аспекте донор может кодировать представляющий интерес регуляторный белок (например, TF ZFP, TF TALE или TF CRISPR/Cas), который связывается с, модулирует экспрессию или как связывается, так и модулирует экспрессию представляющего интерес гена. В одном варианте осуществления указанные регуляторные белки связываются с последовательностью ДНК и предотвращают связывание других регуляторных факторов. В другом варианте осуществления связывание регуляторного белка может модулировать (т.е. индуцировать или репрессировать) экспрессию ДНК-мишени.In one aspect, the donor may encode a regulatory protein of interest (eg, a ZFP TF, a TALE TF, or a CRISPR/Cas TF) that binds to, modulates the expression of, or both binds to and modulates the expression of a gene of interest. In one embodiment, said regulatory proteins bind to a DNA sequence and prevent the binding of other regulatory factors. In another embodiment, binding of a regulatory protein may modulate (ie, induce or repress) the expression of a target DNA.

В некоторых вариантах осуществления трансгенная HSC/PC клетка, трансгенное животное или комбинация трансгенных HSC/PC клетки и животного включает трансген, который кодирует ген человека. В некоторых случаях трансгенное животное содержит нокаут в эндогенном локусе и замену эндогенного гена его человеческим аналогом, что позволяет разработать систему in vivo, где человеческий белок можно изучать изолированно. Такие трансгенные модели могут быть использованы для целей скрининга, чтобы идентифицировать малые молекулы или большие биомолекулы или другие объекты, которые могут взаимодействовать с или модифицировать человеческий белок представляющий интерес. В некоторых аспектах трансген интегрируется в выбранный локус (например, безопасную геномную гавань (safe-harbor)) в стволовую клетку (например, эмбриональную стволовую клетку, индуцированную плюрипотентную стволовую клетку, гемопоэтическую стволовую клетку и т.д.) или эмбрион животного, полученный путем любого из методов, описанных в данном документе, и затем эмбрион имплантируется таким образом, что рождается живое животное. Затем животное доводится до половой зрелости и ему дают возможность произвести потомство, причем, по меньшей мере, некоторые из потомков содержат отредактированную последовательность эндогенного гена или интегрированный трансген.In some embodiments, the transgenic HSC/PC cell, transgenic animal, or combination of transgenic HSC/PC cell and animal includes a transgene that encodes a human gene. In some cases, the transgenic animal contains a knockout at an endogenous locus and replacement of the endogenous gene with its human counterpart, allowing the development of an in vivo system where the human protein can be studied in isolation. Such transgenic models can be used for screening purposes to identify small molecules or large biomolecules or other entities that may interact with or modify a human protein of interest. In some aspects, the transgene is integrated at a selected locus (e.g., genomic safe-harbor) into a stem cell (e.g., embryonic stem cell, induced pluripotent stem cell, hematopoietic stem cell, etc.) or an animal embryo obtained by any of the methods described herein, and then the embryo is implanted so that a live animal is born. The animal is then brought to sexual maturity and allowed to produce offspring, at least some of the offspring containing an edited endogenous gene sequence or an integrated transgene.

В другом аспекте в данном документе представлен способ изменения экспрессии гена (например, BCL11A, гена глобина и комбинаций BCL11A и гена глобина) в клетке, включающий: введение в клетку одной или большего количества нуклеаз описанных в данном документе (показаны в табл. 1), в условиях, когда один или более белков экспрессируются и экспрессия гена изменяется. В некоторых вариантах осуществления экспрессия гена глобина (например, гамма-глобина или бета-глобина) изменяется (например, увеличивается). Любой из способов, описанных в данном документе, может дополнительно включать в себя интеграцию донорной последовательности (например, трансгена или его фрагмента под контролем экзогенного или эндогенного промотора) в геном клетки, например, интегрирование донора в или вблизи сайта разрезания нуклеазой в гене BCL11A. Донорную последовательность вводят в клетку с использованием вирусного вектора, как олигонуклеотид, на плазмиде, и комбинации одного или более методов, выбранных из использования вирусного вектора, как олигонуклеотид, или на плазмиде. Клетка, в которой экспрессия генов изменена может быть, например, предшественником красных кровяных клеток (эритроцитов, RBC), гемопоэтических стволовых клеток (например, CD34+ клеток), а также комбинации клеток -предшественников эритроцитов и гемопоэтических стволовых клеток.In another aspect, provided herein is a method of altering the expression of a gene (e.g., BCL11A, a globin gene, and combinations of BCL11A and a globin gene) in a cell, comprising: introducing into the cell one or more of the nucleases described herein (shown in Table 1), in conditions where one or more proteins are expressed and gene expression is altered. In some embodiments, the expression of a globin gene (eg, gamma globin or beta globin) is altered (eg, increased). Any of the methods described herein may further include integrating a donor sequence (e.g., a transgene or fragment thereof under the control of an exogenous or endogenous promoter) into the genome of the cell, for example, integrating the donor at or near a nuclease cleavage site in the BCL11A gene. The donor sequence is introduced into the cell using a viral vector, as an oligonucleotide, on a plasmid, and a combination of one or more methods selected from using a viral vector, as an oligonucleotide, or on a plasmid. The cell in which gene expression is altered may be, for example, a red blood cell progenitor (RBC), a hematopoietic stem cell (eg, a CD34+ cell), or a combination of red blood cell progenitor cells and hematopoietic stem cells.

В других вариантах осуществления в данном документе представлен способ получения генетически модифицированной клетки, содержащей геномную модификацию в эндогенной последовательности энхансера BCL11A (модификацию нуклеотидной последовательности энхансера BCL11A), причем способ включает стадии: а) приведения в контакт клетки с полинуклеотидом (например, ДНК или мРНК), кодирующим нуклеазу цинкового пальца, содержащую 4, 5 или 6 доменов цинкового пальца, в которой каждый из доменов цинкового пальца содержит область спирали распознавания в порядке, показанном в одной строке табл. 1; b) подвергание клетки условиям, способствующим экспрессии белка цинкового пальца из полинуклеотида; и с) модифицирование эндогенной энхансерной последовательности BCL11A экспрессированным белком цинкового пальца, достаточное для получения генетически модифицированной клетки. В некоторых вариантах осуществления клетки стимулируют по меньшей мере одним цитокином (например, перед стадией (а)). Полинуклеотид может приводиться в контакт с клеткой с использованием любого подходящего способа, включая, но не ограничиваясь этим, посредством трансфекции, с использованием невирусного вектора, с использованием вирусного вектора, с использованием химических средств или путем воздействия электрического поля (например, электропорацией).In other embodiments, provided herein is a method of producing a genetically modified cell comprising a genomic modification in an endogenous BCL11A enhancer sequence (BCL11A enhancer nucleotide sequence modification), the method comprising the steps of: a) contacting the cell with a polynucleotide (e.g., DNA or mRNA) , encoding a zinc finger nuclease containing 4, 5 or 6 zinc finger domains, in which each of the zinc finger domains contains a recognition helix region in the order shown in one row of the table. 1; b) exposing the cell to conditions conducive to expression of the zinc finger protein from the polynucleotide; and c) modifying the endogenous BCL11A enhancer sequence with the expressed zinc finger protein sufficient to produce a genetically modified cell. In some embodiments, the cells are stimulated with at least one cytokine (eg, prior to step (a)). The polynucleotide can be brought into contact with a cell using any suitable method, including, but not limited to, through transfection, using a non-viral vector, using a viral vector, using chemical means, or by applying an electric field (eg, electroporation).

Также предлагаются клетки, содержащие одну или комбинацию геномных модификаций, описанных в данном документе, включая клетки, происходящие от клеток, полученных способами, описанными в данном документе.Also provided are cells containing one or a combination of the genomic modifications described herein, including cells derived from cells obtained by the methods described herein.

Также предложен способ лечения пациента, нуждающегося в повышении экспрессии гена глобина, включающий введение пациенту фармацевтического препарата, причем фармацевтический препарат соAlso proposed is a method of treating a patient in need of increased expression of the globin gene, comprising administering to the patient a pharmaceutical drug, wherein the pharmaceutical drug with

- 8 045868 держит генетически модифицированные клетки, белки, полинуклеотиды и комбинации одного или большего количества выбранного из генетически модифицированных клеток, белков и полинуклеотидов, как описано в данном документе, в количестве, достаточном для увеличения экспрессии гена глобина у пациента. В определенных вариантах осуществления известно, что пациент имеет диагноз, подозревается в наличии или подвержен риску развития талассемии или серповидноклеточной анемии.- 8 045868 contains genetically modified cells, proteins, polynucleotides and combinations of one or more selected from genetically modified cells, proteins and polynucleotides, as described herein, in an amount sufficient to increase globin gene expression in a patient. In certain embodiments, the patient is known to have been diagnosed with, suspected of having, or at risk of developing thalassemia or sickle cell disease.

Также предлагается набор, содержащий нуклеиновые кислоты, белки, генетически модифицированные клетки и комбинации одного или большего количества выбранного из нуклеиновых кислот, белков и генетически модифицированных клеток по данному изобретению. Набор может включать нуклеиновые кислоты кодирующие нуклеазы (например, молекулы РНК или гены, кодирующие ZFN, TALEN или систему CRISPR/Cas, содержащиеся в подходящем векторе экспрессии), аликвоты нуклеазных белков, донорные молекулы, подходящие модификаторы самообновления стволовых клеток (стволовости), клетки, буферы, инструкции (например, для осуществления способов по данному изобретению) и тому подобное, включая различные комбинации этих компонентов набора. Изобретение включает, но не ограничивается ими, генетически модифицированную клетку (например, стволовую клетку, такую как гемопоэтическая (CD34+) стволовая клетка или клетка- предшественник эритроцитов), содержащую по меньшей мере одну геномную модификацию, сделанную нуклеазой (например, как показано в одном ряду табл. 1), причем геномная модификация находится в эндогенной энхансерной последовательности BCL11A, и причем, кроме того, геномная модификация выбрана из группы, состоящей из вставок, делеций и их комбинаций, и содержит модификацию в, вблизи или между любой из SEQ ID NO: 1 и SEQ ID NO: 2. В некоторых вариантах осуществления клетка представляет собой генетически модифицированную дифференцированную клетку, происходящую из стволовой клетки, как описано в данном документе (например, RBC, происходящую из гемопоэтической стволовой клетки или клетки-предшественника RBC).Also provided is a kit containing nucleic acids, proteins, genetically modified cells, and combinations of one or more selected from the nucleic acids, proteins, and genetically modified cells of this invention. The kit may include nucleic acid encoding nucleases (for example, RNA molecules or genes encoding ZFN, TALEN or the CRISPR/Cas system contained in a suitable expression vector), aliquots of nuclease proteins, donor molecules, suitable modifiers of stem cell self-renewal (stemness), cells, buffers, instructions (eg, for carrying out the methods of this invention), and the like, including various combinations of these kit components. The invention includes, but is not limited to, a genetically modified cell (e.g., a stem cell such as a hematopoietic (CD34+) stem cell or red blood cell progenitor cell) containing at least one genomic modification made by a nuclease (e.g., as shown in one row Table 1), wherein the genomic modification is located in the endogenous BCL11A enhancer sequence, and wherein, in addition, the genomic modification is selected from the group consisting of insertions, deletions, and combinations thereof, and contains a modification at, near, or between any of SEQ ID NO: 1 and SEQ ID NO: 2. In some embodiments, the cell is a genetically modified differentiated cell derived from a stem cell as described herein (eg, an RBC derived from a hematopoietic stem cell or an RBC progenitor cell).

Нуклеаза может содержать по меньшей мере одну нуклеазу цинкового пальца (ZFN) (например, как показано в табл. 1), по меньшей мере один TALEN и комбинации по меньшей мере одного ZFN и по меньшей мере одного TALEN. Указанная нуклеаза(ы) может быть введена в клетку в виде белка, как полинуклеотид, кодирующий нуклеазу(ы), или в виде комбинации белковой формы и полинуклеотида кодирующего нуклеазу(ы). В определенных вариантах осуществления геномная модификация включает инсерцию (вставку), которая включает в себя интеграцию донорного полинуклеотида кодирующего трансген. Также предложены фармацевтические композиции, содержащие одну или более генетически модифицированных клеток, как описано в данном документе.The nuclease may comprise at least one zinc finger nuclease (ZFN) (eg, as shown in Table 1), at least one TALEN, and combinations of at least one ZFN and at least one TALEN. Said nuclease(s) may be introduced into the cell as a protein, as a polynucleotide encoding the nuclease(s), or as a combination of a protein form and a polynucleotide encoding the nuclease(s). In certain embodiments, the genomic modification includes an insertion that includes the integration of a donor polynucleotide encoding the transgene. Also provided are pharmaceutical compositions containing one or more genetically modified cells, as described herein.

Также предложен ДНК-связывающий белок, содержащий белок цинкового пальца, содержащий 4, 5 или 6 доменов цинкового пальца, содержащих область спирали распознавания, причем белок цинкового пальца содержит области спирали распознавания в порядке, показанном в одном ряду табл. 1. Также предложен белок TALE, содержащий множество повторов, которые связываются с последовательностью, содержащей часть (например, по меньшей мере, 4, 5, 6 или более) пар оснований сайтов-мишеней, показанных в табл. 1. Слитый белок, содержащий белок цинкового пальца или белок TALE, как описано в данном документе, и домен разрезания дикого типа или сконструированный или полудомен разрезания, также предлагаются, как и полинуклеотиды, кодирующие белки (ZFP, TALE, ZFN, TALEN), описанные в данном документе. Также предусмотрены клетки (например, изолированные стволовые клетки, такие как гематопоэтические (CD34+) стволовые клетки), содержащие один или более полинуклеотидов, белков и комбинаций полинуклеотидов и белков, как описано в данном документе. Также предложены наборы, содержащие один или более белков, полинуклеотидов, клеток или их комбинаций, как описано в данном документе.Also provided is a DNA binding protein comprising a zinc finger protein comprising 4, 5 or 6 zinc finger domains containing a recognition helix region, the zinc finger protein containing recognition helix regions in the order shown in one row of the table. 1. Also provided is a TALE protein containing multiple repeats that bind to a sequence comprising a portion (eg, at least 4, 5, 6 or more) of the target site base pairs shown in Table 1. 1. A fusion protein comprising a zinc finger protein or a TALE protein as described herein and a wild-type or engineered or half-cutting domain is also provided, as are the protein-encoding polynucleotides (ZFP, TALE, ZFN, TALEN) described in this document. Also provided are cells (eg, isolated stem cells, such as hematopoietic (CD34+) stem cells) containing one or more polynucleotides, proteins, and combinations of polynucleotides and proteins, as described herein. Also provided are kits containing one or more proteins, polynucleotides, cells, or combinations thereof, as described herein.

Также описан способ изменения экспрессии гена глобина в клетке (например, клеткепредшественнике эритроцитов, гемопоэтической стволовой клетке и комбинаций клеткипредшественника эритроцитов и гемопоэтической стволовой клетки), включающий: введение в клетку одного или более полинуклеотидов, кодирующих одну или более нуклеаз, как описано в данном документе, в условиях, при которых один или более белков экспрессируются, а экспрессия гена глобина (например, гамма-глобина, бета-глобина и комбинаций гамма-и бета-глобина) изменяется (например, увеличивается). В некоторых вариантах осуществления способы дополнительно включают в себя интеграцию донорной последовательности в геном клетки, например, с использованием вирусного вектора, в качестве олигонуклеотида или на плазмиде. Указанная донорная последовательность может содержать трансген под контролем эндогенного или экзогенного промотора.Also described is a method for altering the expression of a globin gene in a cell (e.g., an erythrocyte progenitor cell, a hematopoietic stem cell, and combinations of an erythrocyte progenitor cell and a hematopoietic stem cell), comprising: introducing into the cell one or more polynucleotides encoding one or more nucleases as described herein, under conditions in which one or more proteins are expressed and the expression of a globin gene (eg, gamma globin, beta globin, and combinations of gamma and beta globin) is altered (eg, increased). In some embodiments, the methods further include integrating the donor sequence into the genome of the cell, for example, using a viral vector, as an oligonucleotide, or on a plasmid. Said donor sequence may contain a transgene under the control of an endogenous or exogenous promoter.

Также предложен способ получения генетически модифицированной клетки, содержащей геномную модификацию в эндогенной энхансерной последовательности BCL11A (например, сайте-мишени, как показано в табл. 1), причем способ включает стадии: (а) приведение в контакт клетки с полинуклеотидом кодирующим слитый белок, содержащий нуклеазу цинкового пальца, содержащую 4, 5 или 6 доменов цинкового пальца, в которой каждый из доменов цинкового пальца содержит область спирали распознавания в порядке, показанном в одном ряду табл. 1; (b) подвергание клетки условиям, способствующим экспрессии слитого белка из полинуклеотида; и (с) модифицирование эндогенной энхансерной последовательности BCL11A экспрессированным слитым белком, достаточное для получения генетичеAlso proposed is a method for producing a genetically modified cell containing a genomic modification in the endogenous enhancer sequence of BCL11A (for example, the target site, as shown in Table 1), the method comprising the steps of: (a) bringing the cell into contact with a polynucleotide encoding a fusion protein containing a zinc finger nuclease containing 4, 5 or 6 zinc finger domains, in which each of the zinc finger domains contains a recognition helix region in the order shown in one row of the table. 1; (b) exposing the cell to conditions conducive to expression of the fusion protein from the polynucleotide; and (c) modification of the endogenous BCL11A enhancer sequence by the expressed fusion protein sufficient to produce a genetic

- 9 045868 ски модифицированной клетки. В определенных вариантах осуществления способ дополнительно включает стимуляцию клеток по меньшей мере одним цитокином. Полинуклеотид(ы) может быть доставлен внутрь клетки, например, с использованием невирусной системы доставки, вирусной системы доставки, доставляющего носителя и комбинаций, выбранных из невирусной системы доставки, вирусной системы доставки и доставляющего носителя и может включать воздействие на клетки электрическим полем или использование разрушения клеточной мембраны в качестве механизма доставки (так называемая технология сжатия, см., например, Sharei et al. (2015) PLOS ONE doi: 10.1371/joumal/pone. 0118803).- 9 045868 ski modified cell. In certain embodiments, the method further includes stimulating the cells with at least one cytokine. The polynucleotide(s) may be delivered into a cell, for example, using a non-viral delivery system, a viral delivery system, a delivery vehicle, and combinations selected from a non-viral delivery system, a viral delivery system, and a delivery vehicle, and may involve exposing the cells to an electric field or using disruption cell membrane as a delivery mechanism (so-called compression technology, see e.g. Sharei et al. (2015) PLOS ONE doi: 10.1371/joumal/pone. 0118803).

Способы лечения пациента, нуждающегося в повышении экспрессии гена глобина (например, известно, что пациент имеет диагноз, подозревается в наличии или подвержен риску развития гемоглобинопатии, такой как талассемия (например, β-талассемия) или серповидноклеточная анемия также предусмотрены, при этом способ включает введение пациенту фармацевтической композиции, как описано в данном документе (например, белков, полинуклеотидов, клеток или комбинации, выбранной из белков, полинуклеотидов и клеток) в количестве, достаточном для увеличения экспрессии гена глобина у пациента.Methods of treating a patient in need of increasing globin gene expression (e.g., the patient is known to have, is suspected of having, or is at risk for developing a hemoglobinopathy such as thalassemia (e.g., β-thalassemia) or sickle cell disease are also provided, the method comprising administering to the patient a pharmaceutical composition as described herein (eg, proteins, polynucleotides, cells, or a combination selected from proteins, polynucleotides and cells) in an amount sufficient to increase globin gene expression in the patient.

Эти и другие аспекты будут очевидны для опытного специалиста в свете раскрытия в целом.These and other aspects will be apparent to one of ordinary skill in the art in light of the disclosure as a whole.

Краткое описание графических материаловBrief description of graphic materials

Фиг. 1А и 1В представляют собой схемы, изображающие обзор анализа сайта интеграции олигонуклеотидного дуплекса. На фиг. 1 изображена первая стадия анализа, в которой клетки обрабатывают ZFN в присутствии дополнительной олигонуклеотидной дуплексной ДНК, которая захватывается во фракцию результирующих явлений разрезания. На фиг. 1В продемонстрирована следующая стадия, на которой клетки культивируют в течение семи дней, выделяют геномную ДНК и сегменты генома, фланкирующие сайты интеграции донора, амплифицируют с помощью ПЦР, опосредованной адаптером, с использованием праймера для интегрированного олигонуклеотидного дуплекса. Затем ампликоны сиквенируют для выявления потенциальных сайтов разрезания.Fig. 1A and 1B are diagrams depicting an overview of the analysis of the integration site of an oligonucleotide duplex. In fig. 1 depicts the first step of the assay, in which cells are treated with ZFN in the presence of additional oligonucleotide duplex DNA, which is captured in the resulting cutting event fraction. In fig. 1B shows the next step in which cells are cultured for seven days, genomic DNA is isolated, and genomic segments flanking the donor integration sites are amplified by adapter-mediated PCR using an integrated oligonucleotide duplex primer. The amplicons are then sequenced to identify potential cutting sites.

На фиг. 2 изображено расположение 455 потенциальных локусов вне мишени, идентифицированных с помощью анализа сайта интеграции олигонуклеотидного дуплекса с использованием исходной 51857/51949 или родительской пары ZFN. Лучшие 63 локуса выделены серым цветом и были проанализированы в последующих анализах. Каждый локус может быть идентифицирован по хромосоме и номеру основания, указывающему наиболее вероятное местоположение разрезания, а также указывает количество интегрантов, обнаруженных в этом локусе.In fig. Figure 2 depicts the location of 455 potential off-target loci identified by oligonucleotide duplex integration site analysis using the parent 51857/51949 or parent ZFN pair. The top 63 loci are highlighted in gray and were analyzed in subsequent analyses. Each locus can be identified by a chromosome and base number indicating the most likely location of the cut and also indicating the number of integrants found at that locus.

На фиг. 3А-3С представлены иллюстративные фосфат-контактные остатки, внутри каркаса цинкового пальца. На фиг. 3А изображено взаимодействие цинкового пальца с молекулой ДНК и изображено расположение боковой цепи аргинина дикого типа и как она взаимодействует с фосфатным остовом молекулы ДНК. На фиг. 3В (SEQ ID NO: 7-17) представлены типичные последовательности ZFN, показывающие, где этот аргинин расположен в первичной последовательности каждого цинкового пальца (вертикальный ряд остатков 'R', обозначенный жирной стрелкой), а также выделены те аргинины, которые были замещены глютамином в остове ZFP, чтобы устранить соответствующий фосфатный контакт (индивидуально помеченные 'R' остатки). Последовательности также показывают области спирали распознавания (где остатки от -1 до +3, +5 и + 6 обведены прямоугольником и затенены), а также часть линкера между С-терминальным доменом цинкового пальца и доменом разрезания (домен разрезания не изображен). На фиг. 3С дополнительно изображено пространственное расположение другой боковой цепи лизина, потенциально контактирующей с остовом, присутствующей в домене разрезания FokI, которая во время оптимизации специфичности может быть заменена серином.In fig. 3A-3C show exemplary phosphate contact moieties within a zinc finger framework. In fig. Figure 3A depicts the interaction of a zinc finger with a DNA molecule and depicts the location of the wild-type arginine side chain and how it interacts with the phosphate backbone of the DNA molecule. In fig. 3B (SEQ ID NO: 7-17) shows representative ZFN sequences showing where this arginine is located in the primary sequence of each zinc finger (vertical row of 'R' residues indicated by a thick arrow), and also highlights those arginines that have been replaced by glutamine in the ZFP backbone to eliminate the corresponding phosphate contact (individually labeled 'R' residues). The sequences also show the recognition helix regions (where residues −1 to +3, +5, and +6 are boxed and shaded), as well as part of the linker between the C-terminal zinc finger domain and the cutting domain (the cutting domain is not shown). In fig. 3C further depicts the spatial arrangement of another potentially backbone-contacting lysine side chain present in the FokI cutting domain, which may be replaced by a serine during specificity optimization.

Фиг. 4 представляет собой график, сравнивающий уровни модификации посредством обработки CD34 клеток либо исходной парой 51857/51949, либо оптимизированной парой 63014/65722 в различных тестируемых локусах. Внизу или по оси х показаны локусы, идентифицированные как потенциальные мишени разрезания, с процентным значением инделов для каждой области (сайта), показанной на вертикальной оси или оси Y. Обратите внимание, что ось Y показана в логарифмическом масштабе. Темносерые столбцы показывают локусы, расщепленные парой 51857/51949, и количество обнаруженного разрезания, в то время как светлосерые столбцы - представляют локусы, расщепленные оптимизированной парой, где почти все измеренное разрезание находится в целевой последовательности BCL11a.Fig. 4 is a graph comparing the levels of modification by treating CD34 cells with either the original 51857/51949 pair or the optimized 63014/65722 pair at the various loci tested. The bottom or x-axis shows the loci identified as potential cutting targets, with the percentage of indels for each region (site) shown on the vertical or y-axis. Note that the y-axis is shown on a logarithmic scale. Dark gray bars represent loci cleaved by the 51857/51949 pair and the amount of cutting detected, while light gray bars represent loci cleaved by the optimized pair, where almost all of the measured cutting is in the BCL11a target sequence.

Фиг. 5А и 5В представляют собой графики, изображающие относительные соотношения мРНК глобина произведенной в hCD34+ клетках после обработки специфичными для BCL11A ZFN и эритроидной дифференцировки. CD34+ клетки, полученные от двух здоровых доноров-людей (PB-MR-003 или PBMR-004), обрабатывали или не обрабатывали парой ZFN, а затем анализировали экспрессию α, β и γ глобина. Наилучшим методом определения количества мРНК γ-глобина, обнаруживаемого после обработки ZFN, является выражение изменения экспрессии либо в виде отношения γ-глобина к β-глобину (фиг. 5А), либо мРНК γ-глобина к α-глобина (фиг. 5В).Fig. 5A and 5B are graphs depicting the relative ratios of globin mRNA produced in hCD34+ cells after treatment with BCL11A-specific ZFN and erythroid differentiation. CD34+ cells obtained from two healthy human donors (PB-MR-003 or PBMR-004) were treated or not with the ZFN pair and then analyzed for α, β and γ globin expression. The best method for determining the amount of γ-globin mRNA detected after ZFN treatment is to express the change in expression as either the ratio of γ-globin to β-globin (Fig. 5A) or γ-globin to α-globin mRNA (Fig. 5B).

Фиг. 6 представляет собой график, изображающий относительные количества белка γ-глобина, продуцируемого в обработанных CD34+ клетках. Как и выше, использовали две серии CD34+ клеток, полученных от здоровых доноров-людей (PB-MR-003 и PB-MR-004). В этом эксперименте приблизительно 3Fig. 6 is a graph depicting the relative amounts of γ-globin protein produced in treated CD34+ cells. As above, two sets of CD34+ cells obtained from healthy human donors (PB-MR-003 and PB-MR-004) were used. In this experiment approximately 3

- 10 045868- 10 045868

4-кратное повышение процентного содержания белка глобина плода до уровней около 15-20% наблюдалось в эритроидном потомстве HSPC при 63014/65722-опосредованном разрушении энхансера BCL11A в обеих партиях доноров.A 4-fold increase in the percentage of fetal globin protein to levels of about 15-20% was observed in HSPC erythroid progeny upon 63014/65722-mediated disruption of the BCL11A enhancer in both donor batches.

Фиг. 7 представляет собой график, показывающий относительный человеческий химеризм у мышей, которым трансплантированы партии обработанных 63014/65722 доноров (+ ZFN), как описано выше. Человеческий химеризм измеряли путем детектирования клеток, несущих маркер hCD45 на их поверхности с помощью FACS. Показано процентное содержание hCD4 5+ клеток человека в периферической крови, собранной через 8 или 12 недель после трансплантации. Данные показали хорошие уровни приживления в этом исследовании со сравнимым человеческим химеризмом после приживления нетрансфицированного контроля ((-)) и HSPC, трансфицированных ZFN (+ZFN). Незаполненные круги и треугольники представляют отдельных животных.Fig. 7 is a graph showing relative human chimerism in mice transplanted with lots of 63014/65722 treated donors (+ZFN) as described above. Human chimerism was measured by detecting cells carrying the hCD45 marker on their surface using FACS. The percentage of human hCD4 5+ cells in peripheral blood collected 8 or 12 weeks after transplantation is shown. The data showed good engraftment levels in this study, with comparable human chimerism following engraftment of untransfected control ((-)) and ZFN-transfected HSPCs (+ZFN). Open circles and triangles represent individual animals.

На фиг. 8 изображен процент химерности, обнаруженный в костном мозге привитых мышей, у которых клетки человека были идентифицированы по присутствию hCD45 на их клеточной поверхности. Образцы анализировали через 12 недель после приживления.In fig. Figure 8 depicts the percentage of chimera found in the bone marrow of engrafted mice in which human cells were identified by the presence of hCD45 on their cell surface. Samples were analyzed 12 weeks after engraftment.

Фиг. 9A-9D представляют собой графики, изображающие восстановление различных гематопоэтических линий клеток, протестированных FACS-анализом клеток костного мозга у привитых мышей, полученных на 12 неделе, антителами, распознающими маркеры клеточной поверхности, специфичные для определенных популяций. Данные показали сравнимое присутствие всех проанализированных гематопоэтических линий человека в костном мозге на 12-й неделе после инъекции в потомстве CD34+ клеткок (14/22) обработанных BCLHA-специфической мРНК ZFN и нетрансфицированных клетках ((-)). Показаны данные по лимфоидным, миелоидным, эритроидным клеткам и HSPC (фиг. 9A-9D, соответственно) для клеток, полученных от обоих доноров (003 и 004). Данные показали сравнимое представление всех проанализированных гематопоэтических линий человека в костном мозге на 12-й неделе после инъекции в потомстве клеток CD34+, обработанных мРНК ZFN BCL11A, и потомстве нетрансфицированных клеток.Fig. 9A-9D are graphs depicting the recovery of various hematopoietic cell lines tested by FACS analysis of bone marrow cells in mice inoculated at week 12 with antibodies recognizing cell surface markers specific to certain populations. Data showed comparable presence of all human hematopoietic lineages analyzed in the bone marrow at week 12 post-injection in progeny CD34+ cells (14/22) treated with BCLHA-specific ZFN mRNA and untransfected cells ((-)). Lymphoid, myeloid, erythroid and HSPC data are shown (Figures 9A-9D, respectively) for cells obtained from both donors (003 and 004). Data showed comparable representation of all human hematopoietic lineages analyzed in the bone marrow at week 12 postinjection in progeny of CD34+ cells treated with ZFN BCL11A mRNA and progeny of untransfected cells.

Фиг. 10 представляет собой график, показывающий уровень модификации гена на мишени BCL11A в ДНК, выделенной из периферической крови модифицированных мышей, проанализированной методом глубокого сиквенирования. Данные приведены для введенных клеток (через 2 дня после трансфекции ZFN (+)), а затем для клеток крови через 8 или 12 недель после приживления и продемонстрировали хорошее сохранение модификации гена. Нетрансфицированные клетки обозначены (-) в строке Обработка.Fig. 10 is a graph showing the level of gene modification at the BCL11A target in DNA isolated from the peripheral blood of modified mice analyzed by deep sequencing. Data are shown for introduced cells (2 days after ZFN(+) transfection) and then for blood cells 8 or 12 weeks after engraftment and demonstrated good retention of the gene modification. Untransfected cells are indicated (-) in the Treatment line.

Фиг. 11 представляет собой график, показывающий количество модификации гена на мишени BCL11A для образцов клеток костного мозга после приживления ZFN-обработанных клеток (+). Необработанные клетки обозначены (-) в строке Обработка. Сопоставимая модификация наблюдалась как в BCL11А-зависимых линиях (В-клетки, экспрессирующие маркер CD19; примитивные предшественники, экспрессирующие CD45 и высокие уровни CD38), так и в BCLHA-независимых (миелоидных) линиях. Хотя уровни генной модификации при вводе были выше в образце донора PB-MR-003, чем в образце донора PB-MR-004, клетки полученные из PB-MR-004 повторяемо демонстрировали более высокие уровни модификации, т.е. лучшее сохранение модификации у мышей, чем полученные из PB-MR-003.Fig. 11 is a graph showing the amount of gene modification on the BCL11A target for bone marrow cell samples after engraftment of ZFN-treated cells (+). Untreated cells are indicated (-) in the Process line. Comparable modification was observed in both BCL11A-dependent lineages (B cells expressing the marker CD19; primitive progenitors expressing CD45 and high levels of CD38) and BCLHA-independent (myeloid) lineages. Although the levels of gene modification upon input were higher in the donor sample PB-MR-003 than in the donor sample PB-MR-004, cells derived from PB-MR-004 repeatedly showed higher levels of modification, i.e. better retention of the modification in mice than those obtained from PB-MR-003.

Фиг. 12 представляет собой график, показывающий количество модификации генов в эритроидных клетках, полученных из клеток костного мозга на 12 неделе после дифференцировки in vitro в течение 14 дней. Данные были получены от мышей, изначально привитых двумя различными донорами, описанными выше, и продемонстрировали, что модификация BCL11A, опосредованная обработкой ZFN (+ ZFN), заметно не изменяется во время дифференцировки эритроида. Клетки, которые не были обработаны ZFN, обозначены как (-) ZFN.Fig. 12 is a graph showing the amount of gene modification in erythroid cells obtained from bone marrow cells at 12 weeks after in vitro differentiation for 14 days. Data were obtained from mice initially inoculated with the two different donors described above and demonstrated that BCL11A modification mediated by ZFN (+ ZFN) treatment is not markedly altered during erythroid differentiation. Cells that were not treated with ZFN are designated as (−) ZFN.

Фиг. 13А и 13В представляют собой графики, изображающие относительное количество мРНК, кодирующей γ-глобин, где концентрация мРНК γ-глобина изображается либо как отношение мРНК γглобина/β-глобина (фиг. 9А), либо как отношение мРНК γ-глобина/а-глобина (фиг. 9В). Как в нетрансфицированных ((-) ZFN), так и в образцах, обработанных ZFN (+ ZFN), отношения мРНК γ-глобина к β глобину или γ-глобина к α-глобину сильно различались между потомками эритроидных клеток отдельных мышей из одной и той же группы. Однако, несмотря на эту изменчивость и изменчивость, вызванную использованием двух разных доноров-людей, средние значения для обработанных 63014/65722 образцов демонстрируют увеличение уровней мРНК γ-глобина в ~ 1,5-2 раза по сравнению с их соответствующими нетрансфицированными аналогами.Fig. 13A and 13B are graphs depicting the relative amount of mRNA encoding γ-globin, wherein the concentration of γ-globin mRNA is plotted as either the γ-globin mRNA/β-globin ratio (Fig. 9A) or the γ-globin mRNA/α-globin ratio (Fig. 9B). In both untransfected ((-)ZFN) and ZFN-treated (+ZFN) samples, the ratios of γ-globin to β-globin or γ-globin to α-globin mRNA varied greatly between the erythroid cell progeny of individual mice from the same same groups. However, despite this variability and the variability caused by the use of two different human donors, the average values for the 63014/65722-treated samples demonstrate an ~1.5- to 2-fold increase in γ-globin mRNA levels compared to their corresponding untransfected counterparts.

Фиг. 14 представляет собой график, изображающий разницу в количестве белка γ-глобина (выраженную в виде отношения γ-глобин/а-глобин или γ-глобин/общий β-подобный белок) в клетках, полученных из костного мозга от модифицированных мышей, причем клетки костного мозга подвергались протоколу дифференцировки in vitro. Уровни белка измеряли через 16 дней после начала дифференцировки. Были определены отношения гамма (γ) глобина (сумма пиков Agamma и Ggamma) к альфа (α) глобину, a также гамма глобин (сумма пиков Agamma и Ggamma)/относительно соотношений бетаподобного глобина (сумма пиков Agamma, Ggamma, бета и дельта-глобинов). Согласуясь со слабойFig. 14 is a graph depicting the difference in the amount of γ-globin protein (expressed as the ratio γ-globin/α-globin or γ-globin/total β-like protein) in cells obtained from bone marrow from engineered mice, wherein the bone marrow cells brains were subjected to an in vitro differentiation protocol. Protein levels were measured 16 days after the onset of differentiation. The ratios of gamma (γ) globin (sum of Agamma and Ggamma peaks) to alpha (α) globin, as well as gamma globin (sum of Agamma and Ggamma peaks)/beta-like globin ratios (sum of Agamma, Ggamma, beta and delta globin peaks) were determined ). Consistent with the weak

- 11 045868 эритроидной дифференцировкой образцов, полученных из PB-MR-003, уровни гамма-глобина в нетрансфицированных клетках, полученных от этого донора, были очень высокими (~30%), и поэтому обработка ZFN (+ ZFN) приводила к увеличению уровня гамма-глобина только в 1,2 раза по сравнению с необработанными клетками ((-) ZFN). PB-MR-004 демонстрировал более типичные нетрансфицированные уровни (~ 9%) и показывал ~ 2-кратное увеличение уровней белка гамма-глобина после 12недельной циркуляции через тело мыши.- 11 045868 erythroid differentiation of samples derived from PB-MR-003, gamma globin levels in untransfected cells obtained from this donor were very high (~30%), and therefore ZFN (+ ZFN) treatment resulted in an increase in gamma levels -globin only 1.2 times compared to untreated cells ((-) ZFN). PB-MR-004 exhibited more typical untransfected levels (~9%) and showed a ~2-fold increase in gamma globin protein levels after 12 weeks of circulation through the mouse body.

Подробное описание сущности изобретенияDetailed description of the invention

Здесь раскрыты композиции и способы для геномной инженерии для модуляции экспрессии BCL11A, гамма-глобина и комбинаций BLC11A и гамма-глобина, а также для лечения, профилактики или лечения и профилактики гемоглобинопатии. В частности, посредством воздействия с использованием нуклеаз, содержащих ZFP, имеющих области спирали узнавания, как показано в одном ряду табл. 1, разрушение энхансера BCL11A эффективно достигается в HSC/PC и приводит к изменению относительной экспрессии гамма-глобина во время последующего эритропоэза. Эта модуляция экспрессии BCL11A и гамма-глобина особенно полезна для лечения гемоглобинопатий (например, бета-талассемии, серповидноклеточной анемии), при которых наблюдается недостаточная экспрессия бета-глобина или экспрессия мутированной формы бета-глобина. При использовании способов и композиций по данному изобретению осложнения и последствия, связанные с заболеванием, вызываемые аберрантным количеством бета-глобина, можно преодолеть путем изменения экспрессии гамма-глобина в клеткахпредшественниках эритроцитов.Disclosed herein are compositions and methods for genome engineering to modulate the expression of BCL11A, gamma globin, and combinations of BLC11A and gamma globin, and for the treatment, prevention, or treatment and prevention of hemoglobinopathies. In particular, through exposure using nucleases containing ZFP having recognition helix regions, as shown in one row of the table. 1, disruption of the BCL11A enhancer is efficiently achieved in HSC/PC and results in changes in the relative expression of gamma globin during subsequent erythropoiesis. This modulation of BCL11A and gamma globin expression is particularly useful for the treatment of hemoglobinopathies (eg, beta thalassemia, sickle cell disease) in which there is insufficient expression of beta globin or expression of a mutated form of beta globin. When using the methods and compositions of this invention, complications and disease-related consequences caused by aberrant amounts of beta globin can be overcome by altering the expression of gamma globin in red blood cell progenitor cells.

Общее описаниеgeneral description

Практикование способов, а также приготовление и использование композиций, раскрытых в данном документе, используют, если не указано иное, обычные методы молекулярной биологии, биохимии, структуры и анализа хроматина, вычислительной химии, клеточных культур, рекомбинантных ДНК и смежных областей, которые находятся в пределах навыков в данной облачти техники. Эти методы полностью объяснены в литературе, см. например, Sambrook et alMOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 и третье издание, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 и периодические переиздания; серию METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, третье издание, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, Chromatin (P. M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; и METHODS IN MOLECULAR BIOLOGY, Vol. 119, Chromatin Protocols (P. B. Becker, ed.) Humana Press, Totowa, 1999.The practice of the methods and the preparation and use of the compositions disclosed herein utilize, unless otherwise indicated, conventional techniques of molecular biology, biochemistry, chromatin structure and analysis, computational chemistry, cell culture, recombinant DNA and related fields that are within skills in this cloud of technology. These methods are fully explained in the literature, see for example Sambrook et alMOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic reprints; METHODS IN ENZYMOLOGY series, Academic Press, San Diego; Wolffe, CHROMATIC STRUCTURE AND FUNCTION, third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, Chromatin (P. M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; and METHODS IN MOLECULAR BIOLOGY, Vol. 119, Chromatin Protocols (P. B. Becker, ed.) Humana Press, Totowa, 1999.

ОпределенияDefinitions

Термины нуклеиновая кислота, полинуклеотид и олигонуклеотид используются взаимозаменяемо и относятся к дезоксирибонуклеотидному или рибонуклеотидному полимеру в линейной или кольцевой конформации и в одноцепочечной или двухцепочечной форме. Для целей данного раскрытия эти термины не должны рассматриваться как ограничивающие по отношению к длине полимера. Указанные термины могут включать известные аналоги природных нуклеотидов, а также нуклеотиды, которые модифицированы по фрагменту основания, сахарному, фосфатному фрагментам (например, фосфоротиоатным остовам) и комбинациям, выбранным из фрагмента основания, сахарного и фосфатного фрагментов. Как правило, аналог конкретного нуклеотида имеет такую же специфичность спаривания с другим основанием; т.е. аналог А будет парой основания Т.The terms nucleic acid, polynucleotide and oligonucleotide are used interchangeably and refer to a deoxyribonucleotide or ribonucleotide polymer in a linear or circular conformation and in single-stranded or double-stranded form. For the purposes of this disclosure, these terms should not be construed as limiting with respect to the length of the polymer. These terms may include known analogues of natural nucleotides, as well as nucleotides that are modified with a base moiety, sugar moiety, phosphate moiety (eg, phosphorothioate backbone), and combinations selected from base moiety, sugar moiety, and phosphate moiety. Typically, an analogue of a particular nucleotide has the same pairing specificity with another base; those. the analogue of A will be the base pair of T.

Термины полипептид, пептид и белок используются взаимозаменяемо для обозначения полимера из аминокислотных остатков. Указанный термин также применяется к аминокислотным полимерам, в которых одна или более аминокислот являются химическими аналогами или модифицированными производными соответствующих встречающихся в природе аминокислот.The terms polypeptide, peptide, and protein are used interchangeably to refer to a polymer of amino acid residues. The term also applies to amino acid polymers in which one or more amino acids are chemical analogues or modified derivatives of the corresponding naturally occurring amino acids.

Связывание относится к сиквенс-специфичной нековалентной взаимосвязи между макромолекулами (например, между белком и нуклеиновой кислотой). Не все компоненты связывающего взаимодействия должны быть сиквенс-специфичными, (например, контакты с фосфатными остатками в остове ДНК), если взаимодействие в целом является сиквенс-специфичным. Такие взаимодействия обычно характеризуются константой диссоциации (Kd), равной 10-6 М-1 или ниже. Сродство относится к силе связывания: повышенная аффинность связывания коррелирует с более низким Kd.Binding refers to the sequence-specific, non-covalent relationship between macromolecules (eg, between a protein and a nucleic acid). Not all components of a binding interaction need to be sequence specific (eg contacts with phosphate residues on the DNA backbone) if the interaction as a whole is sequence specific. Such interactions are typically characterized by a dissociation constant (K d ) of 10 -6 M -1 or lower. Affinity refers to the strength of binding: increased binding affinity correlates with lower Kd .

Связывающий белок - это белок, который способен связываться с другой молекулой. Связывающий белок может связываться, например, с молекулой ДНК (ДНК-связывающий белок), молекулой РНК (РНК-связывающий белок), белковой молекулой (белок-связывающий белок) или может связываться с комбинацией молекул, выбранных из молекулы ДНК, молекулы РНК или белка. В случае белоксвязывающего белка, он может связываться с самим собой (с образованием гомодимеров, гомотримеров и т.д.), он может связываться с одной или более молекулами другого белка или белков или он может связываться как с самим собой, так и с одной или более молекул другого белка или белков. Связывающий белок может иметь более одного типа связывающей активности. Например, белки цинкового пальца обладают ДНК-связывающей, РНК-связывающей и белок-связывающей активностью.A binding protein is a protein that is capable of binding to another molecule. The binding protein may bind, for example, a DNA molecule (DNA-binding protein), an RNA molecule (RNA-binding protein), a protein molecule (protein-binding protein), or may bind to a combination of molecules selected from a DNA molecule, an RNA molecule, or a protein. . In the case of a protein-binding protein, it may bind to itself (to form homodimers, homotrimers, etc.), it may bind to one or more molecules of another protein or proteins, or it may bind to both itself and one or more more molecules of another protein or proteins. A binding protein may have more than one type of binding activity. For example, zinc finger proteins have DNA-binding, RNA-binding, and protein-binding activities.

- 12 045868- 12 045868

ДНК-связывающий белок цинкового пальца (или связывающий домен) представляет собой белок или домен в более крупном белке, который связывает ДНК сиквенс-специфичным образом через один или более цинковых пальцев, которые являются областями аминокислотной последовательности в пределах связывающего домена, структура которого стабилизируется за счет координации иона цинка. Термин ДНК-связывающий белок цинкового пальца часто сокращается как белок цинкового пальца или ZFP.A zinc finger DNA-binding protein (or binding domain) is a protein or domain within a larger protein that binds DNA in a sequence-specific manner through one or more zinc fingers, which are regions of amino acid sequence within the binding domain whose structure is stabilized by coordination of zinc ion. The term zinc finger DNA binding protein is often abbreviated as zinc finger protein or ZFP.

ДНК-связывающий домен TALE или TALE представляет собой полипептид, содержащий один или более доменов/единиц повтора TALE. Домены повторов участвуют в связывании TALE с узнаваемой им последовательностью ДНК-мишени. Одна единица повтора (также называемая повтор) обычно имеет длину 33-35 аминокислот и проявляет, по меньшей мере, некоторую гомологию последовательности с другими последовательностями повторов TALE в пределах встречающегося в природе белка TALE.A TALE DNA-binding domain or TALE is a polypeptide containing one or more TALE repeat domains/units. Repeat domains are involved in the binding of TALE to its recognized target DNA sequence. A single repeat unit (also called a repeat) is typically 33-35 amino acids in length and exhibits at least some sequence homology to other TALE repeat sequences within a naturally occurring TALE protein.

Связывающие домены цинкового пальца и TALE могут быть сконструированы для связывания с заранее определенной нуклеотидной последовательностью, например, путем конструирования (изменения одной или большего количества аминокислот) области спирали распознавания встречающегося в природе цинкового пальца или белка TALE. Следовательно, сконструированные ДНК-связывающие белки (цинковые пальцы или TALE) - это белки, которые не встречаются в природе. Неограничивающими примерами способов конструирования ДНК-связывающих белков являются дизайн и отбор. Разработанный ДНК-связывающий белок - это белок, не встречающийся в природе, дизайн/состав которого главным образом вытекает из рациональных критериев. Рациональные критерии для проектирования включают применение правил замещения и компьютеризированных алгоритмов для обработки информации в базе данных, хранящей информацию о существующих конструкциях ZFP и/или TALE и данные по связыванию. См, например, патенты США № 6140081; 6453242; 6534261 и 8585526; см. также публикации РСТ № WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 и WO 03/016496.The zinc finger and TALE binding domains can be designed to bind to a predetermined nucleotide sequence, for example, by engineering (altering one or more amino acids) the recognition helix region of a naturally occurring zinc finger or TALE protein. Therefore, engineered DNA-binding proteins (zinc fingers or TALEs) are proteins that do not occur in nature. Non-limiting examples of methods for constructing DNA-binding proteins include design and selection. An engineered DNA binding protein is a protein not found in nature, the design/composition of which is primarily derived from rational criteria. Rational criteria for design include the application of substitution rules and computerized algorithms to process information in a database storing information about existing ZFP and/or TALE designs and binding data. See, for example, US Pat. No. 6,140,081; 6453242; 6534261 and 8585526; see also PCT publication No. WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 and WO 03/016496.

Отобранный белок цинкового пальца или TALE - это белок, не встречающийся в природе, производство которого происходит в следствие эмпирического процесса, такого как фаговый дисплей, ловушка взаимодействия или гибридный отбор. См., например, патенты США № 5789538; 5925523; 6007988; 6013453; 6200759; 8586526; публикации РСТ № WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970, WO 01/88197, WO 02/099084.A selected zinc finger protein, or TALE, is a non-naturally occurring protein whose production occurs as a consequence of an empirical process such as phage display, trap interaction, or hybrid selection. See, for example, US Pat. No. 5,789,538; 5925523; 6007988; 6013453; 6200759; 8586526; PCT Publication No. WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970, WO 01/88197, WO 02/099084.

TtAgo - прокариотический белок Аргонавт (Argonaute), который, как полагают, участвует в выключении генов. TtAgo происходит из бактерии Thermus thermophilus. См., например, Swarts et al. там же, G. Sheng et al. (2013) Proc. Natl. Acad. Sci. USA 111, 652). А система TtAgo представляет собой все необходимые компоненты, в том числе, например, направляющие ДНК для разрезания с помощью фермента TtAgo.TtAgo is a prokaryotic Argonaute protein that is believed to be involved in gene silencing. TtAgo comes from the bacterium Thermus thermophilus. See, for example, Swarts et al. ibid., G. Sheng et al. (2013) Proc. Natl. Acad. Sci. USA 111, 652). And the TtAgo system contains all the necessary components, including, for example, DNA guides for cutting using the TtAgo enzyme.

Рекомбинация относится к процессу обмена генетической информацией между двумя полинуклеотидами, включая, но не ограничиваясь этим, захват донора негомологичным присоединением концов (NHEJ - non-homologous end joining) и гомологичную рекомбинацию. В целях данного раскрытия термин гомологичная рекомбинация (HR) относится к специализированной форме такого обмена, который имеет место, например, во время репарации двухцепочечных разрывов в клетках с помощью механизмов репарации, направляемых гомолгией. Этот процесс требует гомологии нуклеотидных последовательностей, использует донорную молекулу для матричного репарации целевой молекулы (т.е. той, которая подверглась двухцепочечному разрыву) и по-разному известен как некроссоверная конверсия гена (non-crossover gene conversion) или короткоцепочечная конверсия гена (short tract gene conversion), потому что это приводит к передаче генетической информации от донора к мишени. Не желая быть связанными какой-либо конкретной теорией, такой перенос может включать коррекцию несоответствия гетеродуплексной ДНК, которая образуется между поврежденной мишенью и донором, синтез-зависимый отжиг цепи, при котором донор используется для повторного синтеза генетической информации, которая станет частью мишени, связанные процессы или комбинацию вышеуказанного. Такая специализированная HR часто приводит к изменению последовательности молекулы-мишени таким образом, что часть или вся последовательность донорного полинуклеотида включается в полинуклеотид-мишень.Recombination refers to the process of exchange of genetic information between two polynucleotides, including, but not limited to, non-homologous end joining (NHEJ) capture and homologous recombination. For purposes of this disclosure, the term homologous recombination (HR) refers to a specialized form of such exchange that occurs, for example, during the repair of double-strand breaks in cells using homology-driven repair mechanisms. This process requires nucleotide sequence homology, uses a donor molecule to template repair the target molecule (i.e., the one that has undergone a double-strand break), and is variously known as non-crossover gene conversion or short tract gene conversion) because it results in the transfer of genetic information from the donor to the target. Without wishing to be bound by any particular theory, such transfer may involve correction of heteroduplex DNA mismatch that is formed between the damaged target and the donor, synthesis-dependent strand annealing in which the donor is used to resynthesize genetic information that will become part of the target, related processes or a combination of the above. Such specialized HR often results in a change in the sequence of the target molecule such that part or all of the sequence of the donor polynucleotide is included in the target polynucleotide.

В способах по настоящему изобретению одна или более нацеленных нуклеаз, как описано в данном документе, создают двухцепочечный разрыв (DSB) в последовательности-мишени (например, клеточном хроматине) в заранее определенном сайте. DSB может приводить к инделам с помощью механизмов гомологичной репарации, или негомологичной репарации. Делеции могут включать любое количество пар оснований. Аналогично, вставки могут включать любое количество пар оснований, включая, например, интеграцию донорного полинуклеотида, необязательно имеющего гомологию с нуклеотидной последовательностью в области разрыва. Донорная последовательность может быть физически интегрирована или, альтернативно, донорный полинуклеотид используется в качестве матрицы для репарации разрыва посредством гомологичной рекомбинации, что приводит к введению всей или части нуклеотидной последовательности, как у донора, в клеточный хроматин. Таким образом, первая последовательность в клеточном хроматине может быть изменена и, в определенных вариантах осуществления, может быть преобразована в последовательность, присутствующую в донорном полинуклеотиде. Таким образом, использование терминов заменить или замена может пониматься как замена одной нуклеотиднойIn the methods of the present invention, one or more targeting nucleases, as described herein, create a double-strand break (DSB) in a target sequence (eg, cellular chromatin) at a predetermined site. DSBs can lead to indels through either homologous repair or nonhomologous repair mechanisms. Deletions can include any number of base pairs. Likewise, insertions may include any number of base pairs, including, for example, the integration of a donor polynucleotide, optionally having homology to the nucleotide sequence in the region of the break. The donor sequence may be physically integrated or, alternatively, the donor polynucleotide is used as a template to repair the break through homologous recombination, resulting in the introduction of all or part of the nucleotide sequence as that of the donor into cellular chromatin. Thus, the first sequence in the cellular chromatin can be altered and, in certain embodiments, can be converted to a sequence present in the donor polynucleotide. Thus, the use of the terms replace or replacement can be understood as the replacement of one nucleotide

- 13 045868 последовательности другой (т.е. замена последовательности в информационном смысле) и необязательно требует физической или химической замены одного полинуклеотида другим.- 13 045868 sequence of another (i.e., replacement of a sequence in an informational sense) and does not necessarily require physical or chemical replacement of one polynucleotide by another.

В любом из способов, описанных в данном документе, дополнительные пары белков цинкового пальца или TALEN могут использоваться для дополнительного двухцепочечного разрезания дополнительных сайтов-мишеней в клетке.In any of the methods described herein, additional pairs of zinc finger proteins or TALENs can be used for additional double-stranded cutting of additional target sites in the cell.

Любой из способов, описанных в данном документе, можно использовать для введения донора любого размера или для частичной или полной инактивации одной или большего количества последовательностей-мишеней в клетке путем направленной интеграции донорной последовательности, которая нарушает экспрессию гена(ов) представляющего интерес. Также предложены клеточные линии с частично или полностью инактивированными генами.Any of the methods described herein can be used to introduce a donor of any size or to partially or completely inactivate one or more target sequences in a cell by targeted integration of a donor sequence that disrupts the expression of the gene(s) of interest. Cell lines with partially or completely inactivated genes are also proposed.

В любом из способов, описанных в данном документе, экзогенная нуклеотидная последовательность (донорная последовательность или трансген) может содержать последовательности, которые гомологичны, но не идентичны геномным последовательностям в области представляющей интерес, тем самым стимулируя гомологичную рекомбинацию для вставки неидентичной последовательности в область представляющую интерес. Таким образом, в определенных вариантах осуществления части донорной последовательности, которые гомологичны последовательностям в области представляющей интерес, демонстрируют от около 80 до 99% (или любое целое число между ними) идентичности последовательности с заменяемой геномной последовательностью. В других вариантах гомология между донорной и геномной последовательностями является выше 99%, например, если только 1 нуклеотид отличается между донорной и геномной последовательностями на 100 смежных пар оснований. В некоторых случаях негомологичная часть донорной последовательности может содержать последовательности, отсутствующие в области представляющей интерес, так что новые последовательности вводятся в область представляющую интерес. В этих случаях негомологичная последовательность обычно фланкируется последовательностями из 50-1000 пар оснований (или любым интегральным значением между ними) или любым числом пар оснований, превышающим 1000, которые гомологичны или идентичны последовательностям в области представляющей интерес. В других вариантах осуществления донорная последовательность является негомологичной первой последовательности и встраивается в геном с помощью механизмов негомологичной рекомбинации.In any of the methods described herein, the exogenous nucleotide sequence (donor sequence or transgene) may contain sequences that are homologous but not identical to genomic sequences in the region of interest, thereby promoting homologous recombination to insert a non-identical sequence into the region of interest. Thus, in certain embodiments, portions of the donor sequence that are homologous to sequences in the region of interest exhibit from about 80 to 99% (or any integer therebetween) sequence identity with the genomic sequence being replaced. In other embodiments, the homology between the donor and genomic sequences is greater than 99%, for example, if only 1 nucleotide differs between the donor and genomic sequences per 100 contiguous base pairs. In some cases, a non-homologous portion of the donor sequence may contain sequences not present in the region of interest, so that new sequences are introduced into the region of interest. In these cases, the nonhomologous sequence is typically flanked by sequences of 50-1000 base pairs (or any integral value in between) or any number of base pairs in excess of 1000 that are homologous or identical to sequences in the region of interest. In other embodiments, the donor sequence is non-homologous to the first sequence and is inserted into the genome through non-homologous recombination mechanisms.

Разрезание относится к разрушению ковалентного остова молекулы ДНК. Разрезание может быть инициировано различными способами, в том числе, но не ограничиваясь ими, ферментативным или химическим гидролизом фосфодиэфирной связи. Возможны как одноцепочечное разрезание, так и двухцепочечное разрезание, и двухцепочечное разрезание может происходить в результате двух различных одноцепочечных явлений разрезания. Разрезание ДНК может привести к образованию либо тупых концов, либо липких концов. В определенных вариантах осуществления слитые полипептиды используются для целевого разрезания двухцепочечной ДНК.Cutting refers to the destruction of the covalent backbone of the DNA molecule. Cutting can be initiated in a variety of ways, including, but not limited to, enzymatic or chemical hydrolysis of the phosphodiester bond. Both single-strand cutting and double-strand cutting are possible, and double-strand cutting can occur as a result of two different single-strand cutting phenomena. Cutting DNA can result in either blunt ends or sticky ends. In certain embodiments, fusion polypeptides are used to specifically cut double-stranded DNA.

Полудомен разрезания представляет собой полипептидную последовательность, которая в сочетании со вторым полипептидом (одинаковым или различным) образует комплекс, обладающий активностью разрезания (предпочтительно активностью двухцепочечного разрезания). Термины первый и второй полудомены разрезания, + и - полудомены разрезания и правый и левый полудомены разрезания используются взаимозаменяемо для обозначения пар полудоменов разрезания, которые димеризуются.A cutting half-domain is a polypeptide sequence that, when combined with a second polypeptide (either the same or different), forms a complex having cutting activity (preferably double-strand cutting activity). The terms first and second cutting half-domains, + and - cutting half-domains, and right and left cutting half-domains are used interchangeably to refer to pairs of cutting half-domains that dimerize.

Сконструированный полудомен разрезания представляет собой полудомен разрезания, который был модифицирован таким образом, чтобы образовывать облигатные гетеродимеры с другим полудоменом разрезания (например, другим сконструированным полудоменом разрезания). См. также патенты США №№ 7888121; 7914796; 8034598; 8623618 и патентную публикацию США № 2011/0201055, полностью включенные в данный документ посредством ссылки.An engineered cutting half-domain is a cutting half-domain that has been modified to form obligate heterodimers with another cutting half-domain (eg, another engineered cutting half-domain). See also US Pat. Nos. 7,888,121; 7914796; 8034598; 8623618 and US Patent Publication No. 2011/0201055, incorporated herein by reference in their entirety.

Термин последовательность относится к нуклеотидной последовательности любой длины, которая может представлять собой ДНК или РНК; может быть линейной, циркулярной или разветвленной и может быть как одноцепочечной, так и двухцепочечной. Термин донорная последовательность относится к нуклеотидной последовательности, которая вставлена в геном. Донорная последовательность может иметь любую длину, например, от 2 до 100000000 нуклеотидов в длину (или любое целочисленное значение между ними или выше), предпочтительно от примерно 100 до 100000 нуклеотидов в длину (или любое целое число между ними), более предпочтительно между примерно 2000 и 20000 нуклеотидов в длину (или любое значение между ними) и даже более предпочтительно между примерно 5 и 15 т. п.н. (или любое значение между ними).The term sequence refers to a nucleotide sequence of any length, which may be DNA or RNA; can be linear, circular or branched and can be either single-stranded or double-stranded. The term donor sequence refers to a nucleotide sequence that is inserted into the genome. The donor sequence may be of any length, for example, from 2 to 100,000,000 nucleotides in length (or any integer value in between or greater), preferably from about 100 to 100,000 nucleotides in length (or any integer value in between), more preferably between about 2000 and 20,000 nucleotides in length (or anything in between) and even more preferably between about 5 and 15 kb. (or any value in between).

Хроматин - это нуклеопротеиновая структура, составляющая клеточный геном. Клеточный хроматин содержит нуклеиновую кислоту, главным образом ДНК, и белок, включая гистоны и негистоновые хромосомные белки. Большая часть эукариотического клеточного хроматина существует в форме нуклеосом, где ядро нуклеосомы содержит приблизительно 150 пар оснований ДНК, связанных с октамером, содержащим два из каждого из гистонов Н2А, Н2В, Н3 и Н4; и линкерная ДНК (переменной длины в зависимости от организма) проходит между ядрами нуклеосом. Молекула гистона H1 обычно связана с линкерной ДНК. Для целей данного раскрытия термин хроматин предназначен для охвата всех типов клеточных нуклеопротеинов, как прокариотических, так и эукариотических. Клеточный хроматин вклюChromatin is a nucleoprotein structure that makes up the cell genome. Cellular chromatin contains nucleic acid, mainly DNA, and protein, including histones and non-histone chromosomal proteins. Most eukaryotic cellular chromatin exists in the form of nucleosomes, where the nucleosome core contains approximately 150 base pairs of DNA associated with an octamer containing two each of histones H2A, H2B, H3 and H4; and linker DNA (of variable length depending on the organism) runs between the nucleosome cores. The histone H1 molecule is usually associated with linker DNA. For purposes of this disclosure, the term chromatin is intended to cover all types of cellular nucleoproteins, both prokaryotic and eukaryotic. Cell chromatin turn on

- 14 045868 чает как хромосомный, так и эписомальный хроматин.- 14 045868 looks at both chromosomal and episomal chromatin.

Хромосома представляет собой комплекс хроматина, содержащий весь или часть генома клетки. Геном клетки часто характеризуется ее кариотипом, который представляет собой совокупность всех хромосом, составляющих геном клетки. Г еном клетки может содержать одну или более хромосом.A chromosome is a complex of chromatin containing all or part of a cell's genome. A cell's genome is often characterized by its karyotype, which is the collection of all the chromosomes that make up the cell's genome. The genome of a cell may contain one or more chromosomes.

Эписомой является реплицирующаяся нуклеиновая кислота, комплекс нуклеопротеинов или другая структура, включающая нуклеиновую кислоту, которая не является частью хромосомного кариотипа клетки. Примеры эписом включают плазмиды и некоторые вирусные геномы.An episome is a replicating nucleic acid, nucleoprotein complex, or other structure comprising a nucleic acid that is not part of the cell's chromosomal karyotype. Examples of episomes include plasmids and some viral genomes.

Доступная область представляет собой сайт в клеточном хроматине, в котором целевой сайт, присутствующий в нуклеиновой кислоте, может быть связан экзогенной молекулой, которая распознает указанный целевой сайт. Не желая быть связанными какой-либо конкретной теорией, полагают, что доступной областью является та, которая не упакована в нуклеосомную структуру. Отличительную структуру доступной области часто можно обнаружить по ее чувствительности к химическим и ферментативным зондам, например, к нуклеазам.An accessible region is a site in cellular chromatin at which a target site present in a nucleic acid can be bound by an exogenous molecule that recognizes the target site. Without wishing to be bound by any particular theory, it is believed that an accessible region is one that is not packaged into a nucleosomal structure. The distinctive structure of an accessible region can often be detected by its sensitivity to chemical and enzymatic probes, such as nucleases.

Сайт-мишень или последовательность-мишень представляет собой последовательность нуклеиновой кислоты, которая определяет часть нуклеиновой кислоты, с которой связывается молекула, при условии наличия достаточных условий для связывания.A target site or target sequence is a nucleic acid sequence that specifies the portion of the nucleic acid to which a molecule binds, given sufficient conditions for binding.

Экзогенная молекула представляет собой молекулу, которая обычно не присутствует в клетке, но может быть введена в клетку одним или более генетическими, биохимическими или другими методами. Присутствие в клетке в норме определяется с учетом конкретной стадии развития и условий окружающей среды клетки. Так, например, молекула, которая присутствует только во время эмбрионального развития мышц, является экзогенной молекулой по отношению к мышечной клетке взрослого человека. Аналогично, молекула, индуцированная тепловым шоком, является экзогенной молекулой по отношению к клетке, не подвергшейся тепловому шоку. Экзогенная молекула может содержать, например, функционирующую версию неправильно функционирующей эндогенной молекулы или неправильно функционирующую версию нормально функционирующей эндогенной молекулы.An exogenous molecule is a molecule that is not normally present in a cell, but can be introduced into the cell by one or more genetic, biochemical or other methods. Presence in a cell is normally determined taking into account the specific developmental stage and environmental conditions of the cell. Thus, for example, a molecule that is present only during embryonic muscle development is an exogenous molecule to the adult muscle cell. Likewise, a heat shock-induced molecule is an exogenous molecule to a cell that has not undergone heat shock. An exogenous molecule may contain, for example, a malfunctioning version of a malfunctioning endogenous molecule or a malfunctioning version of a normally functioning endogenous molecule.

Экзогенной молекулой может быть, среди прочего, малая молекула, такая как генерируемая комбинаторным химическим процессом, или макромолекула, такая как белок, нуклеиновая кислота, углевод, липид, гликопротеин, липопротеин, полисахарид, любое модифицированное производное вышеуказанных молекул или любой комплекс, включающий одну или более вышеуказанных молекул. Нуклеиновые кислоты включают ДНК и РНК, могут быть одноцепочечными или двухцепочечными; могут быть линейными, разветвленными или циркулярными; и могут быть любой длины. Нуклеиновые кислоты включают те, которые способны образовывать дуплексы, а также триплексообразующие нуклеиновые кислоты. См., например, патенты США №№ 5176996 и 5422251. Белки включают, но не ограничиваются ими, ДНК-связывающие белки, факторы транскрипции, факторы ремоделирования хроматина, белки связывающие метилированную ДНК, полимеразы, метилазы, деметилазы, ацетилазы, деацетилазы, киназы, фосфатазы, интегразы, рекомбиназы, лигазы, топоизомеразы, гиразы и геликазы.An exogenous molecule may be, but is not limited to, a small molecule, such as one generated by a combinatorial chemical process, or a macromolecule, such as a protein, nucleic acid, carbohydrate, lipid, glycoprotein, lipoprotein, polysaccharide, any modified derivative of the foregoing molecules, or any complex comprising one or more of the above molecules. Nucleic acids include DNA and RNA and can be single-stranded or double-stranded; can be linear, branched or circular; and can be of any length. Nucleic acids include those capable of forming duplexes as well as triplex-forming nucleic acids. See, for example, US Patent Nos. 5,176,996 and 5,422,251. Proteins include, but are not limited to, DNA binding proteins, transcription factors, chromatin remodeling factors, methylated DNA binding proteins, polymerases, methylases, demethylases, acetylases, deacetylases, kinases, phosphatases, integrases, recombinases, ligases, topoisomerases, gyrases and helicases.

Экзогенная молекула может представлять собой молекулу того же типа, что и эндогенная молекула, например, экзогенный белок или нуклеиновую кислоту. Например, экзогенная нуклеиновая кислота может содержать заражающий вирусный геном, плазмиду или эписому, введенную в клетку, или хромосому, которая в норме не присутствует в клетке. Способы введения экзогенных молекул в клетки известны специалистам в данной области и включают, но не ограничиваются ими, перенос опосредованный липидами (т.е. липосомы, включая нейтральные и катионные липиды), электропорацию, прямую инъекцию, слияние клеток, бомбардировку частицами, копреципитацию с фосфатом кальция, DEAE-декстранопосредованный перенос и перенос опосредованный вирусным вектором. Экзогенная молекула также может быть тем же самый типом молекулы, что и эндогенная молекула, но быть получена из вида отличного от вида, к которому принадлежит клетка. Например, последовательность нуклеиновой кислоты человека может быть введена в клеточную линию, первоначально полученную от мыши или хомяка.The exogenous molecule may be the same type of molecule as the endogenous molecule, such as an exogenous protein or nucleic acid. For example, the exogenous nucleic acid may contain an infecting viral genome, a plasmid or episome introduced into a cell, or a chromosome that is not normally present in the cell. Methods for introducing exogenous molecules into cells are known to those skilled in the art and include, but are not limited to, lipid-mediated transfer (i.e., liposomes, including neutral and cationic lipids), electroporation, direct injection, cell fusion, particle bombardment, phosphate coprecipitation calcium, DEAE-dextran-mediated transfer and viral vector-mediated transfer. An exogenous molecule may also be the same type of molecule as an endogenous molecule, but be derived from a species different from the species to which the cell belongs. For example, a human nucleic acid sequence may be introduced into a cell line originally derived from a mouse or hamster.

Напротив, эндогенная молекула - это молекула, которая обычно присутствует в конкретной клетке на определенной стадии развития в определенных условиях окружающей среды.In contrast, an endogenous molecule is a molecule that is normally present in a specific cell at a specific stage of development under specific environmental conditions.

Например, эндогенная нуклеиновая кислота может содержать хромосому, геном митохондрии, хлоропласта или другой органеллы или природную эписомальную нуклеиновую кислоту. Дополнительные эндогенные молекулы могут включать белки, например, факторы транскрипции и ферменты.For example, the endogenous nucleic acid may comprise a chromosome, the genome of a mitochondria, chloroplast or other organelle, or a naturally occurring episomal nucleic acid. Additional endogenous molecules may include proteins such as transcription factors and enzymes.

Используемый в данном документе термин продукт экзогенной нуклеиновой кислоты включает как полинуклеотидные, так и полипептидные продукты, например, продукты транскрипции (полинуклеотиды, такие как РНК) и продукты трансляции (полипептиды).As used herein, the term exogenous nucleic acid product includes both polynucleotide and polypeptide products, for example, transcription products (polynucleotides such as RNA) and translation products (polypeptides).

Слитая молекула представляет собой молекулу, в которой две или более молекул субъединиц связаны, предпочтительно ковалентно. Молекулы субъединиц могут представлять собой молекулы одного и того же химического типа или могут представлять собой молекулы разных химических типов. Примеры первого типа слитой молекулы включают, но не ограничиваются ими, слитые белки (например, слияние между ДНК-связывающим доменом ZFP или TALE и одним или более активационными доменами) и слитые нуклеиновые кислоты (например, нуклеиновые кислоты, кодирующие белок слияния, описанный выше). Примеры слитой молекулы второго типа включают, но не ограничиваются ими, слияние междуA fusion molecule is a molecule in which two or more subunit molecules are linked, preferably covalently. The subunit molecules may be molecules of the same chemical type or may be molecules of different chemical types. Examples of the first type of fusion molecule include, but are not limited to, fusion proteins (e.g., a fusion between a ZFP or TALE DNA binding domain and one or more activation domains) and nucleic acid fusions (e.g., nucleic acids encoding a fusion protein described above) . Examples of the second type of fusion molecule include, but are not limited to, a fusion between

- 15 045868 нуклеиновой кислотой, образующей триплекс, и полипептидом, и слияние связующего малой бороздки и нуклеиновой кислоты.- 15 045868 triplex-forming nucleic acid and polypeptide, and fusion of the minor groove binder and the nucleic acid.

Экспрессия слитого белка в клетке может быть результатом доставки слитого белка в клетку или доставки полинуклеотида, кодирующего слитый белок, в клетку, причем полинуклеотид транскрибируется, а транскрипт транслируется для генерации слитого белка. Транссплайсинг, разрезание полипептида и лигирование полипептида также могут участвовать в экспрессии белка в клетке. Способы доставки полинуклеотидов и полипептидов в клетки представлены в других частях данного описания.Expression of the fusion protein in a cell may result from delivery of the fusion protein into the cell or delivery of a polynucleotide encoding the fusion protein into the cell, wherein the polynucleotide is transcribed and the transcript is translated to generate the fusion protein. Transsplicing, polypeptide cutting, and polypeptide ligation may also be involved in protein expression in the cell. Methods for delivering polynucleotides and polypeptides into cells are presented elsewhere in this specification.

Ген для целей данного раскрытия включает область ДНК, кодирующую продукт гена (см. ниже), а также все области ДНК, которые регулируют продукцию продукта гена, независимо от того, являются ли такие регуляторные последовательности близлежащими к кодирующим последовательностям, транскрибируемым последовательностям и комбинации кодирующих и транскрибируемых последовательностей. Соответственно, ген включает, но не ограничивается ими, промоторные последовательности, терминаторы, трансляционные регуляторные последовательности, такие как сайты связывания рибосомы и внутренние сайты входа в рибосому, энхансеры, сайленсеры, инсуляторы, граничные элементы, точки начала репликации, сайты присоединения к матриксу и области контроля локуса.A gene, for purposes of this disclosure, includes the region of DNA encoding the gene product (see below), as well as all regions of DNA that regulate the production of the gene product, whether such regulatory sequences are adjacent to coding sequences, transcribed sequences, and combinations of coding and transcribed sequences. Accordingly, a gene includes, but is not limited to, promoter sequences, terminators, translational regulatory sequences such as ribosome binding sites and internal ribosome entry sites, enhancers, silencers, insulators, boundary elements, origins of replication, matrix attachment sites and regions locus control.

Экспрессия гена относится к преобразованию информации, содержащейся в гене, в продукт гена. Продукт гена может быть прямым продуктом транскрипции гена (например, мРНК, тРНК, рРНК, антисмысловой РНК, микроРНК, рибозимом, структурной РНК или любым другим типом РНК) или белком, полученным путем трансляции мРНК. Продукты генов также включают РНК, которые модифицированы такими процессами, как кэппирование, полиаденилирование, метилирование и редактирование, и белки, модифицированные, например, метилированием, ацетилированием, фосфорилированием, юбиквитинированием, ДЦФ-рибозилированием, миристилированием и гликозилированием.Gene expression refers to the conversion of information contained in a gene into a gene product. The gene product may be a direct product of gene transcription (e.g., mRNA, tRNA, rRNA, antisense RNA, microRNA, ribozyme, structural RNA, or any other type of RNA) or a protein produced by translation of the mRNA. Gene products also include RNAs, which are modified by processes such as capping, polyadenylation, methylation and editing, and proteins modified, for example, by methylation, acetylation, phosphorylation, ubiquitination, DCP-ribosylation, myristylation and glycosylation.

Модуляция экспрессии гена относится к изменению активности гена. Модуляция экспрессии может включать, но не ограничивается этим, активацию гена и репрессию гена. Редактирование генома (например, разрезание, изменение, инактивация, случайная мутация) может использоваться для модуляции экспрессии. Инактивация гена относится к любому снижению экспрессии гена по сравнению с клеткой, которая не включает ZFP, TALE или систему CRISPR/Cas, как описано в данном документе. Таким образом, инактивация генов может быть частичной или полной.Modulation of gene expression refers to changes in the activity of a gene. Modulation of expression may include, but is not limited to, gene activation and gene repression. Genome editing (eg, cutting, alteration, inactivation, random mutation) can be used to modulate expression. Gene inactivation refers to any decrease in gene expression compared to a cell that does not include ZFP, TALE, or the CRISPR/Cas system as described herein. Thus, gene inactivation can be partial or complete.

Защищенная мРНК представляет собой такую, в которой мРНК каким-то образом изменена для повышения стабильности или трансляции мРНК. Примеры защит включают использование замены до 25% остатков цитидина и уридина 2-тиоуридином (s2U) и 5-метилцитидином (m5C). Результирующая мРНК проявляет меньшую иммуногенность и большую стабильность по сравнению с немодифицированным аналогом (см. Karik0 et al. ((2012), Molecular Therapy, Vol. 16, No. 11, pages 1833-1844). Другие изменения включают добавление так называемого ARCA кэпа, который увеличивает трансляционность мРНК, продуцируемой in vitro (см. патент США № 7074596).Protected mRNA is one in which the mRNA has been altered in some way to improve the stability or translation of the mRNA. Examples of defenses include the use of replacement of up to 25% of cytidine and uridine residues with 2-thiouridine (s2U) and 5-methylcytidine (m5C). The resulting mRNA exhibits less immunogenicity and greater stability compared to the unmodified analog (see Karik0 et al. ((2012), Molecular Therapy, Vol. 16, No. 11, pages 1833-1844). Other changes include the addition of a so-called ARCA cap , which increases the translation of mRNA produced in vitro (see US patent No. 7074596).

Область представляющая интерес представляет собой любую область клеточного хроматина, такую как, например, ген или некодирующую последовательность внутри или рядом с геном, в которой желательно связать экзогенную молекулу. Связывание может быть осуществлено с целью целевого разрезания ДНК, целевой рекомбинации и комбинаций целевого разрезания ДНК и целевой рекомбинации. Область представляющая интерес может присутствовать, например, в хромосоме, эписоме, геноме органеллы (например, митохондриальном, хлоропластном) или в заражающем вирусном геноме. Область представляющая интерес может находиться внутри кодирующей области гена, внутри транскрибируемых некодирующих областей, таких как, например, лидерные последовательности, концевые последовательности или интроны, или внутри нетранскрибированных областей, либо вышерасположенных, либо нижерасположенных по отношению к кодирующей области. Область, представляющая интерес, может быть такой же маленькой, как одна нуклеотидная пара, или длиной до 2000 нуклеотидных пар, или любым целым значением нуклеотидных пар.A region of interest is any region of cellular chromatin, such as, for example, a gene or non-coding sequence within or adjacent to a gene, at which it is desired to bind an exogenous molecule. Linking can be for targeted DNA cutting, targeted recombination, and combinations of targeted DNA cutting and targeted recombination. The region of interest may be present, for example, in a chromosome, an episome, an organelle genome (eg, mitochondrial, chloroplast), or in an infecting viral genome. The region of interest may be within the coding region of a gene, within transcribed non-coding regions, such as, for example, leader sequences, tail sequences or introns, or within non-transcribed regions, either upstream or downstream of the coding region. The region of interest can be as small as one nucleotide pair, or up to 2000 nucleotide pairs long, or any integer value of nucleotide pairs.

Эукариотические клетки включают, но не ограничиваются ими, клетки грибов (таких как дрожжи), клетки растений, клетки животных, клетки млекопитающих и клетки человека (например, Т-клетки).Eukaryotic cells include, but are not limited to, fungal cells (such as yeast), plant cells, animal cells, mammalian cells, and human cells (such as T cells).

Термины функциональная связь и функционально связаны (или оперативно связаны) используются взаимозаменяемо применительно к сопоставлению двух или более компонентов (таких как элементы последовательности), в которых компоненты расположены так, что оба компонента функционируют нормально и допускают возможность того, что по меньшей мере один из компонентов может опосредовать функцию, которая воздействует по меньшей мере на один из других компонентов. В качестве иллюстрации транскрипционная регуляторная последовательность, такая как промотор, функционально связана с кодирующей последовательностью, если транскрипционная регуляторная последовательность контролирует уровень транскрипции кодирующей последовательности в ответ на наличие или отсутствие одного или более транскрипционных регуляторных факторов. Транскрипционная регуляторная последовательность обычно функционально связана в цис-положении с кодирующей последовательностью, но не обязательно должна быть непосредственно смежной с ней. Например, энхансер представляет собой транскрипционную регуляторную последовательность, которая функционально связана с кодирующей последовательностью, даже если они не являются смежными.The terms functionally related and functionally related (or operatively related) are used interchangeably to refer to the mapping of two or more components (such as sequence elements) in which the components are arranged such that both components function normally and allow for the possibility that at least one of the components may mediate a function that affects at least one of the other components. By way of illustration, a transcriptional regulatory sequence, such as a promoter, is operably linked to a coding sequence if the transcriptional regulatory sequence controls the level of transcription of the coding sequence in response to the presence or absence of one or more transcriptional regulatory factors. A transcriptional control sequence is usually operably linked in cis to the coding sequence, but need not be directly adjacent to it. For example, an enhancer is a transcriptional regulatory sequence that is operably linked to a coding sequence even though they are not adjacent.

- 16 045868- 16 045868

Что касается слитых полипептидов, термин функционально связанный может относиться к тому факту, что каждый из компонентов выполняет ту же функцию в связи с другим компонентом, как и если бы они не были связаны таким образом. Например, в отношении слитого полипептида, в котором ДНКсвязывающий домен ZFP, TALE или Cas слит с доменом активации, ДНК-связывающий домен ZFP, TALE или Cas и домен активации находятся в функциональной связи, если в слитом полипептиде ДНКсвязывающий домен ZFP, TALE или Cas способен связывать свой сайт-мишень, свой сайт связывания и комбинаций сайта-мишени и сайта связывания, и в то же время домен активации способен усиливать экспрессию генов. Когда слитый полипептид, в котором ДНК-связывающий домен ZFP, TALE или Cas слит с доменом разрезания, ДНК-связывающий домен ZFP, TALE или Cas и домен разрезания находятся в функциональной связи, если в слитом полипептиде ДНК-связывающий домен ZFP, TALE или Cas способен связывать свой сайт-мишень, свой сайт связывания и комбинации сайта-мишени и сайта связывания, и в тоже время домен разрезания способен расщеплять ДНК в непосредственной близости от сайтамишени.With regard to fusion polypeptides, the term operably linked may refer to the fact that each of the components performs the same function in connection with the other component as if they were not so linked. For example, with respect to a fusion polypeptide in which a ZFP, TALE, or Cas DNA-binding domain is fused to an activation domain, the ZFP, TALE, or Cas DNA-binding domain and the activation domain are in a functional relationship if, in the fusion polypeptide, the ZFP, TALE, or Cas DNA-binding domain is capable of bind its target site, its binding site and combinations of the target site and binding site, and at the same time the activation domain is able to enhance gene expression. When a fusion polypeptide in which a ZFP, TALE, or Cas DNA-binding domain is fused to a cleavage domain, the ZFP, TALE, or Cas DNA-binding domain and the cleavage domain are in a functional relationship if the fusion polypeptide has a ZFP, TALE, or Cas DNA-binding domain is able to bind its target site, its binding site, and combinations of the target site and binding site, and at the same time the cutting domain is able to cleave DNA in close proximity to the target sites.

Функциональный фрагмент белка, полипептида или нуклеиновой кислоты представляет собой белок, полипептид или нуклеиновую кислоту, чья последовательность не идентична полноразмерному белку, полипептиду или нуклеиновой кислоте, но сохраняет ту же функцию, что и полноразмерный белок, полипептид или нуклеиновая кислота. Функциональный фрагмент может содержать больше, меньше или такое же количество остатков, что и соответствующая нативная молекула, может содержать одну или более аминокислотных или нуклеотидных замен и может представлять собой комбинации, содержащие больше, меньше или такое же количество остатков, как и соответствующая нативная молекула и содержащая одну или более аминокислотных или нуклеотидных замен. Методы определения функции нуклеиновой кислоты (например, кодирующей функции, способности гибридизоваться с другой нуклеиновой кислотой) хорошо известны в данной области техники. Точно так же способы определения функции белка хорошо известны. Например, ДНК-связывающая функция полипептида может быть определена, например, с помощью анализов связывания с фильтром, электрофоретической подвижности или иммунопреципитации.A functional fragment of a protein, polypeptide or nucleic acid is a protein, polypeptide or nucleic acid whose sequence is not identical to the full-length protein, polypeptide or nucleic acid, but retains the same function as the full-length protein, polypeptide or nucleic acid. A functional fragment may contain more, fewer, or the same number of residues as the corresponding native molecule, may contain one or more amino acid or nucleotide substitutions, and may be combinations containing more, fewer, or the same number of residues as the corresponding native molecule, and containing one or more amino acid or nucleotide substitutions. Methods for determining the function of a nucleic acid (eg, coding function, ability to hybridize with another nucleic acid) are well known in the art. Likewise, methods for determining protein function are well known. For example, the DNA-binding function of a polypeptide can be determined, for example, using filter binding, electrophoretic mobility, or immunoprecipitation assays.

Разрезание ДНК может быть проанализировано с помощью гель-электрофореза. See Ausubel et al., выше. Способность белка взаимодействовать с другим белком может быть определена, например, с помощью коиммунопреципитации, двугибридных анализов или комплементации, как генетической, так и биохимической.DNA cutting can be analyzed using gel electrophoresis. See Ausubel et al., supra. The ability of a protein to interact with another protein can be determined, for example, by coimmunoprecipitation, two-hybrid assays, or complementation, either genetic or biochemical.

Вектор способен переносить последовательности генов в клетки-мишени. Как правило, векторная конструкция, вектор экспрессии и вектор переноса гена означают любую конструкцию нуклеиновой кислоты, способную направлять экспрессию представляющего интерес гена и которая может переносить последовательности гена в клетки-мишени. Таким образом, этот термин включает носители клонирования и экспрессии, а также интегрирующие векторы.The vector is capable of transferring gene sequences into target cells. In general, vector construct, expression vector, and gene transfer vector mean any nucleic acid construct capable of directing the expression of a gene of interest and which can transfer gene sequences into target cells. Thus, the term includes cloning and expression vehicles as well as integration vectors.

Термины субъект и пациент используются взаимозаменяемо и относятся к млекопитающим, таким как пациенты-люди и приматы, не относящиеся к человеку, а также к экспериментальным животным, таким как свиньи, коровы, кролики, собаки, кошки, крысы, мыши и другие животные. Соответственно, термин субъект или пациент, используемый в данном документе, означает любого пациентаили субъекта-млекопитающего, которому могут быть введены стволовые клетки по данному изобретению.The terms subject and patient are used interchangeably and refer to mammals such as human patients and non-human primates, as well as experimental animals such as pigs, cows, rabbits, dogs, cats, rats, mice and other animals. Accordingly, the term subject or patient as used herein means any patient or mammalian subject to whom the stem cells of this invention can be administered.

Субъекты данного изобретения включают тех, кто подвергся воздействию одного или более химических токсинов, включая, например, нервный токсин.Subjects of the present invention include those who have been exposed to one or more chemical toxins, including, for example, a nerve toxin.

Стволовость относится к относительной способности любой клетки действовать подобным стволовым клеткам образом, т.е. к степени тоти-, плюри, мульти- или олигопотенции и усиленной или бесконечной способностью к самообновлению, которые какая-либо конкретная стволовая клетка может иметь.Stemness refers to the relative ability of any cell to act in a stem cell-like manner, i.e. to the degree of toti-, pluri-, multi- or oligopotency and enhanced or infinite capacity for self-renewal that any particular stem cell may have.

НуклеазыNucleases

Здесь описаны композиции, в частности нуклеазы, которые полезны для разрезания in vivo донорной молекулы, несущей трансген, и нуклеазы для разрезания генома клетки таким образом, что трансген целенаправленно интегрируется в геном. В определенных вариантах осуществления одна или более нуклеаз встречаются в природе. В других вариантах осуществления одна или более нуклеаз не встречаются в природе, т.е. модифицированы в ДНК-связывающем домене, домене разрезания и комбинации ДНКсвязывающего домена и домена разрезания. Например, ДНК-связывающий домен встречающейся в природе нуклеазы может быть изменен для связывания с выбранным сайтом-мишенью (например, мегануклеаза, которая была сконструирована для связывания с сайтом, отличным от ее природного сайта связывания). В других вариантах осуществления нуклеаза содержит гетерологичные ДНК-связывающие и разрезающие домены (например, нуклеазы цинкового пальца; ДНК-связывающие белки TAL-эффекторного домена; ДНК-связывающие домены мегануклеазы с гетерологичными доменами разрезания).Described herein are compositions, in particular nucleases, that are useful for cutting in vivo a donor molecule carrying a transgene, and nucleases for cutting the genome of a cell so that the transgene is specifically integrated into the genome. In certain embodiments, one or more nucleases occur naturally. In other embodiments, one or more nucleases are not naturally occurring, i.e. modified in the DNA binding domain, the cutting domain and the combination of the DNA binding domain and the cutting domain. For example, the DNA binding domain of a naturally occurring nuclease can be modified to bind to a selected target site (eg, a meganuclease that has been engineered to bind to a site other than its natural binding site). In other embodiments, the nuclease comprises heterologous DNA binding and cutting domains (eg, zinc finger nucleases; TAL effector domain DNA binding proteins; meganuclease DNA binding domains with heterologous cutting domains).

А. ДНК-связывающие доменыA. DNA-binding domains

В некоторых вариантах осуществления ДНК-связывающий домен одной или большего количества нуклеаз, используемых для разрезания in vivo, целевого разрезания генома клетки и комбинаций разрезания in vivo и целевого разрезания генома клетки, содержит белок цинкового пальца. Один белок цинкоIn some embodiments, the DNA binding domain of one or more nucleases used for in vivo cutting, targeted cell genome cutting, and combinations of in vivo cutting and targeted cell genome cutting comprises a zinc finger protein. One zinc protein

- 17 045868 вого пальца состоит из нескольких/многих доменов цинкового пальца (например, 3, 4, 5, 6 или более доменов цинкового пальца). Каждый домен цинкового пальца имеет длину около 30 аминокислот и содержит бета-виток (содержащий два координационных остатка цинка) и альфа-спираль (содержащую два инвариантных координационных остатка цинка), которые удерживаются в определенной конформации, позволяющей белку связывать целевую последовательность. Можно использовать канонические (С2Н2) домены цинкового пальца, имеющие два координирующих цинк цистеиновых остатка (Cys) в бета-витке и два координирующих цинк остатка гистидина (His) в альфа-спирали или неканонический (СН3) (см., например, патент США № 9234187). Спираль распознавания из 7 аминокислот содержится между координирующими цинк остатками бета-витка и координирующими цинк остатками альфа-спирали. Область спирали распознавания пронумерована от -1 до + 6 в пределах домена цинкового пальца, а аминокислоты вне этогй области распознавания (и исключая координирующие цинк остатки) называются остатками остова.- 17 045868 zinc finger consists of several/many zinc finger domains (eg, 3, 4, 5, 6 or more zinc finger domains). Each zinc finger domain is approximately 30 amino acids long and contains a beta turn (containing two zinc coordination residues) and an alpha helix (containing two invariant zinc coordination residues) that are held in a specific conformation that allows the protein to bind the target sequence. Canonical (C2H2) zinc finger domains having two zinc coordinating cysteine residues (Cys) in the beta turn and two zinc coordinating histidine residues (His) in the alpha helix or non-canonical (CH3) can be used (see, for example, US Pat. No. 9234187). The 7-amino acid recognition helix is contained between the zinc-coordinating residues of the beta-helix and the zinc-coordinating residues of the alpha-helix. The recognition helix region is numbered -1 to +6 within the zinc finger domain, and amino acids outside this recognition region (and excluding zinc coordinating residues) are called backbone residues.

Предпочтительно белок цинкового пальца является не встречающимся в природе в отношении того, что спираль распознавания сконструирована так, чтобы связываться с выбранным сайтом-мишенью. См., например, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10: 411-416; патенты США №№ 6453242; 6534261; 6599692; 6503717; 6689558; 7030215; 6794136; 7067317; 7262054; 7070934; 7361635; 7253273; и патентные публикации США № 2005/0064474; 2007/0218528; 2005/0267061, которые все включены в данный документ посредством ссылки во всей их полноте.Preferably, the zinc finger protein is non-naturally occurring in that the recognition helix is designed to bind to a selected target site. See, for example, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10: 411-416; US Patent Nos. 6,453,242; 6534261; 6599692; 6503717; 6689558; 7030215; 6794136; 7067317; 7262054; 7070934; 7361635; 7253273; and US Patent Publications No. 2005/0064474; 2007/0218528; 2005/0267061, all of which are incorporated herein by reference in their entirety.

Сконструированный домен связывания цинковых пальцев может иметь новую специфичность связывания по сравнению с природным белком цинковых пальцев. Методы конструирования включают, но не ограничиваются ими, рациональный дизайн и различные типы отбора. Рациональный дизайн включает в себя, например, использование баз данных, содержащих триплетные (или квадруплетные) нуклеотидные последовательности и отдельные аминокислотные последовательности цинковых пальцев, в которых каждая триплетная или квадруплетная нуклеотидная последовательность ассоциирована с одним или более аминокислотными последовательностями цинковых пальцев, которые связывают последовательность конкретного триплета или квадруплета. См., например, совместные патенты США №№ 6453242 и 6534261, включенные в данный документ в качестве ссылки во всей их полноте.The engineered zinc finger binding domain may have a novel binding specificity compared to native zinc finger protein. Design methods include, but are not limited to, rational design and various types of selection. Rational design includes, for example, the use of databases containing triplet (or quadruplet) nucleotide sequences and individual zinc finger amino acid sequences, in which each triplet or quadruplet nucleotide sequence is associated with one or more zinc finger amino acid sequences that link the particular triplet sequence or quadruplet. See, for example, US Patent Nos. 6,453,242 and 6,534,261, incorporated herein by reference in their entirety.

Кроме того, в определенных вариантах осуществления ДНК-связывающие домены ZFP дополнительно содержат одну или более модификаций остова одного или более компонентных доменов цинкового пальца. Специфичность ZFP к последовательности ДНК-мишени зависит от сиквенс-специфических контактов между доменами цинкового пальца и специфическими основаниями ДНК, в частности, между областью спирали распознавания и сайтом-мишенью (обычно каждая спираль распознавания связывается с дочерним сайтом-мишенью из 3-х нуклеотидов). Кроме того, домены цинкового пальца также содержат аминокислотные остатки, которые принимают участие в неспецифических взаимодействиях с фосфатами остова ДНК. Elrod-Erickson et al. ((1996) Structure 4:1171), продемонстрироали путем кокристализации белка цинкового пальца и узнаваемой им мишени ДНК, что существуют специфические аминокислоты, способные взаимодействовать с фосфатами в остове ДНК посредством образования водородных связей. Белки цинкового пальца, которые используют хорошо известный Zif268 остов обычно имеют аргинин в качестве концевого аминокислотного остатка в их второй цепи бета - листа, который также является второй карбокси терминальной позицией по отношению ко второму инвариантному цистеину. Эта позиция может упоминаться как (-5) в каждом домене цинкового пальца, поскольку это 5-й остаток, предшествующий началу α-спирали (и позиция -5 относительно спирали распознавания, пронумерованной от -1 до +6). Аргинин в этой позиции может взаимодействовать с фосфатом на остове ДНК посредством образования заряженной водородной связи с его группой гуанидина в боковой цепи. Белки цинкового пальца в остове Zif268 также часто содержат лизин в позиции, которая сдвинута на 4 остатка в аминотерминальном направлении по отношению к первому инвариантному цистеину. Эту позицию можно обозначить как (-14) внутри каждого пальца, так как это 14-й остаток, предшествующий началу αспирали для цинковых пальцев с двумя остатками между координирующими цинк остатками цистеина (и положением -14 относительно области спирали распознавания пронумерованой от -1 до +6). Лизин может взаимодействовать с фосфатом в остове ДНК через образование опосредованной водой заряженной водородной связи с его боковой аминогруппой. Поскольку фосфатные группы обнаруживаются по всей длине остова ДНК, этот тип взаимодействия между цинковым пальцем и молекулой ДНК обычно считается не сиквенс-специфичным (J. Miller, Massachusetts Institute of Technology Ph. D. Thesis, 2002).Additionally, in certain embodiments, the ZFP DNA binding domains further comprise one or more backbone modifications of one or more component zinc finger domains. The specificity of ZFP to the target DNA sequence depends on sequence-specific contacts between zinc finger domains and specific DNA bases, in particular between the recognition helix region and the target site (usually each recognition helix binds to a 3-nucleotide daughter target site) . In addition, zinc finger domains also contain amino acid residues that participate in nonspecific interactions with DNA backbone phosphates. Elrod-Erickson et al. ((1996) Structure 4:1171), demonstrated by cocrystallizing the zinc finger protein and its cognate DNA target that there are specific amino acids that can interact with phosphates on the DNA backbone through hydrogen bonding. Zinc finger proteins that use the well-known Zif268 backbone typically have an arginine as the terminal amino acid residue in their second beta sheet chain, which is also the second carboxy terminal position to the second invariant cysteine. This position may be referred to as (−5) in each zinc finger domain because it is the 5th residue preceding the start of the α-helix (and position −5 relative to the recognition helix numbered −1 to +6). Arginine at this position can interact with a phosphate on the DNA backbone by forming a charged hydrogen bond with its guanidine group on the side chain. Zinc finger proteins in the Zif268 backbone also often contain a lysine at a position that is shifted 4 residues in the amino-terminal direction relative to the first invariant cysteine. This position can be designated as (-14) within each finger, since it is the 14th residue preceding the start of the α-helix for zinc fingers with two residues between the zinc-coordinating cysteine residues (and position -14 relative to the recognition helix region numbered -1 to + 6). Lysine can interact with a phosphate on the DNA backbone through the formation of a water-mediated charged hydrogen bond with its amino side group. Because phosphate groups are found along the entire length of the DNA backbone, this type of interaction between the zinc finger and the DNA molecule is generally considered to be non-sequence specific (J. Miller, Massachusetts Institute of Technology Ph. D. Thesis, 2002).

Недавние исследования выдвинули гипотезу, что неспецифические фосфат-контактные боковые цепи в некоторых нуклеазах также могут объяснять некоторую неспецифичность этих нуклеаз (Kleinstiver et al. (2016) Nature 529(7587):490-5; Guilinger et al. (2014) Nat Meth: 429-435). Исследователи предположили, что эти нуклеазы могут обладать избыточной энергией связывания ДНК, что означает, что указанные нуклеазы могут обладать большей аффинностью к своей ДНК-мишени, чем это требуется для существенного связывания и разрезания сайта-мишени. Таким образом, были предприняты попыткиRecent studies have hypothesized that nonspecific phosphate contact side chains in some nucleases may also account for some of the nonspecificity of these nucleases (Kleintiver et al. (2016) Nature 529(7587):490-5; Guilinger et al. (2014) Nat Meth: 429-435). The researchers hypothesized that these nucleases may have excess DNA binding energy, meaning that these nucleases may have greater affinity for their target DNA than is required to substantially bind and cut the target site. Thus, attempts have been made

- 18 045868 уменьшить катионные заряды в ДНК-связывающем домене TALE (Guilinger, там же) или в ДНКсвязывающем домене Cas9 (Kleinstiver, там же), чтобы снизить энергию связывания ДНК этих нуклеаз, что привело к увеличению специфичности разрезания in vitro. Однако дополнительные исследования (Sternberg et al. (2015) Nature 527 (7576): 110-113) также указывают на роль в правильном сворачивании и активации нуклеазного домена Cas9 для некоторых катионных аминокислот, которые были мутированы в исследовании Kleinstiver ДНК-связывающего домена Cas9. Таким образом, точная роль этих аминокислот в активности Cas9 не известна.- 18 045868 reduce the cationic charges in the DNA-binding domain of TALE (Guilinger, ibid.) or in the DNA-binding domain of Cas9 (Kleinstiver, ibid.) to reduce the DNA binding energy of these nucleases, which led to increased cutting specificity in vitro. However, additional research (Sternberg et al. (2015) Nature 527 (7576): 110-113) also suggests a role in the proper folding and activation of the Cas9 nuclease domain for some cationic amino acids that were mutated in Kleinstiver's study of the Cas9 DNA-binding domain. Thus, the exact role of these amino acids in Cas9 activity is unknown.

Способы и композиции по данному изобретению, таким образом, включают мутации аминокислот в пределах ДНК-связывающего домена ZFP (остова ZFP), которые могут неспецифично взаимодействовать с фосфатами в остове ДНК, но они не содержат изменений в спиралях распознавания ДНК. Таким образом, изобретение включает мутации катионных аминокислотных остатков в остове ZFP, которые не требуются для специфичности к нуклеотидной мишени. В некоторых вариантах осуществления эти мутации в остове ZFP включают мутацию катионного аминокислотного остатка на нейтральный или анионный аминокислотный остаток. В некоторых вариантах осуществления эти мутации в остове ZFP включают мутацию полярного аминокислотного остатка на нейтральный или неполярный аминокислотный остаток. В предпочтительных вариантах осуществления мутации делаются в позиции (-5), позиции (-9), позиции (-14) и комбинации мутаций, выбранных из мутаций в позиции (-5), позиции (-9) и позиции (-14) относительно спирали связывания ДНК. В некоторых вариантах осуществления цинковый палец может содержать одну или более мутаций в (-5), (-9), (-14) и комбинации мутаций, выбранных из мутаций в (-5), (-9) и (-14). В других вариантах осуществления один или более цинковых пальцев в белке цинковых пальцев с несколькими пальцами, могут содержать мутации в (-5), (-9), (-14) и комбинации, выбранные из (-5), (-9) и (-14). В некоторых вариантах осуществления аминокислоты в (-5), (-9), (-14) и комбинации, выбранные из (-5), (-9) и (-14) (например, аргинин (R) или лизин (K)) мутированы в аланин (А), лейцин (L), Ser (S), Asp (D), Glu (E), Tyr (Y) и/или глютамин (Q).The methods and compositions of the present invention thus involve amino acid mutations within the ZFP DNA binding domain (ZFP backbone) that may interact nonspecifically with phosphates in the DNA backbone, but they do not involve changes in DNA recognition helices. Thus, the invention includes mutations of cationic amino acid residues in the ZFP backbone that are not required for nucleotide target specificity. In some embodiments, these mutations in the ZFP backbone include mutation of a cationic amino acid residue to a neutral or anionic amino acid residue. In some embodiments, these mutations in the ZFP backbone include mutation of a polar amino acid residue to a neutral or non-polar amino acid residue. In preferred embodiments, mutations are made at position (-5), position (-9), position (-14) and a combination of mutations selected from mutations at position (-5), position (-9) and position (-14) relative to DNA binding helix. In some embodiments, the zinc finger may contain one or more mutations in (-5), (-9), (-14) and combinations of mutations selected from mutations in (-5), (-9) and (-14). In other embodiments, one or more zinc fingers in a multi-finger zinc finger protein may contain mutations in (-5), (-9), (-14), and combinations selected from (-5), (-9), and (-14). In some embodiments, amino acids at (-5), (-9), (-14) and combinations selected from (-5), (-9) and (-14) (for example, arginine (R) or lysine (K )) are mutated to alanine (A), leucine (L), Ser (S), Asp (D), Glu (E), Tyr (Y) and/or glutamine (Q).

В любом из этих слитых полипептидов, описанных в данном документе, партнеры ZFP могут дополнительно содержать мутации в ДНК-связывающем домене цинкового пальца в позициях (-5), (-9), (14) и комбинации мутаций, выбранных из мутаций в (-5), (-9) и (-14). В некоторых вариантах осуществления Arg (R) в позиции -5 меняется на Tyr (Y), Asp (D), Glu (E), Leu (L), Gln (Q) или Ala (A). В других вариантах осуществления Arg (R) в позиции (-9) меняется на Ser (S), Asp (D) или Glu (E). В других вариантах осуществления Arg (R) в позиции (-14) заменяется Ser (S) или Gln (Q). В других вариантах осуществления слитые полипептиды могут содержать мутации в ДНК-связывающем домене цинкового пальца, где аминокислоты в позициях (-5), (-9), (-14), и комбинации мутаций, выбранных из мутаций в (-5), (-9) и (-14) заменены на любую из перечисленных выше аминокислот в любой комбинации.In any of these fusion polypeptides described herein, the ZFP partners may further contain mutations in the zinc finger DNA binding domain at positions (-5), (-9), (14) and combinations of mutations selected from mutations at (- 5), (-9) and (-14). In some embodiments, the Arg (R) at position -5 is changed to Tyr (Y), Asp (D), Glu (E), Leu (L), Gln (Q), or Ala (A). In other embodiments, the Arg (R) at position (-9) is changed to Ser (S), Asp (D), or Glu (E). In other embodiments, Arg (R) at position (-14) is replaced by Ser (S) or Gln (Q). In other embodiments, the fusion polypeptides may contain mutations in the zinc finger DNA binding domain, where the amino acids are at positions (-5), (-9), (-14), and combinations of mutations selected from mutations at (-5), ( -9) and (-14) are replaced by any of the amino acids listed above in any combination.

Иллюстративные способы отбора, включая фаговый дисплей и двухгибридные системы, раскрыты в патентах США 5789538; 5925523; 6007988; 6013453; 6410248; 6140466; 6200759 и 6242568; а также WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 и GB 2338237. Кроме того, усиление специфичности связывания для доменов связывания цинковых пальцев было описано, например, в совместной заявке WO 02/011221.Exemplary selection methods, including phage display and two-hybrid systems, are disclosed in US Pat. No. 5,789,538; 5925523; 6007988; 6013453; 6410248; 6140466; 6200759 and 6242568; and also WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 and GB 2338237. In addition, enhancing binding specificity for zinc finger binding domains has been described, for example, in joint application WO 02/011221.

Подбор целевых сайтов; ZFP и способов проектирования и конструирования и слитых белков (и полинуклеотидов, кодирующих их) известны специалистам в данной области и подробно описаны в патентах США №№ 6140081; 5789538; 6453242; 6534261; 5925523; 6007988; 6013453; 6200759; публикациях РСТ № WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 и WO 03/016496.Selection of target sites; ZFPs and methods for designing and constructing fusion proteins (and polynucleotides encoding them) are known to those skilled in the art and are described in detail in US Pat. Nos. 6,140,081; 5789538; 6453242; 6534261; 5925523; 6007988; 6013453; 6200759; PCT publications No. WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 and WO 03/016496.

Почти любой линкер (спейсер) может использоваться между одним или более компонентами ДНКсвязывающего домена (например, цинкового пальца), между одним или более ДНК-связывающими доменами, между ДНК-связывающим доменом и функциональным доменом (например, нуклеазным) и между одним или более ДНК-связывающими доменами и между ДНК-связывающим доменом и функциональным доменом. Неограничивающие примеры подходящих линкерных последовательностей включают патенты США №№ 8772453; 7888121; 6479626; 6903185 и 7153949; и патентные публикации США №№ 2009/0305419; 2015/0064789 и 2015/0132269. Таким образом, белки, описанные в данном документе, могут включать любую комбинацию подходящих линкеров между отдельными ДНК-связывающими компонентами, между ДНК-связывающим доменом и функциональным доменом или между одним или более ДНК-связывающими доменами и между ДНК-связывающим доменом и функциональным доменом композиций, описанных в данном документе.Almost any linker (spacer) can be used between one or more components of a DNA-binding domain (eg, zinc finger), between one or more DNA-binding domains, between a DNA-binding domain and a functional domain (eg, nuclease), and between one or more DNA -binding domains and between the DNA-binding domain and the functional domain. Non-limiting examples of suitable linker sequences include US Pat. Nos. 8,772,453; 7888121; 6479626; 6903185 and 7153949; and US Patent Publications No. 2009/0305419; 2015/0064789 and 2015/0132269. Thus, the proteins described herein may include any combination of suitable linkers between individual DNA-binding components, between a DNA-binding domain and a functional domain, or between one or more DNA-binding domains, and between a DNA-binding domain and a functional domain of the compositions. described in this document.

В. Домены разрезанияB. Cutting domains

Любой подходящий домен разрезания может быть функционально связан с ДНК-связывающими доменами, как описано в данном документе, с образованием нуклеазы. Домен разрезания может быть гетерологичным по отношению к ДНК-связывающему домену, например ДНК-связывающий домен из цинкового пальца и домен разрезания из нуклеазы. Гетерологичные домены разрезания могут быть получены из любой эндонуклеазы или экзонуклеазы. Иллюстративные эндонуклеазы, из которых может быть получен домен разрезания, включают, но не ограничиваются ими, эндонуклеазы рестрикции и эндонуклеазы хоуминга. См., например, Каталог 2002-2003, New England Biolabs, Беверли, Масачусетс; иAny suitable cutting domain can be operably linked to DNA binding domains as described herein to form a nuclease. The cutting domain may be heterologous to the DNA binding domain, for example a zinc finger DNA binding domain and a nuclease cutting domain. Heterologous cutting domains can be derived from any endonuclease or exonuclease. Exemplary endonucleases from which a cutting domain can be derived include, but are not limited to, restriction endonucleases and homing endonucleases. See, for example, Catalog 2002-2003, New England Biolabs, Beverly, Massachusetts; And

- 19 045868- 19 045868

Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388. Известны дополнительные ферменты, которые расщепляют ДНК (например, нуклеаза S1; нуклеаза бобов мунг; ДНКаза I поджелудочной железы; микрококковая нуклеаза; эндонуклеаза НО дрожжей; см. также Linn et al. (Eds. )Nucleases, Cold Spring Harbor Laboratory Press, 1993). Один или более из этих ферментов (или их функциональных фрагментов) могут быть использованы в качестве источника доменов разрезания и полудоменов разрезания.Belfort et al. (1997) Nucleic Acids Res. 25:3379–3388. Additional enzymes are known that cleave DNA (e.g., S1 nuclease; mung bean nuclease; pancreatic DNase I; micrococcal nuclease; yeast HO endonuclease; see also Linn et al. (Eds.)Nucleases, Cold Spring Harbor Laboratory Press, 1993) . One or more of these enzymes (or functional fragments thereof) can be used as a source of cutting domains and half-cutting domains.

Аналогично, полудомен разрезания может быть получен из любой нуклеазы или ее части, как указано выше, которая требует димеризации для активности разрезания. Как правило, два слитых белка необходимы для разрезания, если слитые белки содержат полудомены разрезания. Альтернативно, можно использовать один белок, содержащий два полудомена разрезания. Два полудомена разрезания могут быть получены из одной и той же эндонуклеазы (или ее функциональных фрагментов), или каждый полудомен разрезания может быть получен из другой эндонуклеазы (или ее функциональных фрагментов). Кроме того, сайты-мишени для двух слитых белков предпочтительно расположены относительно друг друга так, что связывание двух слитых белков с их соответствующими сайтами-мишенями позиционирует полудомены разрезания в пространственной ориентации друг к другу таким образом, что это позволяет полудоменам разрезания формировать функциональный домен разрезания, например, путем димеризации. Таким образом, в определенных вариантах осуществления ближние края сайтов-мишеней разделены 5-8 нуклеотидами или 15-18 нуклеотидами. Однако любое целое число нуклеотидов или нуклеотидных пар может находиться между двумя сайтами-мишенями (например, от 2 до 50 нуклеотидных пар или более). В общем случае, сайт разрезания лежит между целевыми сайтами.Likewise, a cleavage half-domain can be derived from any nuclease or portion thereof, as defined above, that requires dimerization for cleavage activity. Typically, two fusion proteins are required for cutting if the fusion proteins contain cutting half-domains. Alternatively, a single protein containing two cutting half-domains can be used. The two cleavage half-domains may be derived from the same endonuclease (or functional fragments thereof), or each cleavage half-domain may be derived from a different endonuclease (or functional fragments thereof). In addition, the target sites for the two fusion proteins are preferably positioned relative to each other such that binding of the two fusion proteins to their respective target sites positions the cutting half-domains in spatial orientation to each other in a manner that allows the cutting half-domains to form a functional cutting domain. for example, by dimerization. Thus, in certain embodiments, the proximal edges of the target sites are separated by 5-8 nucleotides or 15-18 nucleotides. However, any integer number of nucleotides or nucleotide pairs may lie between two target sites (eg, 2 to 50 nucleotide pairs or more). In general, the cutting site lies between the target sites.

Эндонуклеазы рестрикции (ферменты рестрикции) присутствуют во многих видах и способны специфически связываться с последовательностью ДНК (в сайте узнавания) и расщеплять ДНК в сайте связывания или рядом с ним. Некоторые ферменты рестрикции (например, типа IIS) расщепляют ДНК в сайтах, удаленных от сайта узнавания, и имеют пригодные для разделения домены связывания и разрезания. Например, фермент Типа IIS FokI катализирует двухцепочечное разрезание ДНК на расстоянии в 9 нуклеотидов от ее сайта узнавания на одной цепи и на расстоянии в 13 нуклеотидов от ее сайта узнавания на другой цепи. См., например, патенты США № 5356802; 5436150 и 5487994; а также Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982. Таким образом, в одном варианте осуществления слитые белки содержат домен разрезания (или полудомен разрезания) по меньшей мере от одного фермента рестрикции типа IIS и один или более доменов связывания цинковых пальцев, которые могут быть или не быть изменены.Restriction endonucleases (restriction enzymes) are present in many species and are capable of specifically binding to a DNA sequence (at the recognition site) and cleaving DNA at or near the binding site. Some restriction enzymes (for example, type IIS) cleave DNA at sites distant from the recognition site and have binding and cutting domains suitable for separation. For example, the Type IIS enzyme FokI catalyzes double-stranded DNA cleavage 9 nucleotides from its recognition site on one strand and 13 nucleotides from its recognition site on the other strand. See, for example, US Pat. No. 5,356,802; 5436150 and 5487994; and Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J Biol. Chem. 269:31,978-31,982. Thus, in one embodiment, the fusion proteins comprise a cutting domain (or half-cutting domain) from at least one type IIS restriction enzyme and one or more zinc finger binding domains, which may or may not be modified.

Для оптимальной специфичности разрезания сиквенс-селективной (искусственной) нуклеазой желательно создать условия, чтобы связывание и активность на мишени не были насыщающими. В условиях насыщения-по определению - используется избыток нуклеазы по сравнению с необходимым количеством для достижения полной целевой активности. Это превышение не дает преимущества при воздействия на цель, но все же может привести к увеличению разрезания в нецелевых областях. Для мономерных нуклеаз можно легко избежать условий насыщения, выполнив простое исследование реакции на дозу, чтобы идентифицировать и избежать насыщающего плато на кривой титрования. Однако для димерной нуклеазы, такой как ZFN, TALEN или dCas-Fok, идентификация и избегание условий насыщения могут быть более сложными, если аффинности связывания отдельных мономеров различны. В таких случаях исследование доза-ответ с использованием простого соотношения нуклеаз 1:1 покажет только точку насыщения более слабо связывающего мономера. При таком сценарии, если, например, сродство к мономеру отличается в 10 раз, то в точке насыщения, определенной в исследовании титрования 1:1, мономер с более высоким сродством будет присутствовать в концентрации, которая в 10 раз выше, чем он должен присутствовать. Получающийся в результате избыток мономера с более высокой аффинностью может, в свою очередь, приводить к повышенной активности вне мишени, не обеспечивая какого-либо полезного увеличения разрезания намеченной мишени, что потенциально ведет к снижению общей специфичности для любой данной пары нуклеаз.For optimal cutting specificity with a sequence-selective (artificial) nuclease, it is desirable to ensure that binding and activity on the target are not saturable. Under saturation conditions, by definition, an excess of nuclease is used compared to the amount required to achieve full target activity. This excess does not provide an advantage when impacting the target, but may still result in increased cutting in non-target areas. For monomeric nucleases, saturation conditions can be easily avoided by performing a simple dose response study to identify and avoid a saturating plateau in the titration curve. However, for a dimeric nuclease such as ZFN, TALEN or dCas-Fok, identifying and avoiding saturating conditions can be more challenging if the binding affinities of the individual monomers are different. In such cases, a dose-response study using a simple 1:1 nuclease ratio will only show the saturation point of the weaker binding monomer. In this scenario, if, for example, the affinity for a monomer differs by a factor of 10, then at the saturation point determined in a 1:1 titration study, the monomer with the higher affinity will be present at a concentration that is 10 times higher than it should be present. The resulting excess of higher affinity monomer may in turn lead to increased off-target activity without providing any beneficial increase in cutting of the intended target, potentially leading to decreased overall specificity for any given pair of nucleases.

Типичным ферментом рестрикции IIS типа, домен разрезания которого отделим от домена связывания, является FokI. Этот конкретный фермент активен в качестве димера. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95:10, 570-10,575. Соответственно, для целей данного раскрытия часть фермента FokI, используемая в описанных слитых белках, считается полудоменом разрезания. Таким образом, для целевого двухцепочечного разрезания, целенаправленная замена клеточных последовательностей с использованием слияний цинкового пальца -FokI и комбинаций целевого двухцепочечного разрезания и целенаправленной замены клеточных последовательностей с использованием слияний цинкового пальца - FokI, два слитых белка, каждый из которых содержит полудомен разрезания FokI, могут быть использованы для репарации каталитически активного домена разрезания. Альтернативно, одна полипептидная молекула, содержащая домен связывания цинкового пальца и два полудомена разрезания FokI, тоже может использоваться. Параметры для целевого разрезания и целевого изменения последовательности с использованием слияний цинкового пальца - FokI представлены в других частях данного раскрытия.A typical type IIS restriction enzyme whose cutting domain is separable from its binding domain is FokI. This particular enzyme is active as a dimer. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95:10, 570-10,575. Accordingly, for purposes of this disclosure, the portion of the FokI enzyme used in the described fusion proteins is considered to be a cutting half-domain. Thus, for targeted double-strand cutting, targeted replacement of cellular sequences using zinc finger-FokI fusions, and combinations of targeted double-strand cutting and targeted replacement of cellular sequences using zinc finger-FokI fusions, two fusion proteins each containing a half-FokI cutting domain can be used to repair the catalytically active cutting domain. Alternatively, one polypeptide molecule containing a zinc finger binding domain and two FokI cutting half-domains can also be used. Parameters for targeted cutting and targeted sequence alteration using zinc finger-FokI fusions are provided elsewhere in this disclosure.

Домен разрезания или полудомен разрезания может представлять собой любую часть белка, которая сохраняет активность разрезания или которая сохраняет способность к мультимеризации (например,A cutting domain or cutting half-domain can be any portion of a protein that retains cutting activity or that retains the ability to multimerize (e.g.

- 20 045868 димеризации) с образованием функционального домена разрезания.- 20 045868 dimerization) to form a functional cutting domain.

Типичные рестрикционные ферменты типа IIS описаны в патенте США № 7888121, полностью включенном в данный документ. Дополнительные рестрикционные ферменты также содержат разделяемые связывающие и разрезающие домены, и они предусмотрены настоящим раскрытием (См., например, Roberts et al. (2003) Nucleic Acids Res. 31:418-420).Exemplary Type IIS restriction enzymes are described in US Pat. No. 7,888,121, which is incorporated herein in its entirety. Additional restriction enzymes also contain separable binding and cutting domains and are provided herein (See, for example, Roberts et al. (2003) Nucleic Acids Res. 31:418-420).

В некоторых вариантах осуществления домен разрезания содержит один или более сконструированных полудоменов разрезания (также называемых мутантами домена димеризации), которые минимизируют или предотвращают гомодимеризацию, как описано, например, в см., например, патенты США №№ 7914796; 8034598 и 8623618, раскрытия которых включены в данное описание в качестве ссылки во всей их полноте. Аминокислотные остатки в позициях 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 и 538 FokI все являются мишенями для воздействия на димеризацию полудоменов разрезания FokI, причем нумерация относится к кристаллическим структурам 1FOK. pdb и 2FOK. pdb (см. Wah et al. (1997) Nature 388:97-100), имеющим последовательность, продемонстрированную ниже.In some embodiments, the cutting domain comprises one or more engineered cutting half-domains (also called dimerization domain mutants) that minimize or prevent homodimerization, as described, for example, in see, for example, US Pat. Nos. 7,914,796; 8034598 and 8623618, the disclosures of which are incorporated herein by reference in their entirety. Amino acid residues at positions 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, and 538 of FokI are all targets for influencing the dimerization of FokI cutting hemidomains, with numbering refers to 1FOK crystal structures. pdb and 2FOK. pdb (see Wah et al. (1997) Nature 388:97-100) having the sequence shown below.

Полудомен разрезания FokI дикого типа (SEQ ID NO: 18)Wild-type FokI cutting half-domain (SEQ ID NO: 18)

QLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKH

LGGSRKPDGAIYTVGS РIDYGVIVDTKAYS GGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKLGGSRKPDGAIYTVGS РIDYGVIVDTKAYS GGYNLPIGQADEMQRYVEENQTRNKHINPNEWWK

VYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRR KFNNGEINFVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRR KFNNGEINF

Иллюстративные сконструированные полудомены разрезания FokI, которые образуют облигатные гетеродимеры, включают пару, в которой первый полудомен разрезания включает мутации в аминокислотных остатках в позициях 490 и 538 FokI, a второй полудомен разрезания включает мутации в аминокислотных остатках 486 и 499.Exemplary engineered FokI cutting half-domains that form obligate heterodimers include a pair in which the first cutting half-domain includes mutations at amino acid residues at positions 490 and 538 of FokI, and the second cutting half-domain includes mutations at amino acid residues 486 and 499.

Таким образом, в одном варианте осуществления мутация в 490 заменяет Glu (E) на Lys (K); мутация в 538 заменяет Ile (I) на Lys (K); мутация в 486 заменила Gln (Q) на Glu (E); и мутация в позиции 499 заменяет Ile (I) на Lys (K). В частности, сконструированные полудомены разрезания, описанные в данном документе, были получены путем мутации позиций 490 (Е ^ K) и 538 (I ^ K) в одном полудомене разрезания для получения сконструированного полудомена разрезания, обозначенного E490K:I538K, и путем мутации позиций 486 (Q ^ Е) и 499 (I ^ L) в другом полудомене разрезания, чтобы получить сконструированный полудомен разрезания, обозначенный Q486E:I499L.Thus, in one embodiment, the mutation at 490 replaces Glu (E) with Lys (K); mutation in 538 replaces Ile (I) with Lys (K); mutation in 486 replaced Gln (Q) with Glu (E); and a mutation at position 499 replaces Ile (I) with Lys (K). Specifically, the engineered cleavage half-domains described herein were generated by mutating positions 490 (E^K) and 538 (I^K) in one cleavage half-domain to produce the engineered cleavage half-domain designated E490K:I538K, and by mutating positions 486 (Q^E) and 499 (I^L) in another cutting half-domain to obtain a constructed cutting half-domain designated Q486E:I499L.

Сконструированные полудомены разрезания, описанные в данном документе, являются облигатными гетеродимерными мутантами, у которых аберрантное разрезание с помощью гомодимеров ZFN минимизировано или устранено. См., например, патентную публикацию США № 2008/0131962, раскрытие которой включено в качестве ссылки во всей своей полноте для всех целей. В определенных вариантах осуществления сконструированный полудомен разрезания содержит мутации в позициях 486, 499 и 496 (пронумерованные относительно FokI дикого типа), например мутации, которые заменяют остаток Gln (Q) дикого типа в позиции 486 на Glu (Е) ), остаток Ile (I) дикого типа в позиции 499 остатком Leu (L) и остаток Asn (N) дикого типа в позиции 496 остатком Asp (D) или Glu (E) (также называемые как домены ELD и ELE соответственно). В других вариантах осуществления сконструированный полудомен разрезания содержит мутации в позициях 490, 538 и 537 (пронумерованные относительно FokI дикого типа), например мутации, которые заменяют остаток Glu (E) дикого типа в позиции 490 на Lys (K)), остаток Ile (I) дикого типа в позиции 538 остатком Lys (K) и остаток His (H) дикого типа в позиции 537 остатком Lys (K) или остатком Arg (R) (также называемые доменами KKK и KKR соответственно). В других вариантах осуществления сконструированный полудомен разрезания содержит мутации в позициях 490 и 537 (пронумерованные относительно FokI дикого типа), например мутации, которые заменяют остаток Glu (E) дикого типа в позиции 490 остатком Lys (K) и остаток His (H) дикого типа в позиции 537 остатком Lys (K) или остатком Arg (R) (также называемые доменами KIK и KIR соответственно). См., например, патенты США №№ 7914796; 8034598 и 8623618. В других вариантах осуществления сконструированный полудомен разрезания содержит Sharkey, мутации Sharkey и комбинации Sharkey и мутаций Sharkey (см. Guo et al. (2010) J. Mol. Biol. 400(1):96-107).The engineered cutting half-domains described herein are obligate heterodimeric mutants in which aberrant cutting by ZFN homodimers is minimized or eliminated. See, for example, US Patent Publication No. 2008/0131962, the disclosure of which is incorporated by reference in its entirety for all purposes. In certain embodiments, the engineered cleavage half-domain contains mutations at positions 486, 499, and 496 (numbered relative to wild-type FokI), such as mutations that replace the wild-type Gln(Q) residue at position 486 with a Glu(E) ), Ile(I) residue ) wild type at position 499 by the Leu (L) residue and the wild type Asn (N) residue at position 496 by the Asp (D) or Glu (E) residue (also referred to as the ELD and ELE domains, respectively). In other embodiments, the engineered cleavage half-domain contains mutations at positions 490, 538, and 537 (numbered relative to wild-type FokI), such as mutations that replace the wild-type Glu(E) residue at position 490 with a Lys(K)), an Ile(I) residue ) wild-type at position 538 by a Lys (K) residue and a wild-type His (H) residue at position 537 by a Lys (K) residue or an Arg (R) residue (also called KKK and KKR domains, respectively). In other embodiments, the engineered cleavage half-domain contains mutations at positions 490 and 537 (numbered relative to wild-type FokI), such as mutations that replace the wild-type Glu (E) residue at position 490 with a Lys (K) residue and a wild-type His (H) residue at position 537 by a Lys (K) residue or an Arg (R) residue (also called KIK and KIR domains, respectively). See, for example, US Pat. Nos. 7,914,796; 8034598 and 8623618. In other embodiments, the engineered cutting half-domain contains Sharkey, Sharkey mutations, and combinations of Sharkey and Sharkey mutations (see Guo et al. (2010) J. Mol. Biol. 400(1):96-107).

Таким образом, полудомены разрезания, полученные из FokI, могут содержать мутацию в одном или более аминокислотных остатках, как показано в SEQ ID NO: 18, включая мутации в домене димеризации, как описано выше; мутации в каталитическом домене, мутации в других аминокислотных остатках, таких как фосфат-контактные остатки, и любую комбинацию мутаций, выбранных из мутаций в домене димеризации, мутаций в каталитическом домене и мутаций в других аминокислотных остатках, таких как фосфат-контактные остатки. Мутации включают замены (аминокислотного остатка дикого типа другим остатком), вставки (одного или более аминокислотных остатков), делеции (одного или более аминокислотных остатков) и любую комбинацию мутаций, выбранных из замен, вставок и делеций. В некоторых вариантах осуществления один или более остатков 414-426, 443-450, 467-488, 501-502, 521531 (пронумерованных относительно SEQ ID NO: 18) и любая комбинация таких остатков мутированы, поскольку эти остатки расположены близко к остову ДНК в молекулярной модели ZFN, связанной с егоThus, FokI-derived cutting half-domains may contain a mutation at one or more amino acid residues as shown in SEQ ID NO: 18, including mutations in the dimerization domain as described above; mutations in the catalytic domain, mutations in other amino acid residues, such as phosphate contact residues, and any combination of mutations selected from mutations in the dimerization domain, mutations in the catalytic domain, and mutations in other amino acid residues, such as phosphate contact residues. Mutations include substitutions (of a wild-type amino acid residue with another residue), insertions (of one or more amino acid residues), deletions (of one or more amino acid residues), and any combination of mutations selected from substitutions, insertions, and deletions. In some embodiments, one or more of residues 414-426, 443-450, 467-488, 501-502, 521531 (numbered relative to SEQ ID NO: 18) and any combination of such residues are mutated because those residues are located close to the DNA backbone in molecular model of ZFN associated with its

- 21 045868 сайтом-мишенью, описанной в Miller et al. ((2007) Nat Biotechnol 25:778-784). В определенных вариантах осуществления один или более остатков в позициях 416, 422, 447, 44 8 и 52 5 являются мутированными. В некоторых вариантах осуществления мутация включает замену остатка дикого типа другим остатком, например остатком серина (S). В определенных вариантах осуществления домен разрезания FokI нуклеаз, описанных в данном документе, содержит мутацию домена димеризации ELD, мутацию домена димеризации KKR, мутацию K52 5S и любую комбинацию, выбранную из мутации домена димеризации ELD или мутации домена димеризации KKR и мутации K525S.- 21 045868 target site described in Miller et al. ((2007) Nat Biotechnol 25:778–784). In certain embodiments, one or more residues at positions 416, 422, 447, 448, and 525 are mutated. In some embodiments, the mutation involves replacing a wild-type residue with another residue, such as a serine (S) residue. In certain embodiments, the FokI cleavage domain of the nucleases described herein comprises an ELD dimerization domain mutation, a KKR dimerization domain mutation, a K52 5S mutation, and any combination selected from an ELD dimerization domain mutation or a KKR dimerization domain mutation and a K525S mutation.

Сконструированные домены разрезания, описанные в данном документе, могут быть получены с использованием любого подходящего способа, например, путем сайт-направленного мутагенеза полудоменов разрезания дикого типа (FokI), как описано в патентах США №№ 7888121; 7914796; 8034598 и 8623618. Кроме того, описанные в данном документе домены разрезания могут быть слиты с ДНКсвязывающим доменом (например, ZFP) с использованием любого подходящего линкера, включая, но не ограничиваясь этим, линкеры, описанные в патентах США №№ 9394531 и 9567609.The engineered cleavage domains described herein can be produced using any suitable method, for example, by site-directed mutagenesis of wild-type (FokI) cleavage half-domains as described in US Pat. Nos. 7,888,121; 7914796; 8,034,598 and 8,623,618. Additionally, the cleavage domains described herein can be fused to a DNA binding domain (e.g., ZFP) using any suitable linker, including, but not limited to, the linkers described in US Pat. Nos. 9,394,531 and 9,567,609.

Альтернативно, нуклеазы могут быть собраны in vivo на сайте-мишени нуклеиновой кислоты с использованием так называемой технологии расщепленного фермента (см., например, публикацию патента США № 2009/0068164). Компоненты таких расщепленных ферментов могут быть экспрессированы либо на отдельных конструкциях экспрессии, либо могут быть связаны в одной открытой рамке считывания, где отдельные компоненты разделены, например, с помощью саморазрезающегося пептида 2А или последовательности IRES. Компоненты могут быть отдельными доменами связывания цинковых пальцев, или доменами домена мегануклеазы, связывающего нуклеиновую кислоту.Alternatively, nucleases can be assembled in vivo at the target nucleic acid site using so-called split enzyme technology (see, for example, US Patent Publication No. 2009/0068164). Components of such split enzymes can be expressed either on separate expression constructs or can be linked in a single open reading frame where the individual components are separated, for example, by a 2A self-cutting peptide or an IRES sequence. The components may be individual zinc finger binding domains, or domains of a meganuclease nucleic acid binding domain.

Нуклеазы могут быть подвергнуты скринингу на активность перед использованием, например, в хромосомной системе на основе дрожжей, как описано в WO 2009/042163 и 20090068164. Экспрессия нуклеазы может находиться под контролем конститутивного промотора или индуцибельного промотора, например промотора галактокиназы, который активируется (дерепрессируется) в присутствии рафинозы, галактозы и комбинации рафинозы и галактозы и репрессируется в присутствии глюкозы.Nucleases can be screened for activity before use, for example, in a yeast-based chromosomal system, as described in WO 2009/042163 and 20090068164. Nuclease expression can be under the control of a constitutive promoter or an inducible promoter, for example the galactokinase promoter, which is activated (derepressed) in the presence of raffinose, galactose, and a combination of raffinose and galactose and is repressed in the presence of glucose.

Нуклеаза(ы), как описано в данном документе, может производить один или более двухцепочечных, один или более одноцепочечных разрезов и комбинации одного или более двухцепочечных и одного или более одноцепочечных разрезов в целевом сайте. В некоторых вариантах осуществления нуклеаза содержит каталитически неактивный домен разрезания (например, FokI, белок Cas и комбинации FokI и белка Cas). См., например, патенты США №№ 9200266; 8703489 и Guillinger et al. (2014) Nature Biotech. 32(6):577-582. Каталитически неактивный домен разрезания может, в сочетании с каталитически активным доменом, действовать как никаза, образуя одноцепочечный разрез. Следовательно, две никазы могут использоваться в комбинации, чтобы сделать двухцепочечный разрез в определенной области.The nuclease(s) as described herein can produce one or more double-stranded, one or more single-stranded cuts, and combinations of one or more double-stranded and one or more single-stranded cuts at the target site. In some embodiments, the nuclease contains a catalytically inactive cutting domain (eg, FokI, Cas protein, and combinations of FokI and Cas protein). See, for example, US Pat. Nos. 9,200,266; 8703489 and Guillinger et al. (2014) Nature Biotech. 32(6):577-582. A catalytically inactive cutting domain can, in combination with a catalytically active domain, act as a nickase to form a single-stranded cut. Therefore, two nickases can be used in combination to make a double-stranded cut in a specific area.

Дополнительные никазы также известны в данной области техники, например, McCaffery et al. (2016) Nucleic Acids Res. 44(2):e11. doi: 10. 1093/nar/gkv878. Epub 2015 Oct 19.Additional nickases are also known in the art, for example, McCaffery et al. (2016) Nucleic Acids Res. 44(2):e11. doi: 10.1093/nar/gkv878. Epub 2015 Oct 19.

Целевые сайтыTarget sites

Как подробно описано выше, ДНК-домены могут быть сконструированы так, чтобы связываться с любой выбранной последовательностью. Сконструированный ДНК-связывающий домен может иметь новую специфичность связывания по сравнению с природным ДНК-связывающим доменом. В некоторых вариантах осуществления ДНК-связывающие домены связываются с последовательностью в энхансерной последовательности BCL11A, например, сайт-мишень (обычно 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 или даже больше пар оснований) находится между экзоном 2 и экзоном 3 BCL11A, включая ДНК-связывающие домены, которые связываются с последовательностью в сайте гиперчувствительном к ДНКазеI в последовательности энхансера BCL11A (например, +58), как показано в табл. 1. Методы конструирования включают, но не ограничиваются ими, рациональный дизайн и различные типы отбора. Рациональный дизайн включает в себя, например, использование баз данных, содержащих триплетные (или квадруплетные) нуклеотидные последовательности и отдельные аминокислотные последовательности цинковых пальцев, в которых каждая триплетная или квадруплетная нуклеотидная последовательность ассоциирована с одним или более аминокислотными последовательностями цинковых пальцев, которые связывают последовательность конкретного триплета или квадруплета. См., например, совместные патенты США №№ 6453242 и 6534261, включенные в данный документ в качестве ссылки во всей их полноте. Рациональное проектирование TAL-эффекторных доменов также может быть осуществлено. См., например, патентную публикацию США № 2011/0301073.As described in detail above, DNA domains can be designed to bind to any selected sequence. The engineered DNA binding domain may have a new binding specificity compared to the natural DNA binding domain. In some embodiments, the DNA binding domains bind to a sequence in the BCL11A enhancer sequence, such as a target site (typically 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, or even more base pairs) is located between exon 2 and exon 3 of BCL11A, including DNA-binding domains that bind to a sequence at the DNaseI hypersensitive site in the BCL11A enhancer sequence (eg, +58), as shown in Table. 1. Design methods include, but are not limited to, rational design and various types of selection. Rational design includes, for example, the use of databases containing triplet (or quadruplet) nucleotide sequences and individual zinc finger amino acid sequences, in which each triplet or quadruplet nucleotide sequence is associated with one or more zinc finger amino acid sequences that link the particular triplet sequence or quadruplet. See, for example, US Patent Nos. 6,453,242 and 6,534,261, incorporated herein by reference in their entirety. Rational design of TAL effector domains can also be achieved. See, for example, US Patent Publication No. 2011/0301073.

Иллюстративные способы отбора, применимые к ДНК-связывающим доменам, включая фаговый дисплей и двухгибридные системы, раскрыты в патентах США № 5789538; 5925523; 6007988; 6013453; 6410248; 6140466; 6200759 и 6242568; а также публикации РСТ № WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 и патент Великобритании № GB 2338237. Кроме того, усиление специфичности связывания для доменов связывания цинковых пальцев было описано, например, в совместной заявке WO 02/077227.Exemplary selection methods applicable to DNA-binding domains, including phage display and two-hybrid systems, are disclosed in US Pat. No. 5,789,538; 5925523; 6007988; 6013453; 6410248; 6140466; 6200759 and 6242568; as well as PCT publication No. WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 and UK Patent No. GB 2338237. In addition, enhancing binding specificity for zinc finger binding domains has been described, for example, in joint application WO 02/077227.

Подбор целевых сайтов; нуклеазы и способы проектирования и конструирования слитых белков (и полинуклеотидов, кодирующих их) известны специалистам в данной области и подробно описаны в патентных публикациях США №№ 2005/0064474 и 2006/0188987, полностью включенных в данное описаSelection of target sites; nucleases and methods for designing and constructing fusion proteins (and polynucleotides encoding them) are known to those skilled in the art and are described in detail in US Patent Publications Nos. 2005/0064474 and 2006/0188987, which are incorporated herein in their entirety.

- 22 045868 ние посредством ссылки.- 22 045868 information by reference.

Кроме того, как раскрыто в этих и других ссылках, ДНК-связывающие домены (например, многопальцевые белки цинкового пальца) и слияния ДНК-связывающего(их) домена(ов) и функционального(ых) домена(ов) могут быть связаны вместе с использованием любых подходящих линкерных последовательностей, включая, например, линкеры из 5 или более аминокислот. Патенты США №№ 8772453; 7888121 (например, линкер ZC); 6479626; 6903185 и 7153949; публикация США № 2009/0305419) и 2015/0064789. Описанные в данном документе белки могут включать любую комбинацию подходящих линкеров между отдельными ДНК-связывающими доменами белка (см. также патент США № 8586526).In addition, as disclosed in these and other references, DNA binding domains (eg, multifinger zinc finger proteins) and fusions of DNA binding domain(s) and functional domain(s) can be linked together using any suitable linker sequences, including, for example, linkers of 5 or more amino acids. US Patent Nos. 8,772,453; 7888121 (eg ZC linker); 6479626; 6903185 and 7153949; US Publication No. 2009/0305419) and 2015/0064789. The proteins described herein may include any combination of suitable linkers between individual DNA binding domains of the protein (see also US Pat. No. 8,586,526).

ДонорыDonors

В определенных вариантах осуществления данное раскрытие относится к нуклеазо-опосредованной целевой интеграции экзогенной последовательности в геном клетки с использованием молекул, связывающих энхансерную область BCL11A, описанные в данном документе. Как отмечалось выше, вставка экзогенной последовательности (также называемой донорной последовательностью или донором или трансгеном), например, для делеции указанной области, для коррекции мутантного гена, для комбинации делеции указанной области и коррекции мутантного гена или для повышенной экспрессии гена дикого типа. Очевидно, что донорная последовательность обычно не идентична геномной последовательности, в которую она вставляется. Донорная последовательность может содержать негомологичную последовательность, фланкированную двумя областями гомологии, чтобы обеспечить эффективный HDR в месторасположении представляющем интерес, или может быть интегрирована с помощью механизмов негомологично направляемой репарации, таких как NHEJ. Кроме того, донорные последовательности могут содержать векторную молекулу, содержащую последовательности, которые не гомологичны области представляющей интерес в клеточном хроматине. Донорная молекула может содержать несколько прерывающихся областей гомологии с клеточным хроматином и, например, приводить к делеции энхансерной области BCL11A (или ее фрагмента) при использовании в качестве субстрата для репарации DSB, индуцированного одной из нуклеаз описаных в данном документе. Кроме того, для направленной вставки последовательностей, которые обычно не присутствуют в области представляющей интерес, указанные последовательности могут присутствовать в молекуле донорной нуклеиновой кислоты и фланкироваться областями гомологии с последовательностью в области представляющей интерес.In certain embodiments, this disclosure relates to nuclease-mediated targeted integration of an exogenous sequence into the genome of a cell using the BCL11A enhancer region binding molecules described herein. As noted above, the insertion of an exogenous sequence (also called a donor sequence or donor or transgene), for example, to delete a specified region, to correct a mutant gene, to combine deletion of a specified region and correction of a mutant gene, or to increase expression of a wild-type gene. Obviously, the donor sequence is usually not identical to the genomic sequence into which it is inserted. The donor sequence may contain a nonhomologous sequence flanked by two regions of homology to provide efficient HDR at the location of interest, or may be integrated by nonhomologously directed repair mechanisms such as NHEJ. In addition, the donor sequences may contain a vector molecule containing sequences that are not homologous to the region of interest in the cellular chromatin. The donor molecule may contain multiple discontinuous regions of homology with cellular chromatin and, for example, result in deletion of the BCL11A enhancer region (or fragment thereof) when used as a substrate for DSB repair induced by one of the nucleases described herein. In addition, for the targeted insertion of sequences that are not normally present in the region of interest, the sequences may be present in the donor nucleic acid molecule and flanked by regions of homology to the sequence in the region of interest.

Полинуклеотиды для вставки могут также называться экзогенными полинуклеотидами, донорными полинуклеотидами или молекулами или трансгенами. Донорный полинуклеотид может быть ДНК или РНК, одноцепочечным или двухцепочечным, и может быть введен в клетку в линейной или циркулярной форме. См., например, публикации патентных заявок США № 2010/0047805 и 2011/0207221. Донорная последовательность(и) предпочтительно содержится в ДНК-МС, которая может быть введена в клетку в циркулярной или линейной форме. При введении в линейной форме концы донорной последовательности могут быть защищены (например, от экзонуклеолитической деградации) способами, известными специалистам в данной области техники. Например, один или более дидезоксинуклеотидных остатков добавляются к 3'-концу линейной молекулы, а самокомплементарные олигонуклеотиды необязательно лигированы с одним или обоими концами. См., например, Chang et al. (1987) Proc. Natl. Acad. Sci. USA84:4959-4963; Nehls et al. (1996) Science 272:886-889. Дополнительные способы защиты экзогенных полинуклеотидов от деградации включают, но не ограничиваются ими, добавление концевой аминогруппы(групп) и использование модифицированных межнуклеотидных соединений, таких как, например, фосфоротиоаты, фосфорамидаты и остатки О-метил рибозы или дезоксирибозы. При введении в двухцепочечной форме донор может включать один или более сайтов-мишеней нуклеазы, например, сайты-мишени нуклеазы, фланкирующие трансген, который должен быть интегрирован в геном клетки. См., например, публикацию патента США № 2013/0326645.Insertion polynucleotides may also be referred to as exogenous polynucleotides, donor polynucleotides, or molecules or transgenes. The donor polynucleotide can be DNA or RNA, single-stranded or double-stranded, and can be introduced into the cell in linear or circular form. See, for example, US Patent Application Publications No. 2010/0047805 and 2011/0207221. The donor sequence(s) are preferably contained in the DNA-MS, which can be introduced into the cell in a circular or linear form. When introduced in linear form, the ends of the donor sequence can be protected (eg, from exonucleolytic degradation) by methods known to those skilled in the art. For example, one or more dideoxynucleotide residues are added to the 3' end of a linear molecule, and self-complementary oligonucleotides are optionally ligated to one or both ends. See, for example, Chang et al. (1987) Proc. Natl. Acad. Sci. USA84:4959-4963; Nehls et al. (1996) Science 272:886–889. Additional methods for protecting exogenous polynucleotides from degradation include, but are not limited to, the addition of terminal amino group(s) and the use of modified internucleotide compounds, such as, for example, phosphorothioates, phosphoramidates, and O-methyl ribose or deoxyribose residues. When administered in double-stranded form, the donor may include one or more nuclease target sites, for example, nuclease target sites flanking the transgene to be integrated into the genome of the cell. See, for example, US Patent Publication No. 2013/0326645.

Полинуклеотид может быть введен в клетку как часть молекулы вектора, имеющей дополнительные последовательности, такие как, например, точки начала репликации, промоторы и гены, кодирующие устойчивость к антибиотикам. Кроме того, донорные полинуклеотиды могут быть введены в виде голой нуклеиновой кислоты, в виде нуклеиновой кислоты в комплексе с агентом, таким как липосома или полоксамер, или могут быть доставлены вирусами (например, аденовирусом, AAV, герпесвирусом, ретровирусом, лентивирусом и дефектным по интегразе лентивирусом (IDLV)).The polynucleotide can be introduced into a cell as part of a vector molecule having additional sequences such as, for example, origins of replication, promoters and genes encoding antibiotic resistance. In addition, donor polynucleotides may be administered as naked nucleic acid, as nucleic acid complexed with an agent such as a liposome or poloxamer, or may be delivered by viruses (eg, adenovirus, AAV, herpesvirus, retrovirus, lentivirus, and integrase-deficient virus). lentivirus (IDLV)).

В некоторых вариантах осуществления двухцепочечный донор включает в себя последовательности (например, кодирующие последовательности, также называемые трансгенами) длиной более 1 т. п.о., например, между 2 и 200 т. п.о., между 2 и 10 т. п.о. (или любым значением между ними). Двухцепочечный донор также включает, например, по меньшей мере один сайт-мишень нуклеазы. В определенных вариантах осуществления донор включает по меньшей мере 2 сайта-мишени, например, для пары ZFN или TALEN. Как правило, сайты-мишени нуклеазы находятся вне трансгенных последовательностей, например, 5' и/или 3' относительно трансгенных последовательностей для разрезания трансгена. Сайт(ы) разрезания нуклеазой может быть для любой нуклеазы(нуклеаз). В некоторых вариантах осуществления сайт(ы)-мишень(и) нуклеазы(нуклеаз), содержащиеся в двухцепочечном доноре, предназначены для той же самой нуклеазы(нуклеаз), которая используется для разрезания эндогенной мишени, в которую разрезанный донор интегрируется гомологически независимыми способами.In some embodiments, the double-stranded donor includes sequences (e.g., coding sequences, also called transgenes) greater than 1 kb in length, e.g., between 2 and 200 kb, between 2 and 10 kb .O. (or any value in between). The double-stranded donor also includes, for example, at least one nuclease target site. In certain embodiments, the donor includes at least 2 target sites, for example for a ZFN or TALEN pair. Typically, nuclease target sites are located outside the transgene sequences, for example, 5' and/or 3' relative to the transgene sequences for cutting the transgene. The nuclease cleavage site(s) can be for any nuclease(s). In some embodiments, the target site(s) of the nuclease(s) contained in the double-stranded donor are targeted to the same nuclease(s) that are used to cut the endogenous target into which the cut donor is integrated in homology-independent ways.

- 23 045868- 23 045868

Донор обычно встраивается таким образом, что его экспрессия управляется эндогенным промотором в сайте интеграции, а именно промотором, который управляет экспрессией эндогенного гена, в который встраивается донор (например, глобина, AAVS1 и т.д.). Однако будет очевидно, что донор может содержать промотор, энхансер и комбинации как промотора, так и энхансера, например, конститутивного промотора или индуцибельного или тканеспецифичного промотора.The donor is typically inserted such that its expression is driven by an endogenous promoter at the integration site, namely a promoter that drives the expression of the endogenous gene into which the donor is inserted (eg, globin, AAVS1, etc.). However, it will be appreciated that the donor may contain a promoter, an enhancer, and combinations of both promoter and enhancer, for example, a constitutive promoter or an inducible or tissue-specific promoter.

Донорная молекула может быть встроена в эндогенный ген таким образом, что весь эндогенный ген полностью или частично не экспрессируется. В других вариантах осуществления трансген (например, с последовательностями, кодирующими глобин или без них) интегрируется в любой эндогенный локус, например локус безопасной гавани (см., например, патентные публикации США №№ 2008/0299580; 2008/0159996 и 2010/00218264).The donor molecule may be inserted into an endogenous gene such that all or part of the endogenous gene is not expressed. In other embodiments, the transgene (e.g., with or without globin coding sequences) is integrated into any endogenous locus, such as a safe harbor locus (see, for example, US Patent Publications Nos. 2008/0299580; 2008/0159996 and 2010/00218264) .

Кроме того, хотя это и не требуется для экспрессии, экзогенные последовательности могут также включать транскрипционные или трансляционные регуляторные последовательности, например, промоторы, энхансеры, инсуляторы, внутренние сайты входа в рибосомы, последовательности, кодирующие пептиды 2А, сигналы полиаденилирования и их комбинации.In addition, although not required for expression, exogenous sequences may also include transcriptional or translational regulatory sequences, such as promoters, enhancers, insulators, internal ribosomal entry sites, sequences encoding 2A peptides, polyadenylation signals, and combinations thereof.

Трансгены, переносимые на донорных последовательностях, описанных в данном документе, могут быть выделены из плазмид, клеток или других источников с использованием стандартных методик, известных в данной области техники, таких как ПЦР. Доноры для использования могут включать в себя различные типы топологии, включая циркулярную суперспиральную, циркулярную релаксированную, линейную и тому подобное. Альтернативно, они могут быть химически синтезированы с использованием стандартных методов синтеза олигонуклеотидов. Кроме того, доноры могут быть метилированы или не иметь метилирования. Доноры могут быть в форме бактериальных или дрожжевых искусственных хромосом (ВАС или YAC).Transgenes carried on the donor sequences described herein can be isolated from plasmids, cells, or other sources using standard techniques known in the art, such as PCR. Donors for use may include various types of topologies, including circular supercoiled, circular relaxed, linear, and the like. Alternatively, they can be chemically synthesized using standard oligonucleotide synthesis methods. Additionally, donors may or may not be methylated. Donors can be in the form of bacterial or yeast artificial chromosomes (BAC or YAC).

Описанные в данном документе двухцепочечные донорные полинуклеотиды могут включать одно или более неприродных оснований, один или более остовов и комбинации одного или более неприродных оснований и одного или более остовов. В частности, вставка донорной молекулы с метилированными цитозинами может быть осуществлена с использованием способов, описанных в данном документе, для достижения состояния транскрипционного покоя в области представляющей интерес.The double-stranded donor polynucleotides described herein may include one or more non-natural bases, one or more backbones, and combinations of one or more non-natural bases and one or more backbones. In particular, the insertion of a donor molecule with methylated cytosines can be accomplished using the methods described herein to achieve transcriptional quiescence in the region of interest.

Экзогенный (донорный) полинуклеотид может содержать любую представляющую интерес последовательность (экзогенную последовательность). Типичные экзогенные последовательности включают, но не ограничиваются ими, любую кодирующую полипептид последовательность (например, кДНК), промоторные последовательности, энхансерные последовательности, эпитопные тэги, маркерные гены, сайты узнавания фермента разрезания и различные типы конструкций экспрессии. Маркерные гены включают, но не ограничиваются ими, последовательности, кодирующие белки, которые обеспечивают устойчивость к антибиотикам (например, устойчивость к ампициллину, устойчивость к канамицину, устойчивость к неомицину, устойчивость к G418, устойчивость к пуромицину, устойчивость к гигромицину, устойчивость к бластидину), последовательности, кодирующие окрашенные или флуоресцентные или люминесцентные белки (например, зеленый флуоресцентный белок, усиленный зеленый флуоресцентный белок, красный флуоресцентный белок, люциферазу) и белки, которые обеспечивают усиленный рост клеток и амплификацию генов (например, дигидрофолатредуктазу) и комбинации усиленного роста клеток и амплификации генов. Эпитопные тэги включают, например, одну или более копий FLAG, His, Мус, тэг тандемной аффинной очистки (ТАР), НА, биотинилируемый пептид или любую пригодную для обнаружения аминокислотную последовательность.The exogenous (donor) polynucleotide may contain any sequence of interest (exogenous sequence). Exemplary exogenous sequences include, but are not limited to, any polypeptide coding sequence (eg, cDNA), promoter sequences, enhancer sequences, epitope tags, marker genes, cutting enzyme recognition sites, and various types of expression constructs. Marker genes include, but are not limited to, sequences encoding proteins that confer antibiotic resistance (eg, ampicillin resistance, kanamycin resistance, neomycin resistance, G418 resistance, puromycin resistance, hygromycin resistance, blastidin resistance) , sequences encoding colored or fluorescent or luminescent proteins (eg, green fluorescent protein, enhanced green fluorescent protein, red fluorescent protein, luciferase) and proteins that promote enhanced cell growth and gene amplification (eg, dihydrofolate reductase) and combinations of enhanced cell growth and gene amplification. Epitope tags include, for example, one or more copies of FLAG, His, Myc, a tandem affinity purification (TAP) tag, HA, a biotinylatable peptide, or any detectable amino acid sequence.

В предпочтительном варианте осуществления экзогенная последовательность (трансген) содержит полинуклеотид, кодирующий любой полипептид, экспрессия которого в клетке желательна, включая, но не ограничиваясь этим, антитела, антигены, ферменты, рецепторы (клеточные или ядерные), гормоны, лимфокины, цитокины, репортерные полипептиды, факторы роста и функциональные фрагменты любого из вышеперечисленного. Кодирующими последовательностями могут быть, например, кДНК.In a preferred embodiment, the exogenous sequence (transgene) contains a polynucleotide encoding any polypeptide whose expression in a cell is desired, including, but not limited to, antibodies, antigens, enzymes, receptors (cellular or nuclear), hormones, lymphokines, cytokines, reporter polypeptides , growth factors and functional fragments of any of the above. The coding sequences may be, for example, cDNAs.

Например, экзогенная последовательность может содержать последовательность, кодирующую полипептид, который отсутствует или не функционирует у субъекта, имеющего генетическое заболевание, включая, но не ограничиваясь этим, любое из следующих генетических заболеваний: ахондроплазия, ахроматопсия, дефицит кислой мальтазы, дефицит аденозиндеаминазы (OMIM № 102700), адренолейкодистрофия, синдром Экарди, дефицит альфа-1-антитрипсина, альфа-талассемия, синдром нечувствительности к андрогенам, синдром Аперта, аритмогенный правожелудочковый, дисплазия, атаксия телеангиктазия, синдром Барта, бета-талассемия, синдром синего пузырчатого невуса, болезнь Канавана, хронические гранулематозные заболевания (CGD), синдром кошачего крика, муковисцидоз, Болезнь Деркума, эктодермальная дисплазия, анемия Фанкони, прогрессирующая фибродисплазия, Синдро м Ма ртина, галактоземия, болезнь Гоше, генерализованный ганглиозидоз, например, ГМ1), мутация гемоглобина С в 6 кодоне бета-глобина (HbC), гемофилия, болезнь Хантингтона, Синдром Гурлера, гипофосфатазия, синдром Клайнфлетера, болезнь Краббе, синдром Лангера-Гидиона, дефицит адгезии лейкоцитов (LAD, OMIM № 116920), лейкодистрофия, синдром удлиненного интервала QT, синдром Марфана, синдром Мебиуса, мукополисахаридоз (MPS), синдром patella ногтя, нефрогенный несахарный диабет, нейрофиброматоз, болезнь Неймана-Пика, синдром ломких костей, порфирия, синдром Прадера-Вилли, прогерия,For example, the exogenous sequence may contain a sequence encoding a polypeptide that is absent or nonfunctional in a subject having a genetic disease, including, but not limited to, any of the following genetic diseases: achondroplasia, achromatopsia, acid maltase deficiency, adenosine deaminase deficiency (OMIM No. 102700 ), adrenoleukodystrophy, Ecardi syndrome, alpha-1-antitrypsin deficiency, alpha thalassemia, androgen insensitivity syndrome, Apert syndrome, arrhythmogenic right ventricular, dysplasia, ataxia telangictasia, Barth syndrome, beta thalassemia, blue vesicular nevus syndrome, Canavan disease, chronic granulomatous diseases (CGD), Cri de Cat syndrome, cystic fibrosis, Dercum's disease, ectodermal dysplasia, Fanconi anemia, progressive fibrodysplasia, Martin syndrome, galactosemia, Gaucher disease, generalized gangliosidosis, e.g. GM1), hemoglobin C mutation at codon 6 beta-globin (HbC), hemophilia, Huntington's disease, Hurler's syndrome, hypophosphatasia, Klineflether syndrome, Krabbe disease, Langer-Giedion syndrome, leukocyte adhesion deficiency (LAD, OMIM no. 116920), leukodystrophy, long QT syndrome, Marfan syndrome, syndrome Moebius, mucopolysaccharidosis (MPS), patella nail syndrome, nephrogenic diabetes insipidus, neurofibromatosis, Neumann-Pick disease, brittle bone syndrome, porphyria, Prader-Willi syndrome, progeria,

- 24 045868 синдром Протея, ретинобластома, синдром Ретта, синдром Рубинштейна-Тайби, синдром Санфилиппо, синдром тяжелого комбинированного иммунодефицита (SCID), синдром Швахмана, серповидноклеточная болезнь (серповидноклеточная анемия), синдром Смита-Магениса, синдром Стиклера, болезнь ТеяСакса, синдром тромбоцитопении с отсутствием лучевой кости (TAR), синдром Тришера-Коллинза, трисомия, туберозный склероз, синдром Тернера, нарушение цикла мочевины, болезнь Гиппеля - Линдау, синдром Варденбурга, синдром Вильямса, болезнь Вильсона, синдром Вискотта-Олдрича, Х-сцепленный лимфопролиферативный синдром (XLP, OMIM № 308240).- 24 045868 Proteus syndrome, retinoblastoma, Rett syndrome, Rubinstein-Taybi syndrome, Sanfilippo syndrome, severe combined immunodeficiency syndrome (SCID), Shwachman syndrome, sickle cell disease (sickle cell anemia), Smith-Magenis syndrome, Stickler syndrome, Tay-Sachs disease, thrombocytopenia syndrome with absent radius (TAR), Trisher-Collins syndrome, trisomy, tuberous sclerosis, Turner syndrome, urea cycle disorder, Hippel-Lindau disease, Wardenburg syndrome, Williams syndrome, Wilson disease, Wiskott-Aldrich syndrome, X-linked lymphoproliferative syndrome ( XLP, OMIM No. 308240).

Дополнительные иллюстративные заболевания, которые можно лечить путем целенаправленной интеграции, включают приобретенные иммунодефициты, лизосомные болезни накопления (например, болезнь Гоше, GM1, болезнь Фабри и болезнь Тея-Сакса), мукополисахахидоз (например, болезнь Хантера, болезнь Гурлера), гемоглобинопатии (например, серповидноклеточная анемия, НЬС, α-талассемия, β-талассемия) и гемофилии.Additional illustrative diseases that may be treated by targeted integration include acquired immunodeficiencies, lysosomal storage diseases (eg, Gaucher disease, GM1, Fabry disease, and Tay-Sachs disease), mucopolysacchidosis (eg, Hunter disease, Hurler disease), hemoglobinopathies (eg, sickle cell anemia, HLS, α-thalassemia, β-thalassemia) and hemophilia.

В некоторых вариантах осуществления экзогенные последовательности могут содержать маркерный ген (описанный выше), позволяющий выбирать клетки, которые подверглись целевой интеграции, и связанную последовательность, кодирующую дополнительную функциональность. Неограничивающие примеры маркерных генов включают GFP, маркер(ы) для селекции антибиотиками и тому подобное.In some embodiments, the exogenous sequences may comprise a marker gene (described above) allowing selection of cells that have undergone targeted integration, and an associated sequence encoding additional functionality. Non-limiting examples of marker genes include GFP, antibiotic selection marker(s), and the like.

Дополнительные генные последовательности, которые могут быть вставлены, могут включать, например, гены дикого типа для замены мутированных последовательностей. Например, последовательность гена фактора IX дикого типа может быть вставлена в геном стволовой клетки, в которой мутирована эндогенная копия гена. Копия дикого типа может быть вставлена в эндогенный локус или, в качестве альтернативы, может быть нацелена на локус безопасной гавани.Additional gene sequences that may be inserted may include, for example, wild-type genes to replace mutated sequences. For example, a wild-type factor IX gene sequence can be inserted into the genome of a stem cell in which the endogenous copy of the gene is mutated. The wild-type copy may be inserted at an endogenous locus or, alternatively, may be targeted to a safe harbor locus.

Конструирование таких экспрессионных кассет, следуя указаниям данного описания, использует методологии, хорошо известные в области молекулярной биологии (см., например, Ausubel или Maniatis). Перед использованием экспрессионной кассеты для создания трансгенного животного можно проверить чувствительность экспрессионной кассеты к индуктору стресса, связанному с выбранными контрольными элементами, путем введения экспрессионной кассеты в подходящую клеточную линию (например, первичные клетки, трансформированные клетки, или иммортализованные клеточные линии).The construction of such expression cassettes, following the instructions of this description, uses methodologies well known in the field of molecular biology (see, for example, Ausubel or Maniatis). Before using an expression cassette to create a transgenic animal, the sensitivity of the expression cassette to the stress inducer associated with selected control elements can be tested by introducing the expression cassette into a suitable cell line (eg, primary cells, transformed cells, or immortalized cell lines).

Кроме того, хотя это и не требуется для экспрессии, экзогенные последовательности могут также содержать транскрипционные или трансляционные регуляторные последовательности, например, промоторы, энхансеры, инсуляторы, сайты внутренней посадки рибосомы, последовательности, кодирующие пептиды 2А, сигналы полиаденилирования и комбинации полипептидов 2А и сигналов полиаденилирования. Кроме того, контрольные элементы представляющих интерес генов могут быть функционально связаны с репортерными генами для создания химерных генов (например, репортерных кассет экспрессии).In addition, although not required for expression, exogenous sequences may also contain transcriptional or translational regulatory sequences, such as promoters, enhancers, insulators, internal ribosome entry sites, sequences encoding 2A peptides, polyadenylation signals, and combinations of 2A polypeptides and polyadenylation signals . In addition, control elements of genes of interest can be operably linked to reporter genes to create chimeric genes (eg, reporter expression cassettes).

Целевая вставка некодирующей последовательности нуклеиновой кислоты также может быть осуществлена.Targeted insertion of a non-coding nucleic acid sequence can also be accomplished.

Последовательности, кодирующие антисмысловые РНК, РНКи, кшРНК (shRNA) и микроРНК (miRNA), также могут быть использованы для целевых вставок.Sequences encoding antisense RNAs, RNAi, shRNAs (shRNAs) and microRNAs (miRNAs) can also be used for targeted insertions.

В дополнительных вариантах осуществления донорная нуклеиновая кислота может содержать некодирующие последовательности, которые являются специфическими сайтами-мишенями для дополнительных конструкций нуклеаз. Впоследствии дополнительные нуклеазы могут быть экспрессированы в клетках так, что исходная донорная молекула расщепляется и модифицируется путем вставки другой представляющей интерес донорной молекулы. Таким образом, могут генерироваться повторяющиеся интеграции донорных молекул, позволяющие укладывать признаки в конкретном интересующем локусе или в локусе безопасной гавани.In additional embodiments, the donor nucleic acid may contain non-coding sequences that are specific target sites for additional nuclease constructs. Subsequently, additional nucleases can be expressed in cells such that the original donor molecule is cleaved and modified by insertion of another donor molecule of interest. In this way, iterative integrations of donor molecules can be generated, allowing traits to be stacked at a specific locus of interest or a safe harbor locus.

ДоставкаDelivery

Нуклеазы, как описано в данном документе (табл. 1), полинуклеотиды, кодирующие эти нуклеазы, донорные полинуклеотиды и композиции, содержащие белки, полинуклеотиды и комбинации белков и полинуклеотидов, описанные в данном документе, могут доставляться in vivo или ex vivo любым подходящим способом в любой тип клеток.Nucleases as described herein (Table 1), polynucleotides encoding these nucleases, donor polynucleotides and compositions containing proteins, polynucleotides and combinations of proteins and polynucleotides described herein can be delivered in vivo or ex vivo by any suitable method to any cell type.

Подходящие клетки включают эукариотические (например, животные) и прокариотические клетки и эукариотические и прокариотические клеточные линии. Неограничивающие примеры таких клеток или клеточных линий, полученных из таких клеток, включают COS, СНО (например, CHO-S, CHO-K1, CHODG44, СНО-DUXBll, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, SP2/0-Ag14, HeLa, HEK293 (например, HEK293-F, HEK293-H, HEK293-T) и клетки perC6, а также клетки насекомых, такие как Spodoptera fugiperda (Sf) или грибковые клетки, такие как клетки Saccharomyces, Pichia и Schizosaccharomyces. В некоторых вариантах осуществления клеточная линия представляет собой клеточную линию СНО, MDCK или HEK293. Подходящие клетки также включают стволовые клетки, такие как, например, эмбриональные стволовые клетки, индуцированные плюрипотентные стволовые клетки, гемопоэтические стволовые клетки, нейрональные стволовые клетки и мезенхимальные стволовые клетки.Suitable cells include eukaryotic (eg animal) and prokaryotic cells and eukaryotic and prokaryotic cell lines. Non-limiting examples of such cells or cell lines derived from such cells include COS, CHO (eg, CHO-S, CHO-K1, CHODG44, CHO-DUXBll, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28 -G3, BHK, HaK, NSO, SP2/0-Ag14, HeLa, HEK293 (e.g. HEK293-F, HEK293-H, HEK293-T) and perC6 cells, as well as insect cells such as Spodoptera fugiperda (Sf) or fungal cells such as Saccharomyces, Pichia and Schizosaccharomyces cells. In some embodiments, the cell line is a CHO, MDCK, or HEK293 cell line. Suitable cells also include stem cells such as, for example, embryonic stem cells, induced pluripotent stem cells, hematopoietic stem cells, neuronal stem cells and mesenchymal stem cells.

- 25 045868- 25 045868

Способы доставки нуклеаз, как описано в данном документе, описаны, например, в патентах США №№ 6453242; 6503717; 6534261; 6599692; 6607882; 6689558; 6824978; 6933113; 6979539; 7013219 и 7163824, раскрытия всех из которых включены в данный документ посредством ссылки во всей их полноте.Methods for delivering nucleases as described herein are described, for example, in US Pat. Nos. 6,453,242; 6503717; 6534261; 6599692; 6607882; 6689558; 6824978; 6933113; 6979539; 7013219 and 7163824, all of which are incorporated herein by reference in their entirety.

Нуклеазы, донорные конструкции и комбинации нуклеаз и донорных конструкций, как описано в данном документе, также могут быть доставлены с использованием векторов, содержащих последовательности, кодирующие одну или более ZFN, описанных в данном документе. Могут быть использованы любые векторные системы, включая, но не ограничиваясь этим, плазмидные векторы, ретровирусные векторы, лентивирусные векторы, аденовирусные векторы, поксвирусные векторы; герпесвирусные векторы и аденоассоциированные вирусные векторы и др. См. также патенты США № 6534261; 6607882; 6824978; 6933113; 6979539; 7013219 и 7163824, полностью включенные в данное описание посредством ссылки. Кроме того, будет очевидно, что любой из этих векторов может содержать одну или более последовательностей, необходимых для лечения. Таким образом, когда одну или более нуклеаз и донорную конструкцию вводят в клетку, нуклеазы, донорный полинуклеотид и комбинации нуклеаз и донорного полинуклеотида могут переноситься на одном и том же векторе или на разных векторах (ДНК МС). Когда используются несколько векторов, каждый вектор может содержать последовательность, кодирующую одну или более нуклеаз, одну или более донорных конструкций и комбинации одной или большего количества нуклеаз и одной или большего количества донорных конструкций. Обычные способы переноса генов на вирусной и невирусной основе могут быть использованы для введения нуклеиновых кислот, кодирующих нуклеазы, донорные конструкции и комбинаций нуклеаз и донорных конструкций в клетки (например, клетки млекопитающих) и ткани-мишени. Системы доставки не основанные на вирусных векторах включают ДНК или РНК плазмиды, ДНК-МС, голую нуклеиновую кислоту и нуклеиновую кислоту в комплексе с носителем для доставки, таким как липосома или полоксамер. Подходящие невирусные векторы включают нанотаксис векторы, включая векторы, коммерчески доступные от InCellArt (Франция). Системы доставки вирусных векторов включают ДНК- и РНК-вирусы, которые имеют или эписомальные или интегрированные геномы после доставки в клетку. Для ознакомления с доставкой in vivo сконструированных ДНК-связывающих белков и гибридных белков, содержащих эти связывающие белки, см., например, Rebar (2004) Expert Opinion Invest. Drugs 13(7):829-839; Rossi et al. (2007) Nature Biotech. 25(12):1444-1454 также как и общие статьи по доставке генов Anderson, Science 256:SOS-SIS (1992); Nabel & Feigner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6 (10):11491154 (1988); Vigne, Restorative Neurology и Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., в Current Topics in Microbiology and Immunology Doerfler and Bohm (eds.) (1995); and Yu et al., Gene Therapy 1:13-26 (1994).Nucleases, donor constructs, and combinations of nucleases and donor constructs, as described herein, can also be delivered using vectors containing sequences encoding one or more ZFNs described herein. Any vector systems can be used, including, but not limited to, plasmid vectors, retroviral vectors, lentiviral vectors, adenoviral vectors, poxviral vectors; herpesvirus vectors and adeno-associated viral vectors, etc. See also US patents No. 6534261; 6607882; 6824978; 6933113; 6979539; 7013219 and 7163824, which are incorporated herein by reference in their entirety. In addition, it will be appreciated that any of these vectors may contain one or more sequences necessary for treatment. Thus, when one or more nucleases and a donor construct are introduced into a cell, the nucleases, donor polynucleotide, and combinations of nucleases and donor polynucleotide can be carried on the same vector or on different vectors (DNA MS). When multiple vectors are used, each vector may contain sequence encoding one or more nucleases, one or more donor constructs, and combinations of one or more nucleases and one or more donor constructs. Conventional viral and non-viral gene transfer methods can be used to introduce nucleic acids encoding nucleases, donor constructs, and combinations of nucleases and donor constructs into cells (eg, mammalian cells) and target tissues. Delivery systems not based on viral vectors include DNA or RNA plasmids, DNA-MS, naked nucleic acid, and nucleic acid complexed with a delivery vehicle such as a liposome or poloxamer. Suitable non-viral vectors include nanotaxis vectors, including those commercially available from InCellArt (France). Viral vector delivery systems include DNA and RNA viruses that have either episomal or integrated genomes after delivery into the cell. For in vivo delivery of engineered DNA-binding proteins and fusion proteins containing these binding proteins, see, for example, Rebar (2004) Expert Opinion Invest. Drugs 13(7):829–839; Rossi et al. (2007) Nature Biotech. 25(12):1444-1454 as well as general articles on gene delivery Anderson, Science 256:SOS-SIS (1992); Nabel & Feigner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):11491154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bohm (eds.) (1995); and Yu et al., Gene Therapy 1:13-26 (1994).

Методы невирусной доставки нуклеиновых кислот включают электропорацию, липофекцию, микроинъекцию, биолистику, виросомы, липосомы, иммунолипосомы, конъюгаты поликатион или липид:нуклеиновая кислота, голую ДНК, искусственные вирионы, деформацию мембраны и усиленное агентом поглощение ДНК. Сонопорация с использованием, например, системы Sonitron 2000 (Rich-Mar) также может быть использована для доставки нуклеиновых кислот.Methods for non-viral delivery of nucleic acids include electroporation, lipofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, membrane deformation and agent-enhanced DNA uptake. Sonoporation using, for example, the Sonitron 2000 system (Rich-Mar) can also be used to deliver nucleic acids.

Дополнительные иллюстративные системы доставки нуклеиновых кислот включают системы, предоставляемые Amaxa Biosystems (Кельн, Германия), Maxcyte, Inc. (Роквил, Мэриленд), ВТХ Molecular Delivery Systems (Хьюстон, Масчусетс) и Copernicus Therapeutics Inc. (см., например, US 6008336). Липофекция описана, например, в патентах США №№ 5049386; 4946787 и 4897355 и реагенты для липофекции продаются коммерчески (например, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции полинуклеотидов опосредованной рецепторами, включают липиды Feigner, WO 91/17424, WO 91/16024.Additional exemplary nucleic acid delivery systems include those available from Amaxa Biosystems (Cologne, Germany), Maxcyte, Inc. (Rockville, MD), BTX Molecular Delivery Systems (Houston, MA) and Copernicus Therapeutics Inc. (see, for example, US 6008336). Lipofection is described, for example, in US patent No. 5049386; 4946787 and 4897355 and lipofection reagents are commercially available (eg, Transfectam™ and Lipofectin™). Cationic and neutral lipids that are suitable for effective receptor-mediated lipofection of polynucleotides include Feigner lipids, WO 91/17424, WO 91/16024.

Получение комплексов липид:нуклеиновая кислота, включая целевые липосомы, такие как иммунолипидные комплексы, хорошо известно специалисту в данной области техники (см., например, Crystal, Science 270: 404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); патенты США №№ 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787). Другие комплексы липид:нуклеиновая кислота включают комплексы, включающие новые катионные липиды, новые пегилированные липиды и комбинации новых катионных липидов и новых пегилированных липидов (см. например, предварительные заявки на патент США №№ 62/432042 и 62/458373).The preparation of lipid:nucleic acid complexes, including target liposomes such as immunolipid complexes, is well known to one skilled in the art (see, for example, Crystal, Science 270: 404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710722 (1995), Ahmad et al., Cancer Res. 946787). Other lipid:nucleic acid complexes include complexes comprising novel cationic lipids, novel PEGylated lipids, and combinations of novel cationic lipids and novel PEGylated lipids (see, for example, US Provisional Application Nos. 62/432,042 and 62/458,373).

Дополнительные способы доставки включают использование упаковки нуклеиновых кислот для доставки в средства доставки EnGeneIC (EDV). Эти EDV специфически доставляются в ткани-мишени с использованием биспецифичных антител, причем одно плече антитела обладает специфичностью к ткани-мишени, а другое специфично для EDV. Антитело доставляет EDV к поверхности клетки-мишени, а затем EDV вводится в клетку путем эндоцитоза. Попадая в клетку, содержимое высвобождается (см. MacDiarmid et al. (2009) Nature Biotechnology 27(7):643).Additional delivery methods include the use of nucleic acid packaging for delivery into EnGeneIC delivery vehicles (EDVs). These EDVs are specifically delivered to target tissues using bispecific antibodies, with one arm of the antibody being specific for the target tissue and the other being specific for the EDV. The antibody delivers EDV to the surface of the target cell, and then EDV is introduced into the cell by endocytosis. Once inside the cell, the contents are released (see MacDiarmid et al. (2009) Nature Biotechnology 27(7):643).

Использование РНК или ДНК систем на вирусной основе для доставки нуклеиновых кислот, кодиUse of RNA or DNA virus-based systems for delivery of nucleic acids

- 26 045868 рующих сконструированные системы ZFP, TALE и CRISPR/Cas пользуется преимуществом хорошо разработанных процессов для нацеливания вируса на конкретные клетки организма и передачи груза, который несет вирус в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo) или их можно использовать для обработки клеток in vitro и модифицированные клетки вводят пациентам (ex vivo). Обычные вирусные системы для доставки ZFP включают, но не ограничиваются ими, ретровирусные, лентивирусные, аденовирусные, адено-ассоциированные вирусные векторы, векторы вируса коровьей оспы и простого герпеса для переноса генов. Интеграция в геном хозяина возможна при использовании методов переноса генов использующих ретровирусы, лентивирусы и аденоассоциированные вирусы, что часто приводит к длительной экспрессии вставленного трансгена. Кроме того, высокая эффективность трансдукции наблюдалась во многих различных типах клеток и тканях-мишенях.- 26 045868 engineered systems ZFP, TALE and CRISPR/Cas take advantage of well-developed processes for targeting the virus to specific cells in the body and transferring the cargo the virus carries into the nucleus. Viral vectors can be administered directly to patients (in vivo) or they can be used to treat cells in vitro and the modified cells are administered to patients (ex vivo). Common viral systems for delivering ZFP include, but are not limited to, retroviral, lentiviral, adenoviral, adeno-associated viral vectors, vaccinia virus vectors, and herpes simplex virus vectors for gene transfer. Integration into the host genome is possible using gene transfer methods using retroviruses, lentiviruses and adeno-associated viruses, which often leads to long-term expression of the inserted transgene. In addition, high transduction efficiency was observed in many different cell types and target tissues.

Тропизм ретровируса может быть изменен путем включения чужеродных белков оболочки, что расширяет потенциальную целевую популяцию клеток-мишеней. Лентивирусные векторы представляют собой ретровирусные векторы, которые способны трансдуцировать или инфицировать неделящиеся клетки и обычно продуцируют высокие вирусные титры. Выбор ретровирусной системы переноса генов зависит от ткани-мишени. Ретровирусные векторы состоят из цис- действующих длинных концевых повторов с упаковочной способностью до 6-10 т. п.н. чужеродной последовательности. Минимальные цисдействующие LTR достаточны для репликации и упаковки векторов, которые затем используются для интеграции терапевтического гена в клетку-мишень для обеспечения постоянной экспрессии трансгена. Широко используемые ретровирусные векторы включают векторы, основанные на вирусе мышиного лейкоза (MuLV), вирусе лейкемии гиббоновых обезьян (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (ВИЧ) и их комбинациях (см., например, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US 94/05700).Retrovirus tropism can be altered by the incorporation of foreign envelope proteins, thereby expanding the potential target cell population. Lentiviral vectors are retroviral vectors that are capable of transducing or infecting nondividing cells and typically produce high viral titers. The choice of retroviral gene transfer system depends on the target tissue. Retroviral vectors consist of cis-acting long terminal repeats with packaging capacity of up to 6-10 kb. foreign sequence. Minimal cis-acting LTRs are sufficient to replicate and package vectors, which are then used to integrate the therapeutic gene into the target cell to ensure persistent transgene expression. Commonly used retroviral vectors include those based on murine leukemia virus (MuLV), gibbon leukemia virus (GaLV), simian immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof (see, for example, Buchscher et al. , J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US 94/05700).

В приложениях, в которых временная экспрессия является предпочтительной, могут использоваться системы на основе аденовируса. Векторы на основе аденовируса способны к очень высокой эффективности трансдукции во многих типах клеток и не требуют деления клеток. С такими векторами получали высокий титр и высокий уровень экспрессии. Этот вектор может быть получен в больших количествах в относительно простой системе. Векторы аденоассоциированного вируса (AAV) также используются для трансдукции клеток нуклеиновыми кислотами-мишенями, например, в производстве нуклеиновых кислот и пептидов in vitro, и для процедур генной терапии in vivo и ex vivo (см., например, West et al., Virology 160: 38-47 (1987); патент США № 4797368; WO 93/24641; Kotin Human Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Конструирование рекомбинантных AAV-векторов описано в ряде публикаций, в том числе в патенте США 5173414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); and Samulski et al., J. Virol. 63:03822-3828 (1989).For applications where transient expression is preferred, adenovirus-based systems can be used. Adenovirus-based vectors are capable of very high transduction efficiency in many cell types and do not require cell division. With such vectors, high titers and high expression levels were obtained. This vector can be produced in large quantities in a relatively simple system. Adeno-associated virus (AAV) vectors are also used to transduce cells with target nucleic acids, such as in vitro production of nucleic acids and peptides, and for in vivo and ex vivo gene therapy procedures (see, e.g., West et al., Virology 160 : 38-47 (1987); US Patent No. 4797368; WO 93/24641; Kotin Human Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994) Construction of recombinant AAV vectors described in a number of publications, including US Pat. No. 5,173,414; Tratschin, et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); and Samulski et al., J. Virol. 63:03822-3828 (1989).

По крайней мере, шесть подходов к вирусным векторам в настоящее время доступны для переноса генов в клинических испытаниях, в которых используются подходы, которые включают комплементацию дефектных векторов генами, вставленными в линии вспомогательных клеток для генерации трансдуцирующего агента.At least six viral vector approaches are currently available for gene transfer in clinical trials, which use approaches that involve complementation of defective vectors with genes inserted into helper cell lines to generate the transducing agent.

pLASN и MFG-S являются примерами ретровирусных векторов, которые использовались в клинических испытаниях (Dunbar et al., Blood 85: 3048-305 (1995); Kohn et al., Nat. Med. 1: 1017-102 (1995); Malech et al., PNAS 94:22 12133-12138 (1997)). PA317/pLASN был первым терапевтическим вектором, использованным в испытании генной терапии. (Blaese et al., Science 270:475-480 (1995)). Эффективность трансдукции 50% или более наблюдалась для упакованных векторов MFG-S (Ellem et al., Immunol Immunother. 44(1):10-20 (1997); Dranoff et al., Hum. Gene Ther. 1:111-2 (1997).pLASN and MFG-S are examples of retroviral vectors that have been used in clinical trials (Dunbar et al., Blood 85: 3048-305 (1995); Kohn et al., Nat. Med. 1: 1017-102 (1995); Malech et al., PNAS 94:22 12133-12138 (1997)). PA317/pLASN was the first therapeutic vector used in a gene therapy trial. (Blaese et al., Science 270:475-480 (1995)). Transduction efficiencies of 50% or greater have been observed for packaged MFG-S vectors (Ellem et al., Immunol Immunother. 44(1):10-20 (1997); Dranoff et al., Hum. Gene Ther. 1:111-2 ( 1997).

Рекомбинантные аденоассоциированные вирусные векторы (rAAV) представляют собой многообещающие альтернативные системы доставки генов, основанные на дефектном и непатогенном аденоассоциированном вирусе типа 2, относящемся к семейству парвовирусов. Все векторы получены из плазмиды, которая содержит только инвертированные концевые повторы AAV длиной 145 п.н., фланкирующие кассету экспрессии трансгена. Эффективный перенос генов и стабильная доставка трансгенов благодаря интеграции в геномы трансдуцированной клетки являются ключевыми характеристиками этой векторной системы. (Wagner et al., Lancet 351:9117 1702-3 (1998), Kearns et al., Gene Ther. 9:748-55 (1996)). Другие серотипы AAV, включая AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 и AAVrh. 10 и любой новый серотип AAV, также могут быть использованы в соответствии с данным изобретением.Recombinant adeno-associated virus vectors (rAAV) are promising alternative gene delivery systems based on the defective and non-pathogenic adeno-associated virus type 2, a member of the parvovirus family. All vectors are derived from a plasmid that contains only 145-bp AAV inverted terminal repeats flanking the transgene expression cassette. Efficient gene transfer and stable delivery of transgenes through integration into the genomes of the transduced cell are key characteristics of this vector system. (Wagner et al., Lancet 351:9117 1702-3 (1998), Kearns et al., Gene Ther. 9:748-55 (1996)). Other AAV serotypes including AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 and AAVrh. 10 and any new AAV serotype can also be used in accordance with this invention.

Неспособные к репликации рекомбинантные аденовирусные векторы (Ad) могут продуцироваться с высоким титром и легко инфицировать ряд различных типов клеток. Большинство аденовирусных векторов сконструированы таким образом, что трансген заменяет гены Ad E1a, E1b или Е3; впоследствии вектор с дефектом репликации размножается в 293 клетках человека, которые обеспечивают функцию удаленных генов в транс положении. Ad векторы могут трансдуцировать различные типы тканей in vivo, включая неделящиеся, дифференцированные клетки, такие как клетки печени, почек и мышц. Обычные Ad векторы имеют большую несущую способность. Пример использования Ad вектора в клинических испытаниях включал полинуклеотидную терапию для противоопухолевой иммунизации с помощьюReplication-incompetent recombinant adenovirus (Ad) vectors can be produced at high titers and readily infect a number of different cell types. Most adenoviral vectors are designed so that the transgene replaces the Ad E1a, E1b, or E3 genes; the replication-defective vector subsequently replicates in 293 human cells that provide the function of the deleted genes in trans. Ad vectors can transduce various tissue types in vivo, including nondividing, differentiated cells such as liver, kidney, and muscle cells. Conventional Ad vectors have a high load-bearing capacity. An example of the use of an Ad vector in clinical trials included polynucleotide therapy for antitumor immunization using

- 27 045868 внутримышечной инъекции (Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)). Дополнительные примеры использования аденовирусных векторов для переноса генов в клинических испытаниях включают Rosenecker et al., Infection 24:1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7 1083-1089 (1998); Welsh et al., Hum. Gene Ther. 2:205-18 (1995); Alvarez et al., Hum. Gene Ther. 5:597-613 (1997); Topf et al., Gene Ther. 5:507-513 (1998); Sterman et al., Hum. Gene Ther. 7:1083-1089 (1998).- 27 045868 intramuscular injection (Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)). Additional examples of the use of adenoviral vectors for gene transfer in clinical trials include Rosenecker et al., Infection 24:1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7 1083-1089 (1998); Welsh et al., Hum. Gene Ther. 2:205-18 (1995); Alvarez et al., Hum. Gene Ther. 5:597-613 (1997); Topf et al., Gene Ther. 5:507-513 (1998); Sterman et al., Hum. Gene Ther. 7:1083-1089 (1998).

Упаковочные клетки используются для формирования вирусных частиц, которые способны инфицировать клетку-хозяин. Такие клетки включают клетки HEK293 и Sf9, которые можно использовать для упаковки AAV и аденовируса, и клетки ψ2 или клетки РА317, которые упаковывают ретровирус. Вирусные векторы, используемые в генной терапии, обычно генерируются линией клеток-продуцентов, которая упаковывает вектор нуклеиновой кислоты в вирусную частицу. Векторы обычно содержат минимальные вирусные последовательности, необходимые для упаковки и последующей интеграции в хозяина (если применимо), при этом другие вирусные последовательности заменяются экспрессионной кассетой, кодирующей экспрессируемый белок. Отсутствующие вирусные функции обеспечиваются в транс положении упаковочной клеточной линией. Например, векторы AAV, используемые в генной терапии, обычно содержат только последовательности инвертированных концевых повторов (ITR) из генома AAV, которые необходимы для упаковки и интеграции в геном хозяина. Вирусная ДНК упакована в клеточную линию, которая содержит хелперную плазмиду, кодирующую другие гены AAV, а именно rep и cap, но без последовательностей ITR. Клеточная линия также инфицирована аденовирусом в качестве хелпера. Хелперный вирус способствует репликации вектора AAV и экспрессии генов AAV с хелпеперной плазмиды. Хелперная плазмида не упакована в значительных количествах из-за отсутствия последовательностей ITR.Packaging cells are used to form viral particles that are capable of infecting a host cell. Such cells include HEK293 and Sf9 cells, which can be used to package AAV and adenovirus, and ψ2 cells or PA317 cells, which package retrovirus. Viral vectors used in gene therapy are typically generated by a producer cell line that packages a nucleic acid vector into a viral particle. Vectors typically contain the minimal viral sequences necessary for packaging and subsequent integration into the host (if applicable), with other viral sequences being replaced by an expression cassette encoding the protein to be expressed. The missing viral functions are provided in trans by the packaging cell line. For example, AAV vectors used in gene therapy typically contain only inverted terminal repeat (ITR) sequences from the AAV genome, which are required for packaging and integration into the host genome. The viral DNA is packaged into a cell line that contains a helper plasmid encoding other AAV genes, namely rep and cap, but without the ITR sequences. The cell line is also infected with adenovirus as a helper. The helper virus promotes replication of the AAV vector and expression of AAV genes from the helper plasmid. The helper plasmid is not packaged in significant quantities due to the lack of ITR sequences.

Загрязнение аденовирусом может быть уменьшено, например, тепловой обработкой, к которой аденовирус более чувствителен, чем AAV. В некоторых вариантах осуществления AAV получают с использованием бакуловирусной экспрессионной системы (см., например, патенты США №№ 6723551 и 7271002).Adenovirus contamination can be reduced, for example, by heat treatment, to which adenovirus is more sensitive than AAV. In some embodiments, AAV is produced using a baculovirus expression system (see, for example, US Pat. Nos. 6,723,551 and 7,271,002).

Очистка частиц AAV из 293 или бакуловирусной системы обычно включает рост клеток, которые продуцируют вирус, с последующим сбором вирусных частиц из клеточного супернатанта или лизирование клеток и сбор вируса из неочищенного лизата. AAV затем очищают с помощью методов, известных в данной области техники, включая ионообменнеую хроматографию (например, смотри патент США №№ 7419817 и 6989264), ионообменной хроматографии и центрифугирование в градиенте плотности CsCl (например, в публикации РСТ WO 2011094198A10), иммуноаффинной хроматографии (например, WO 2016128408) или очистка с использованием AVB сефарозы (например, GE Healthcare Life Sciences).Purification of AAV particles from the 293 or baculovirus system typically involves growing the cells that produce the virus, followed by collection of the virus particles from the cell supernatant, or lysing the cells and collecting the virus from the crude lysate. AAV is then purified using methods known in the art, including ion exchange chromatography (for example, see US patent Nos. 7419817 and 6989264), ion exchange chromatography and CsCl density gradient centrifugation (for example, PCT publication WO 2011094198A10), immunoaffinity chromatography ( eg WO 2016128408) or purification using AVB Sepharose (eg GE Healthcare Life Sciences).

Во многих применениях генной терапии желательно, чтобы вектор генной терапии доставлялся с высокой степенью специфичности к конкретному типу ткани. Соответственно, вирусный вектор может быть модифицирован для придания специфичности для данного типа клеток путем экспрессии лиганда в виде белка слияния с белком оболочки вируса на внешней поверхности вируса. Выбирается лиганд, который имеет сродство к рецептору, о котором известно, что он присутствует в типе клеток представляющих интерес. Например, Han et al., Proc. Natl. Acad. Sci. USA 92: 9747-9751 (1995), сообщили, что вирус лейкоза мышей Молони может быть модифицирован для экспрессии человеческого герегулина слитого с gp70, и указанный рекомбинантный вирус инфицирует некоторые клетки рака молочной железы человека, экспрессирующие рецептор эпидермального фактора роста человека. Этот принцип может быть распространен на другие пары вирус-клетка-мишень, в которых клетка-мишень экспрессирует рецептор, а вирус экспрессирует гибридный белок, содержащий лиганд для рецептора на поверхности клетки. Например, нитевидный фаг может быть сконструирован для выставления на поверхности фрагментов антител (например, FAB или Fv), имеющих специфическую аффинность связывания практически с любым выбранным клеточным рецептором. Хотя приведенное выше описание относится в первую очередь к вирусным векторам, те же принципы могут быть применены к невирусным векторам. Такие векторы могут быть сконструированы так, чтобы они содержали определенные последовательности поглощения, которые способствуют поглощению конкретными клетками-мишенями.In many gene therapy applications, it is desirable that the gene therapy vector be delivered with a high degree of specificity to a particular tissue type. Accordingly, the viral vector can be modified to provide specificity for a given cell type by expressing a ligand as a fusion protein with the viral envelope protein on the outer surface of the virus. A ligand is selected that has an affinity for a receptor known to be present in the cell type of interest. For example, Han et al., Proc. Natl. Acad. Sci. USA 92: 9747-9751 (1995), reported that the Moloney murine leukemia virus can be modified to express human heregulin fused to gp70, and this recombinant virus infects certain human breast cancer cells expressing human epidermal growth factor receptor. This principle can be extended to other virus-target cell pairs, in which the target cell expresses the receptor and the virus expresses a fusion protein containing a ligand for the receptor on the cell surface. For example, a filamentous phage can be engineered to display antibody fragments (eg, FAB or Fv) that have a specific binding affinity for virtually any chosen cellular receptor. Although the above description applies primarily to viral vectors, the same principles can be applied to non-viral vectors. Such vectors can be designed to contain specific uptake sequences that promote uptake into specific target cells.

Векторы генной терапии могут доставляться in vivo применением к отдельному пациенту, обычно путем системного применения (например, внутривенного, внутрибрюшинного, внутримышечного, подкожного или внутричерепной инфузии) или местного применения, как описано ниже. Альтернативно, векторы можно доставлять в клетки ex vivo, такие как клетки, эксплантированные из отдельного пациента (например, лимфоциты, аспираты костного мозга, биопсия ткани) или универсальные донорские гематопоэтические стволовые клетки, с последующей реимплантацией клеток пациенту, обычно после отбора для клеток, которые включили вектор.Gene therapy vectors can be delivered in vivo by application to an individual patient, typically by systemic application (eg, intravenous, intraperitoneal, intramuscular, subcutaneous or intracranial infusion) or topical application, as described below. Alternatively, vectors can be delivered to cells ex vivo, such as cells explanted from an individual patient (eg, lymphocytes, bone marrow aspirates, tissue biopsy) or universal donor hematopoietic stem cells, followed by reimplantation of the cells into the patient, typically after selection for cells that turned on the vector.

Векторы (например, ретровирусные, аденовирусные, липосомные и т.д.), содержащие нуклеазы, донорные конструкции и комбинации нуклеаз и донорных конструкций, также можно вводить непосредственно в организм для трансдукции клеток in vivo. Альтернативно, можно вводить голую ДНК. Введение осуществляется любым путем, обычно используемым для введения молекулы в окончательный контакт с клетками крови или ткани, включая, без ограничения, инъекцию, инфузию, местное применеVectors (eg, retroviral, adenoviral, liposomal, etc.) containing nucleases, donor constructs, and combinations of nucleases and donor constructs can also be administered directly into the body to transduce cells in vivo. Alternatively, naked DNA can be introduced. Administration is by any route commonly used to bring the molecule into final contact with blood or tissue cells, including, but not limited to, injection, infusion, topical application

- 28 045868 ние и электропорацию. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области техники, и, хотя для введения конкретной композиции можно использовать более одного пути, конкретный путь часто может обеспечить более немедленную и более эффективную реакцию, чем другой путь.- 28 045868 tion and electroporation. Suitable routes for administering such nucleic acids are available and well known to those skilled in the art, and although more than one route may be used to administer a particular composition, a particular route can often provide a more immediate and more efficient response than another route.

Векторы, подходящие для введения полинуклеотидов (например, кодирующих нуклеазы, двухцепочечных доноров и комбинаций нуклеазо-кодирующих и двухцепочечных доноров), описанные в данном документе, включают неинтегрирующиеся лентивирусные векторы (IDLV). См., например, Ory et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull et al. (1998) J. Virol. 72:8463-8471; Zuffery et al. (1998) J. Virol. 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25: 217-222; патентная публикация США № 2009/0117617.Vectors suitable for introducing polynucleotides (eg, nuclease-encoding, double-stranded donors, and combinations of nuclease-encoding and double-stranded donors) described herein include non-integrating lentiviral vectors (IDLVs). See, for example, Ory et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull et al. (1998) J. Virol. 72:8463-8471; Zuffery et al. (1998) J. Virol. 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25: 217-222; US Patent Publication No. 2009/0117617.

Фармацевтически приемлемые носители частично определяются конкретной вводимой композицией, а также конкретным способом, применяемым для введения композиции. Соответственно, существует большое разнообразие доступных подходящих составов фармацевтических композиций, как описано ниже (см., например, Remington's Pharmaceutical Sciences, 17th ed., 1989).Pharmaceutically acceptable carriers are determined in part by the particular composition administered as well as the particular method used to administer the composition. Accordingly, there is a wide variety of suitable pharmaceutical compositions available, as described below (see, for example, Remington's Pharmaceutical Sciences, 17th ed., 1989).

Будет очевидно, что кодирующие нуклеазы последовательности и донорные конструкции могут быть доставлены с использованием одной и той же или разных систем. Например, нуклеазы и доноры могут переносится одной и той же ДНК МС. Альтернативно, донорный полинуклеотид можно переносить с помощью МС, тогда как одну или более нуклеаз может переносится с помощью стандартной плазмиды или вектора AAV. Кроме того, разные векторы можно вводить одним и тем же или разными путями (внутримышечная инъекция, инъекция в хвостовую вену, другая внутривенная инъекция, внутрибрюшинное введение или внутримышечная инъекция). Векторы могут быть доставлены одновременно или в любом последовательном порядке.It will be appreciated that nuclease coding sequences and donor constructs can be delivered using the same or different systems. For example, nucleases and donors can be transferred by the same MS DNA. Alternatively, the donor polynucleotide can be transferred using MS, while one or more nucleases can be transferred using a standard AAV plasmid or vector. In addition, different vectors can be administered by the same or different routes (intramuscular injection, tail vein injection, other intravenous injection, intraperitoneal injection, or intramuscular injection). Vectors can be delivered simultaneously or in any sequential order.

Таким образом, данное раскрытие включает лечение in vivo или ex vivo заболеваний и состояний, которые поддаются вставке трансгенов, кодирующих терапевтический белок. Композиции вводят пациенту-человеку в количестве, эффективном для получения желаемой концентрации терапевтического полипептида в сыворотке или целевом органе или клетках. Введение может осуществляться любыми способами, в которых полинуклеотиды доставляются в желаемые клетки-мишени. Например, рассматриваются как in vivo, так и ex vivo способы. Внутривенная инъекция в воротную вену является предпочтительным способом введения. Другие способы введения in vivo включают, например, прямую инъекцию в доли печени или желчного протока и внутривенную инъекцию, дистальную по отношению к печени, в том числе через печеночную артерию, прямую инъекцию в паренхиму печени, инъекцию через печеночную артерию, и ретроградную инъекцию через желчные протоки. Способы введения ex vivo включают трансдукцию in vitro вырезанных гепатоцитов или других клеток печени с последующей инфузией трансдуцированных вырезанных гепатоцитов обратно в портальную сосудистую сеть, паренхиму печени или билиарное дерево пациента-человека, см., например, Grossman et al. (1994) Nature Genetics, 6: 335-341.Thus, this disclosure includes the in vivo or ex vivo treatment of diseases and conditions that are amenable to the insertion of transgenes encoding a therapeutic protein. The compositions are administered to a human patient in an amount effective to obtain the desired concentration of the therapeutic polypeptide in the serum or target organ or cells. Administration can be accomplished by any means in which the polynucleotides are delivered to the desired target cells. For example, both in vivo and ex vivo methods are contemplated. Intravenous injection into the portal vein is the preferred route of administration. Other routes of in vivo administration include, for example, direct injection into the liver lobes or bile duct and intravenous injection distal to the liver, including through the hepatic artery, direct injection into the liver parenchyma, injection through the hepatic artery, and retrograde injection through the biliary ducts Methods of ex vivo administration include in vitro transduction of excised hepatocytes or other liver cells followed by infusion of the transduced excised hepatocytes back into the portal vasculature, liver parenchyma or biliary tree of a human patient, see, for example, Grossman et al. (1994) Nature Genetics, 6: 335-341.

Эффективное количество вводимых нуклеазы(нуклеаз) и донора будет варьироваться от пациента к пациенту и в зависимости от терапевтического полипептида, представляющего интерес.The effective amount of nuclease(s) and donor administered will vary from patient to patient and depending on the therapeutic polypeptide of interest.

Соответственно, эффективные количества лучше всего определяются врачом, вводящим композиции, и подходящие дозы могут быть легко определены специалистом в данной области техники. После предложения достаточного времени для интеграции и экспрессии (обычно, например, 4-15 дней), анализ уровней терапевтического полипептида в сыворотке или других тканях и сравнение с начальным уровнем до введения будет определять, является ли вводимое количество слишком низким, в правильном диапазоне или слишком высоким. Подходящие режимы для начального и последующего введений также являются вариабельными, но они типизируются по первоначальному введению, за которым следуют последующие введения, если необходимо. Последующие введения могут осуществляться через различные интервалы времени, от ежедневного до ежегодного до каждых нескольких лет. Специалисту в данной области техники будет понятно, что соответствующие иммуносупрессивные методы могут быть рекомендованы, чтобы избежать ингибирования или блокирование трансдукции с иммуносупрессией векторов доставки, см., например., Vilquin et al., (1995) Human Gene Ther., 6:1391-1401.Accordingly, effective amounts are best determined by the physician administering the compositions, and suitable dosages can be readily determined by one skilled in the art. After offering sufficient time for integration and expression (usually, for example, 4-15 days), analysis of therapeutic polypeptide levels in serum or other tissues and comparison with the pre-administration baseline will determine whether the amount administered is too low, in the correct range, or too high. Suitable schedules for initial and subsequent administrations are also variable, but are categorized by initial administration followed by subsequent administrations if necessary. Subsequent administrations may occur at varying intervals, from daily to annual to every few years. One skilled in the art will appreciate that appropriate immunosuppressive techniques may be recommended to avoid inhibition or blocking of transduction with immunosuppressive delivery vectors, see, for example, Vilquin et al., (1995) Human Gene Ther., 6:1391- 1401.

Композиции для введения как ex vivo, так и in vivo включают суспензии в жидкостях или эмульгированных жидкостях. Активные ингредиенты часто смешивают с наполнителями, которые являются фармацевтически приемлемыми и совместимыми с активным ингредиентом. Подходящие наполнители включают, например, воду, физиологический раствор, декстрозу, глицерин, этанол или тому подобное и их комбинации. Кроме того, композиция может содержать незначительные количества вспомогательных веществ, таких как смачивающие или эмульгирующие агенты, рН-буферизирующие агенты, стабилизирующие агенты или другие реагенты, которые повышают эффективность фармацевтической композиции.Compositions for administration both ex vivo and in vivo include suspensions in liquids or emulsified liquids. Active ingredients are often mixed with excipients that are pharmaceutically acceptable and compatible with the active ingredient. Suitable excipients include, for example, water, saline, dextrose, glycerol, ethanol or the like, and combinations thereof. In addition, the composition may contain minor amounts of auxiliary substances, such as wetting or emulsifying agents, pH-buffering agents, stabilizing agents or other reagents that increase the effectiveness of the pharmaceutical composition.

КлеткиCells

Также в данном документе описаны клетки и клеточные линии, в которых эндогенная энхансерная последовательность BCL11A модифицирована нуклеазами, описанными в данном документе (табл. 1). Модификация может быть, например, по сравнению с последовательностью дикого типа клетки. Клетка или клеточные линии могут быть гетерозиготными или гомозиготными для модификации. Модификации последовательности BCL11A могут включать в себя инделы.Also described herein are cells and cell lines in which the endogenous BCL11A enhancer sequence is modified by the nucleases described herein (Table 1). The modification may be, for example, compared to the sequence of a wild-type cell. The cell or cell lines may be heterozygous or homozygous for modification. Modifications to the BCL11A sequence may include indels.

- 29 045868- 29 045868

Модификация предпочтительно происходит в или около сайта(ов) связывания нуклеазы(нуклеаз), сайта(ов) разрезания и комбинаций сайта(ов) связывания и сайта(ов) разрезания, например, в пределах 1300 (или любого значения между ними) пар оснований вышерасположенных или нижерасположенных по отношению к сайту(ам) разрезания, более предпочтительно в пределах 1-100 пар оснований (или любого значения между ними) с любой стороны от сайта(ов) связывания, сайта(ов) разрезания или сайта(ов) связывания и сайт(ов) разрезания, еще более предпочтительно в пределах от 1 до 50 пар оснований (или любого другого значения между ними) на любой стороне сайта(ов) связывания, сайта(ов) разрезания или сайта(ов) связывания и сайта(ов) разрезания. В некоторых вариантах осуществления модификация находится в или около области +58 энхансера BCL11A, например, в или рядом с сайтом связывания нуклеазы, показанном в любой ячейке первого столбца табл. 1.The modification preferably occurs at or near the nuclease(s) binding site(s), cleavage site(s), and combinations of binding site(s) and cleavage site(s), e.g., within 1300 (or any value in between) base pairs upstream or downstream of the cleavage site(s), more preferably within 1-100 base pairs (or any value therebetween) on either side of the binding site(s), cleavage site(s), or binding site(s) and site cutting (s), even more preferably within 1 to 50 base pairs (or any value in between) on either side of the binding site(s), cutting site(s), or binding site(s) and cutting site(s) . In some embodiments, the modification is at or near the +58 region of the BCL11A enhancer, for example, at or near the nuclease binding site shown in any cell of the first column of the table. 1.

Любая клетка или клеточная линия может быть модифицирована, например, стволовая клетка, например, эмбриональная стволовая клетка, индуцированная плюрипотентная стволовая клетка, гемопоэтическая стволовая клетка, нейрональная стволовая клетка и мезенхимальная стволовая клетка. Другие неограничивающие примеры клеток, как описано в данном документе, включают Т-клетки (например, CD4+, CD3+, CD8+ и т.д.); дендритные клетки; В-клетки. Также предлагается потомок стволовой клетки, включая частично или полностью дифференцированную клетку (например, клетку-предшественник RBC или RBC). Неограничивающие примеры других клеточных линий, включая модифицированную последовательность BCL11A, включают COS, СНО (например, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, СНО-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NSO, SP2/0-Agl4, HeLa, HEK293 (например, HEK293-F, HEK293-H, HEK293-r) и клетки perC6, а также клетки насекомых, таких как Spodoptera fugiperda (Sf), или грибковые клетки, такие как Saccharomyces, Pichia и Schizosaccharomyces.Any cell or cell line can be modified, for example, a stem cell, such as an embryonic stem cell, an induced pluripotent stem cell, a hematopoietic stem cell, a neuronal stem cell, and a mesenchymal stem cell. Other non-limiting examples of cells as described herein include T cells (eg, CD4+, CD3+, CD8+, etc.); dendritic cells; B cells. A descendant of a stem cell, including a partially or fully differentiated cell (eg, an RBC progenitor cell or RBC) is also provided. Non-limiting examples of other cell lines including the modified BCL11A sequence include COS, CHO (eg, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28 -G3, BHK, HaK, NSO, SP2/0-Agl4, HeLa, HEK293 (e.g. HEK293-F, HEK293-H, HEK293-r) and perC6 cells, as well as insect cells such as Spodoptera fugiperda (Sf), or fungal cells such as Saccharomyces, Pichia and Schizosaccharomyces.

Описанные в данном документе клетки полезны для лечения или профилактики расстройства, например, с помощью терапии ex vivo. Клетки, модифицированные нуклеазой, могут быть размножены и затем повторно введены пациенту с использованием стандартных методик (см, например, Tebas et al. (2014) New Eng J Med 370(10):901). В случае стволовых клеток, после инфузии субъекту также происходит дифференцировка in vivo этих предшественников в клетки, экспрессирующие функциональный трансген. Фармацевтические композиции, содержащие клетки, как описано в данном документе, также предлагаются. Кроме того, клетки могут быть криоконсервированы до введения пациенту.The cells described herein are useful for treating or preventing a disorder, for example, through ex vivo therapy. Nuclease-modified cells can be expanded and then reintroduced to the patient using standard techniques (see, for example, Tebas et al. (2014) New Eng J Med 370(10):901). In the case of stem cells, after infusion into the subject, the in vivo differentiation of these progenitors into cells expressing a functional transgene also occurs. Pharmaceutical compositions containing cells as described herein are also provided. In addition, the cells can be cryopreserved prior to administration to the patient.

Любые из модифицированных клеток или клеточных линий, раскрытых в данном документе, могут демонстрировать повышенную экспрессию гамма-глобина. Композиции, такие как фармацевтические композиции, содержащие генетически модифицированные клетки, как описано в данном документе, также предлагаютсяAny of the modified cells or cell lines disclosed herein may exhibit increased gamma globin expression. Compositions, such as pharmaceutical compositions, containing genetically modified cells, as described herein, are also provided

ПримененияApplications

Способы и композиции, раскрытые в данном документе, предназначены для модификации экспрессии белка или для исправления аберрантной последовательности гена, которая кодирует белок, экспрессируемый при генетическом заболевании, таком как серповидноклеточная анемия или талассемия. Таким образом, способы и композиции обеспечивают лечение или профилактику таких генетических заболеваний. Редактирование генома, например стволовых клеток, может использоваться для коррекции аберрантного гена, вставки гена дикого типа или изменения экспрессии эндогенного гена. В качестве неограничивающего примера, ген дикого типа, например, кодирующий по меньшей мере один глобин (например, α-глобин, γ-глобин, β-глобин и их комбинации), могут быть вставлены в клетки (например, в эндогенную последовательность BCL11A энхансера с использованием одной или более нуклеаз, как описано в данном документе), чтобы обеспечить белки глобина присутствующие в пониженом количестве или отсутствующие в клетке и, таким образом, лечение генетического заболевания, например гемоглобинопатии, вызванной неправильной экспрессией глобина. Альтернативно или в дополнение, геномное редактирование с или без введения соответствующего донора может исправить дефектный эндогенный ген, например, исправить точечную мутацию в α- или β-гемоглобине, восстановить экспрессию гена или вылечить генетическое заболевание, например, серповидно-клеточную анемию, нок аут или изменение (сверхэкспрессию или подавление) какого-либо гена прямой или непрямой регуляции глобина (например, инактивация гена-регулятора γ-глобина BCL11A или регулятора BCL11A KLF1). В частности, способы и композиции по данному изобретению находят применение при лечении или профилактике гемоглобинопатии.The methods and compositions disclosed herein are intended to modify the expression of a protein or to correct an aberrant gene sequence that encodes a protein expressed in a genetic disease such as sickle cell disease or thalassemia. Thus, the methods and compositions provide treatment or prevention of such genetic diseases. Genome editing, such as in stem cells, can be used to correct an aberrant gene, insert a wild-type gene, or alter the expression of an endogenous gene. As a non-limiting example, a wild-type gene, e.g., encoding at least one globin (e.g., α-globin, γ-globin, β-globin, and combinations thereof), can be inserted into cells (e.g., into the endogenous BCL11A enhancer sequence with using one or more nucleases as described herein) to ensure that globin proteins are present in reduced amounts or absent in the cell and thereby treat a genetic disease, such as hemoglobinopathy, caused by abnormal expression of globin. Alternatively or in addition, genome editing, with or without the introduction of a matching donor, can correct a defective endogenous gene, for example, correct a point mutation in α- or β-hemoglobin, restore gene expression, or cure a genetic disease, such as sickle cell disease, knockout or change (overexpression or suppression) of any direct or indirect globin regulation gene (for example, inactivation of the γ-globin regulator gene BCL11A or the BCL11A regulator KLF1). In particular, the methods and compositions of this invention find use in the treatment or prevention of hemoglobinopathy.

Нуклеазы по данному изобретению нацелены на энхансерную область BCL11A, которая, как известно, необходима для экспрессии BCL11A во время эритропоэза и, следовательно, для подавления экспрессии гамма-глобина. Модификация этой области энхансера может привести к появлению эритроцитов с повышенной экспрессией гамма-глобина и, таким образом, может быть полезна для лечения или профилактики серповидноклеточной анемии или бета-талассемии.The nucleases of the present invention target the BCL11A enhancer region, which is known to be required for the expression of BCL11A during erythropoiesis and, therefore, for the suppression of gamma globin expression. Modification of this enhancer region may result in red blood cells with increased expression of gamma globin and thus may be useful for the treatment or prevention of sickle cell anemia or beta thalassemia.

Следующие примеры относятся к иллюстративным вариантам осуществления данного раскрытия, в которых нуклеаза содержит нуклеазу цинкового пальца (ZFN). Понятно, что это сделано только для иллюстративных целей и что могут быть использованы другие нуклеазы, например, системы TtAgo иThe following examples relate to exemplary embodiments of this disclosure in which the nuclease comprises a zinc finger nuclease (ZFN). It is understood that this is for illustrative purposes only and that other nucleases, such as the TtAgo and

- 30 045868- 30 045868

CRISPR/Cas, хоуминг эндонуклеазы (мегануклеазы) со сконструированными ДНК-связывающими доменами, слияния встречающихся в природе ДНК-связывающих доменов сконструированных хоуминг эндонуклеаз (мегануклеаз), в том числе комбинации хоуминг эндонуклеаз (мегануклеаз) со сконструированными ДНК-связывающими доменами и слияния встречающихся в природе ДНК-связывающих доменов сконструированных хоуминг эндонуклеаз (мегануклеаз) и гетерологичных доменов разрезания, слияния мегануклеаз и белков TALE, включая комбинации гетерологичных доменов разрезания и слияния мегануклеаз и белков TALE.CRISPR/Cas, homing endonucleases (meganucleases) with engineered DNA-binding domains, fusions of naturally occurring DNA-binding domains of engineered homing endonucleases (meganucleases), including combinations of homing endonucleases (meganucleases) with engineered DNA-binding domains and fusions of naturally occurring the nature of the DNA-binding domains of engineered homing endonucleases (meganucleases) and heterologous cleavage-fusion domains of meganucleases and TALE proteins, including combinations of heterologous cleavage-fusion domains of meganucleases and TALE proteins.

ПримерыExamples

Пример 1. Сборка нуклеаз цинковых пальцевExample 1: Assembly of Zinc Finger Nucleases

ZFN собирали против человеческого гена BCL11A, и активность проверяли путем глубокого сиквенирования ДНК, выделенной из трансфицированных клеток, как описано ниже. ZFN, специфичные для +58 области энхансерной области получали как описано. Пара ZFN 51857/51949 была описана ранее (см. WO 2016/183298).ZFN was assembled against the human BCL11A gene, and activity was verified by deep sequencing of DNA isolated from transfected cells as described below. ZFNs specific for the +58 region of the enhancer region were prepared as described. The ZFN 51857/51949 pair has been described previously (see WO 2016/183298).

Пример 2. Анализ вне мишени.Example 2: Off-target analysis.

Для анализа нецелевого разрезания парами ZFN был проведен двухэтапный непредвзятый анализ специфичности. На первом этапе (фиг. 1) сайты-кандидаты, не являющиеся мишенями, для каждого ZFN были идентифицированы с помощью анализа сайта интеграции олигонуклеотидного дуплекса с использованием процедуры, аналогичной описанной Tsai et al. ((2015), Nat Biotechnol 33(2):187-197. doi:10.1038/nbt3117).To analyze off-target cutting by ZFN pairs, a two-step unbiased specificity analysis was performed. In the first step (Fig. 1), candidate nontarget sites for each ZFN were identified by oligonucleotide duplex integration site analysis using a procedure similar to that described by Tsai et al. ((2015), Nat Biotechnol 33(2):187–197. doi:10.1038/nbt3117).

Анализ сайта интеграции олигонуклеотидного дуплекса основан на наблюдении, что совместное введение нуклеазы и короткого сегмента дуплексной ДНК в клетку-мишень приводит к интеграции дуплекса во время репарации части явлений разрезания генома через путь репарации ДНК NHEJ (Орландо et al. (2010), Nucleic Acids Res, 38 (15) el52. doi: 10. 1093/nar/gkq512; Gabriel et al. (2011), Nat Biotechnol. 2011 Aug 7; 29(9):816-23. doi: 10. 1038/nbt. 1948; Tsai et al., ibid). После интеграции дуплекс обеспечивает постоянный тэг этого конкретного явления разрезания. Сайты интеграции затем идентифицируют путем лигирования олигонуклеотидного адаптера к сдвинутой геномной ДНК с последующим 2 раундами 25 циклов гнездовой ПЦР и глубоким сиквенированием полученных сочленений донора и генома. Этот анализ позволяет оценить все потенциальные сайты интеграции в геноме.Analysis of the integration site of an oligonucleotide duplex is based on the observation that co-introduction of a nuclease and a short segment of duplex DNA into a target cell results in integration of the duplex during the repair of a portion of genome cutting events through the NHEJ DNA repair pathway (Orlando et al. (2010), Nucleic Acids Res , 38 (15) el52. doi: 10. 1093/nar/gkq512; Gabriel et al. (2011), Nat Biotechnol. 2011 Aug 7; 29(9):816-23. doi: 10. 1038/nbt. 1948 ; Tsai et al., ibid). Once integrated, the duplex provides a permanent tag for that particular cutting phenomenon. Integration sites are then identified by ligating the oligonucleotide adapter to the sheared genomic DNA, followed by 2 rounds of 25 cycles of nested PCR and deep sequencing of the resulting donor-genomic junctions. This analysis evaluates all potential integration sites in the genome.

Анализ сайтов интеграции проводили в клетках K562 для максимизации доставки донора, экспрессии ZFN и интеграции донора. Более того, поскольку клетки K562 быстро делятся (время удвоения приблизительно 24 ч), ожидается, что они наложат минимальные эпигенетические ограничения на способность ZFN расщеплять клеточные мишени. Клетки (2х105) подвергали электропорации с 0,47 мкг олигонуклеотидного дуплексного донора и 400 нг каждой мРНК, кодирующей ZFN, с использованием челнока Amaxa и настроек, оптимизированных для максимальной целевой активности ZFN. Четыре репликативных образца были приготовлены для каждой комбинации олиго и мРНК. На 7-е сутки после трансфекции выделяли геномную ДНК для каждого образца (набор Qiagen DNeasy для крови и тканей) и 400 нг (133000 гаплоидных геномов) было использовано в качестве исходного материала для протокола амплификации, изображенного на фиг. 1. Образцы затем обрабатывали по существу, как было описано раньше (Tsai et al. Ibid). Конечные продукты были объединены, количественно было определено и они были сиквенированы на приборе MiSeq (Illumina) с использованием набора для сиквенирования v2 на 300 циклов с парными считываниями (paired-end reads) по 150 п.н. и считываниями с двойными индексирующими последовательностями (dual index reads) по 8 п.н. /16 п.н. для обнаружения штрих-кодов образцов на каждом конце ампликона.Integration site analysis was performed in K562 cells to maximize donor delivery, ZFN expression, and donor integration. Moreover, because K562 cells divide rapidly (doubling time approximately 24 h), they are expected to impose minimal epigenetic restrictions on the ability of ZFN to degrade cellular targets. Cells (2x10 5 ) were electroporated with 0.47 μg of oligonucleotide duplex donor and 400 ng of each ZFN-encoding mRNA using an Amaxa shuttle and settings optimized for maximum ZFN target activity. Four replicate samples were prepared for each oligo and mRNA combination. On day 7 post-transfection, genomic DNA for each sample was isolated (Qiagen DNeasy Blood and Tissue Kit) and 400 ng (133,000 haploid genomes) was used as input for the amplification protocol depicted in FIG. 1. Samples were then processed essentially as previously described (Tsai et al. Ibid). The final products were pooled, quantified, and sequenced on a MiSeq instrument (Illumina) using a v2 300-cycle sequencing kit with 150-bp paired-end reads. and reads with double indexing sequences (dual index reads) of 8 bp. /16 bp to detect sample barcodes at each end of the amplicon.

Чтобы сгенерировать список возможных вне целевых сайтов, данные сиквенирования были отфильтрованы на предмет наличия правильной затравочной последовательности с последующим обрезанием последовательностей адаптера и картированием в геноме. Затем были картированы координаты соединений, и соединение дуплекс-геном, также как и позиция разрыва, вызванного сдвигом ДНК, были использованы для идентификации различных явлений интеграции. Затем явления интеграции были обработаны, чтобы идентифицировать кластеры интеграции в непосредственной близости в геноме (минимум 4 различных явления интеграции в пределах 100 п.н. друг от друга, суммированные по всем репликам). Кластеры, находящиеся на контигах, которые нельзя было картировать в сборке hg38 (т.е. chrUn в hg38), были удалены из дальнейшего анализа. Картирование кластеров в повторяющихся локусах (медиана трех или более попаданий в геном по всем последовательностям в кластере) также было удалено, так как предыдущий опыт показал, что это артефакты амплификации. Оставшиеся кластеры оценивали как сайтыкандидаты для разрезания ZFN, если они были получены по меньшей мере из 2 повторов образцов, обработанных ZFN (всего 4), и демонстрировали > 5-кратное превышение явлений интеграции в образцах, обработанных ZFN, по сравнению с контролем. Сайты-кандидаты для разрезания классифицировали по общему количеству уникальных интеграции в образцах, обработанных ZFN. Локусы-кандидаты, идентифицированные с помощью этого анализа, представлены на фиг. 2 для пары ZFN 51857/51949, классифицированные по количеству интегрантов.To generate a list of possible off-target sites, sequencing data were filtered for the correct seed sequence, followed by trimming of adapter sequences and mapping into the genome. The coordinates of the junctions were then mapped, and the duplex-genome junction as well as the position of the break caused by the DNA shear were used to identify various integration events. Integration events were then processed to identify integration clusters in close proximity in the genome (a minimum of 4 different integration events within 100 bp of each other, summed across all replicates). Clusters located on contigs that could not be mapped to the hg38 assembly (i.e., chrUn in hg38) were removed from further analysis. Mapping of clusters at repetitive loci (median of three or more hits per genome across all sequences in a cluster) was also removed as previous experience indicated that these were amplification artifacts. The remaining clusters were scored as candidate sites for ZFN cutting if they were derived from at least 2 replicates of ZFN-treated samples (4 total) and showed >5-fold excess integration events in ZFN-treated samples compared to controls. Candidate cutting sites were classified by the total number of unique integrations in ZFN-treated samples. The candidate loci identified by this analysis are presented in Fig. 2 for the ZFN 51857/51949 pair, classified by the number of integrators.

Пример 3. Оптимизация ZFNExample 3: ZFN Optimization

- 31 045868- 31 045868

Чтобы уменьшить разрезание вне мишени, адаптировали стратегию оптимизации нуклеазы, в которой неспецифические фосфатные контакты выборочно удаляются, чтобы вызвать глобальное подавление разрезания вне мишени (Guilinger et al. (2014) Nat Methods. 11(4):429-35. doi:10.1038/nmeth. 2845; Kleinstiver et al. (2016) Nature 529(7587):490-5. doi:10.1038/naturel6526; Slaymaker et al. (2016) Science) 351 (6268): 84-8. doi:10.1126/science.aad5227) (см. предварительные заявки США №№ 62/443981 и 62/378978). Аминокислотные замены были сделаны в ключевой позиции внутри каркаса цинкового пальца, который взаимодействует с фосфатным остовом ДНК (Pavletich and Pabo, (1991) Science 252 (5007):809-17; Elrod-Erickson et al. (1996) Structure 4 (10):1171-80) (фиг. 3А-3В), а также в одной позиции в правом домене FokI ZFN которая также, как спрогнозировано, создает фосфатный контакт (фиг. 3С).To reduce off-target cutting, a nuclease optimization strategy was adapted in which non-specific phosphate contacts are selectively removed to cause global suppression of off-target cutting (Guilinger et al. (2014) Nat Methods. 11(4):429-35. doi:10.1038/ nmeth. 2845; Kleinstiver et al. (2016) Nature 529(7587):490-5. doi:10.1038/naturel6526; Slaymaker et al. (2016) Science) 351 (6268): 84-8. doi:10.1126/science.aad5227) (see US Provisional Application Nos. 62/443981 and 62/378978). Amino acid substitutions were made at a key position within the zinc finger framework that interacts with the phosphate backbone of DNA (Pavletich and Pabo, (1991) Science 252 (5007):809-17; Elrod-Erickson et al. (1996) Structure 4 (10) :1171-80) (Fig. 3A-3B), as well as at one position in the right FokI domain of ZFN which is also predicted to create a phosphate contact (Fig. 3C).

Специфичность была дополнительно улучшена благодаря возможности независимой экспрессии каждого ZFN из двух разделенных мРНК, что позволяет оптимизировать соотношения доставки. Эти усилия позволили получить оптимизированные пары ZFN, которые высоко родственны исходной паре, отличаясь заменами, которые снижают энергетику взаимодействия с фосфатным остовом ДНК, но которые минимально влияют или не влияют на сиквенс-специфическое распознавание оснований. В соответствии с этим, анализ сайта интеграции дал 455 локусов для потенциальных мишеней разрезания ZFN для исходной пары 51857/51949. Для оптимизированной пары с помощью этого анализа было определено гораздо меньшее количество локусов для дальнейшей проверки в качестве потенциальных мишеней разрезания ZFN (всего 72). Для обеих пар предполагаемой мишенью в энхансере BCL11A был локус высшего ранга. Более того, в энхансере BCL11A для оптимизированной пары была отмечена гораздо более высокая доля явлений интеграции, что согласуется с ее большей специфичностью.Specificity was further improved by allowing each ZFN to be independently expressed from two separated mRNAs, allowing optimization of delivery ratios. These efforts have produced optimized ZFN pairs that are highly related to the parent pair, differing by substitutions that reduce the energetics of interaction with the DNA phosphate backbone but that have minimal or no effect on sequence-specific base recognition. Consistent with this, integration site analysis yielded 455 loci for potential ZFN cutting targets for the seed pair 51857/51949. For the optimized pair, this analysis identified a much smaller number of loci for further validation as potential ZFN cutting targets (72 in total). For both pairs, the putative target in the BCL11A enhancer was the top-ranking locus. Moreover, at the BCL11A enhancer, a much higher proportion of integration events was observed for the optimized pair, consistent with its greater specificity.

Важно отметить, что при определении конвейера обработки данных последовательностей, ключевые параметры были выбраны консервативно, чтобы включить максимально возможное количество локусов вне мишени, а не отфильтровать их. Это было сделано для того, чтобы гарантировать, что каждый локус, который может представлять собой хороший сайт разрезания для оптимизированных ZFN, будет идентифицирован и протестирован в последующих исследованиях инделов, даже за счет принятия гораздо большего числа локусов, которые станут ложноположительными. Ожидалось, что на первом этапе анализа будет получен большой набор локусов-кандидатов для каждой пары ZFN, из которых подавляющее большинство (особенно для оптимизированных ZFN) не будут представлять истинные сайты разрезания вне мишени, а скорее фоновые явления, которые могут оказаться отрицательными для разрезания в последующих исследованиях инделов.It is important to note that in defining the sequence data processing pipeline, key parameters were chosen conservatively to include as many off-target loci as possible rather than filter them out. This was done to ensure that every locus that might represent a good cutting site for the optimized ZFNs would be identified and tested in subsequent indel studies, even at the expense of accepting many more loci that would become false positives. It was expected that the first stage of analysis would produce a large set of candidate loci for each ZFN pair, of which the vast majority (especially for optimized ZFNs) would not represent true off-target cutting sites, but rather background events that might be negative for cutting at subsequent studies of indels.

На втором этапе анализа локусы-кандидаты вне мишени, идентифицированные с помощью анализа сайта интеграции, были подвергнуты скринингу на наличие признаков модификации (например, наличия инделов) в CD34+ HSPC, обработанных ZFN.In the second step of the analysis, candidate off-target loci identified by integration site analysis were screened for evidence of modification (e.g., presence of indels) in ZFN-treated CD34+ HSPCs.

В частности, CD34+ HSPC человека, полученные из мобилизованной периферической крови, обрабатывали исходными и оптимизированными парами ZFN с использованием клинической шкалы и клинических условий для трансфекции РНК (120 мкг/мл мРНК для исходной пары ZFN и 100 мкг/мл мРНК для оптимизированной пары). Геномную ДНК выделяли через 2 дня после трансфекции с последующей ПЦР-амплификацией локусов-кандидатов вне мишени и глубоким сиквенированием для количественного определения уровней инделов. Как на исходной, так и на оптимизированной парах ZFN, на этом этапе был проведен скрининг одного и того же набора из 137 потенциальных локусов вне мишени, а также меньшее количество потенциальных сайтов вне мишени, которые были идентифицированы с помощью других методов в более ранних исследованиях с исходными ZFN.Specifically, human CD34+ HSPCs derived from mobilized peripheral blood were treated with original and optimized ZFN pairs using a clinical scale and clinical conditions for RNA transfection (120 μg/ml mRNA for the original ZFN pair and 100 μg/ml mRNA for the optimized pair). Genomic DNA was isolated 2 days after transfection, followed by PCR amplification of candidate off-target loci and deep sequencing to quantify indel levels. On both the original and optimized ZFN pairs, this step screened the same set of 137 potential off-target loci, as well as a smaller number of potential off-target sites that had been identified by other methods in earlier studies with original ZFN.

Результаты показали, что оптимизированные ZFN заметно более специфичны, чем исходная пара. Это видно не только из числа локусов, которые были оценены как положительные на наличие доказательства разрезания ZFN (52 для исходной пары против 3 для оптимизированной пары), но также и из наблюдаемых уровней инделов, которые для оптимизированной пары были намного ниже. На фиг. 4 показаны графики значений инделов в каждом локусе, демонстрирующем признаки разрезания ZFN в этом исследовании (отметьте логарифмическую шкалу оси Y).The results showed that the optimized ZFNs were noticeably more specific than the original pair. This is evident not only from the number of loci that were scored positive for evidence of ZFN cutting (52 for the original pair vs. 3 for the optimized pair), but also from the observed indel levels, which were much lower for the optimized pair. In fig. Figure 4 shows plots of indel values at each locus showing evidence of ZFN cutting in this study (note log y-axis scale).

Суммирование инделов вне мишени по всем таким локусам указывает на снижение активности вне мишени в 300 раз (совокупные инделы вне мишени для исходной пары составили 46,5%, против инделов вне мишени для оптимизированной пары - 0,15%). Это снижение активности вне мишени было достигнуто без потери активности на предполагаемом сайте-мишени (72,5% инделов для исходной пары против 81,9% для оптимизированных ZFN). В этих исследованиях исходная пара (или родительская пара) была 51857/51949, тогда как оптимизированная пара ZFN была 63014/65722 (см. ниже). Конструкции нуклеаз показаны ниже в табл. 1.The summation of off-target indels for all such loci indicates a 300-fold decrease in off-target activity (cumulative off-target indels for the original pair were 46.5%, versus off-target indels for the optimized pair - 0.15%). This reduction in off-target activity was achieved without loss of activity at the putative target site (72.5% indels for the original pair vs. 81.9% for the optimized ZFNs). In these studies, the original pair (or parent pair) was 51857/51949, whereas the optimized ZFN pair was 63014/65722 (see below). The nuclease constructs are shown in the table below. 1.

- 32 045868- 32 045868

Т аблица 1. Пары ZFN, специфичные для области энхансера +58 BCL11ATable 1. ZFN pairs specific to the +58 enhancer region of BCL11A

Конструкция SBS № Линкер [Последовательность спирали, SEQ ID] (сайт-мишень,__ Мутанты 5'-3 ') [Мутации в остове пальца] Fok Design SBS No. Linker [helix sequence, SEQ ID] (target site,__ Mutants 5'-3') [Mutations in the core of the finger] Fok F1F1 F2 Левый RNFSL TM (SEQ ID NO: 20 ) нет RNFSL TM (SE Q ID NO: 20 ) F2 Left RNFSL TM (SEQ ID NO: 20) no RNFSL TM (SE Q ID NO: 20) F3 партн STG NLT N (SE Q ID NO: 21) нет STG NLT N (SE Q ID NO: 21) F3 partner STG NLT N (SE Q ID NO: 21) no STG NLT N (SE Q ID NO: 21) F4 ep TSGSL TR (SEQ ID NO: 22 ) нет TSGSL TR (SE Q ID NO:22 ) F 4 ep TSGSL TR (SEQ ID NO: 22) no TSGSL TR (SE Q ID NO:22) F5 DQSNL RA (SEQ ID NO: 19 ) нет DQSNL RA(SE Q ID NO: 19 ) F 5 DQSNL RA (SEQ ID NO: 19 ) no DQSNL RA (SE Q ID NO: 19 ) F6 F6 51857 aaAGCAACtGTTA GCTTGCACtagac ta (SEQ ID NO: 1) 63014 aaAGCAACtGTTA GCTTGCACtagac ta (SEQ ID NO:1) 51857 aaAGCAACtGTTA GCTTGCACtagacta (SEQ ID NO: 1) 63014 aaAGCAACtGTTA GCTTGCACtagacta (SEQ ID NO:1) DQSNLRA (SEQ ID NO :19) нет DQSNLRA (SEQ ID NO :19) DQSNLRA (SEQ ID NO:19) No DQSNLRA (SEQ ID NO:19) AQ CC LF H (S EQ ID NO :2 3) не T AQ CC LF H( SE Q ID NO :2 3) AQ CC LF H (S EQ ID NO :2 3) not T AQ CC LF H( SE Q ID NO :2 3) L7c5 ELD L7c5 L7c5 ELD L7c5 Qm5 Qm5 нет No Qm5 Qm5 нет No Qm5 Qm5 не T Not T ELD ELD 65459 aaAGCAACtGTTA GCTTGCACtagac ta (SEQ ID NO:1) 65459 aaAGCAACtGTTA GCTTGCACtagac ta (SEQ ID NO:1) DQSNLRA (SEQ ID NO :19) DQSNLRA (SEQ ID NO:19) RNFSL TM (SE Q ID NO: 20 ) RNFSL TM (SE QID NO: 20 ) STG NLT N (SE Q ID NO: 21) STG NLT N (SE Q ID NO: 21) TSGSL TR (SE Q ID NO: 22 ) TSGSL TR (SE QID NO: 22 ) DQSNL RA(SE Q ID NO: 19 ) DQSNL RA(SE QID NO: 19 ) AQ CC LF H( SE Q ID NO :2 3) AQ CC LF H( S.E. Q ID NO :2 3) L7c5 L7c5 Qml4Qm5 Qml4Qm5 нет No Qm5 Qm5 нет No Qm5 Qm5 T T ELD ELD Правый партнер Right partner 51949 caCAGGCTCCAGG AAGGgtttggcct ct (SEQ ID NO: 2) 51949 caCAGGCTCCAGG AAGGgtttggcct ct (SEQ ID NO: 2) RNDHRTT (SEQ ID NO: 24) RNDHRTT (SEQ ID NO: 24) QKAHL IR (SEQ ID NO: 25) QKAHL IR (SEQ ID NO: 25) QKG TLG E (SE Q ID NO: 26) QKG TLG E (SE Q ID NO: 26) RGRDL SR (SEQ ID NO: 26) RGRDL SR (SEQ ID NO: 26) RRDNL HS (SEQ ID NO: 27) RRDNL H.S. (SEQ ID NO: 27) Н/ Д N/ D L0 L0 нет No нет No нет No нет No нет No Н/ Д N/ D KKR KKR 65722 caCAGGCTCCAGG 65722 caCAGGCTCCAGG RNDHRTT (SEQ ID RNDHRTT (SEQ ID QKAHL IR QKAHL IR QKG TLG QKG TLG RGRDL SR RGRDL S.R. RRDNL HS RRDNL H.S. Н/ Д N/ D L0 L0

- 33 045868- 33 045868

AAGGgtttggcct ct (SEQ ID NO: 2) AAGGgtttggcct ct (SEQ ID NO: 2) NO: 24) NO: 24) (SEQ ID NO: 25) (SEQ ID NO: 25) E (SE Q ID NO: 26) E (SE Q ID NO: 26) (SEQ ID NO: 26) (SEQ ID NO: 26) (SEQ ID NO: 27) (SEQ ID NO: 27) Qm5 Qm5 Qm5 Qm5 нет No Qm5 Qm5 нет No Н/ Д N/ D KKR K525S KKR K525S 65526 caCAGGCTCCAGG AAGGgtttggcct ct (SEQ ID NO: 2) 65526 caCAGGCTCCAGG AAGGgtttggcctct (SEQ ID NO: 2) RNDHRTT (SEQ ID NO: 24) RNDHRTT (SEQ ID NO: 24) QKAHL IR (SEQ ID NO: 25) QKAHL IR (SEQ ID NO: 25) QKG TLG E (SE Q ID NO: 26) QKG TLG E (SE Q ID NO: 26) RGRDL SR (SEQ ID NO: 26) RGRDL SR (SEQ ID NO: 26) RRDNL HS (SEQ ID NO: 27) RRDNL H.S. (SEQ ID NO: 27) Н/ Д N/ D L0 L0 Qm5 Qm5 Qm5 Qm5 нет No Qm5 Qm5 Qm5 Qm5 Н/ Д N/ D KKR R416S KKR R416S 65549 caCAGGCTCCAGG AAGGgtttggcct ct (SEQ ID NO: 2) 65549 caCAGGCTCCAGG AAGGgtttggcctct (SEQ ID NO: 2) RNDHRTT (SEQ ID NO: 24) RNDHRTT (SEQ ID NO: 24) QKAHL IR (SEQ ID NO: 25) QKAHL IR (SEQ ID NO: 25) QKG TLG E (SE Q ID NO: 26) QKG TLG E (SE Q ID NO: 26) RGRDL SR (SEQ ID NO: 26) RGRDL SR (SEQ ID NO: 26) RRDNL HS (SEQ ID NO: 27) RRDNL H.S. (SEQ ID NO: 27) Н/ Д N/ D L0 L0 Qm5 Qm5 Qm5 Qm5 Qm5 Qm5 Qm5 Qm5 нет No Н/ Д N/ D KKR K525S KKR K525S 65550 caCAGGCTCCAGG AAGGgtttggcct ct (SEQ ID NO: 2) 65550 caCAGGCTCCAGG AAGGgtttggcct ct (SEQ ID NO: 2) RNDHRTT (SEQ ID NO: 24) RNDHRTT (SEQ ID NO: 24) QKAHL IR (SEQ ID NO: 25) QKAHL IR (SEQ ID NO: 25) QKG TLG E SEQ ID NO: 26 QKG TLG E SEQ ID NO: 26 RGRDL SR (SEQ ID NO: 26) RGRDL SR (SEQ ID NO: 26) RRDNL HS (SEQ ID NO: 27) RRDNL H.S. (SEQ ID NO: 27) Н/ Д N/ D L0 L0 Qm5 Qm5 Qm5 Qm5 нет No Qm5 Qm5 Qm5 Qm5 Н/ Д N/ D KKR K525S KKR K525S

Табл. 1 показывает характеризующую информацию, относящуюся к каждому ZFN. Начиная слева, SBS номер (например, 51857) отображается с ДНК-мишенью, с которой связывается ZFN, показанной под SBS номером. Далее показаны аминокислотные конструкции спирали распознавания для пальцев 1-6 или 1-5 (разделенный столбец 2 табл. 1). В табл. 1 под соответствующими конструкциями спирали также показаны мутации, сделанные в последовательностях остова ZFP указанного пальца, как описано в предварительных патентных заявках США №№ 62/378978 и 62/443981. В обозначениях, использованных в табл. 1, Qm5 означает, что в позиции минус 5 (относительно спирали, которая пронумерована от -1 до +6) указанного пальца, аргинин в этой позиции был заменен глутамином (Q), в то время как Qm14 означает, что аргинин (R), как правило, присутствующий в позиции минус 14 был заменен на глутамин (Q). Нет означает отсутствие изменений за пределами области спирали распознавания. Таким образом, например, SBS № 63014 включает мутацию Qm5 в пальцах 1, 3 и 5, в то время как пальцы 2, 4 и 6 не имеют мутаций в остове цинкового пальца (например, последовательность цинковых пальцев вне области спирали распознавания).Table 1 shows characterization information related to each ZFN. Starting at the left, the SBS number (eg, 51857) is displayed with the target DNA to which ZFN binds shown under the SBS number. The following shows the amino acid recognition helix constructs for fingers 1–6 or 1–5 (divided column 2 of Table 1). In table 1 also shows below the corresponding helix constructs mutations made in the ZFP backbone sequences of the finger, as described in US Provisional Patent Application Nos. 62/378978 and 62/443981. In the notation used in table. 1, Qm5 means that at position minus 5 (relative to the helix, which is numbered -1 to +6) of the indicated finger, arginine at that position has been replaced by glutamine (Q), while Qm14 means arginine (R), typically present at position minus 14 was replaced by glutamine (Q). No means no change outside the recognition spiral area. Thus, for example, SBS #63014 includes a Qm5 mutation in fingers 1, 3, and 5, while fingers 2, 4, and 6 have no mutations in the zinc finger backbone (e.g., a zinc finger sequence outside the recognition helix region).

Наконец, в самом правом столбце табл. 1 показан линкер, используемый для связывания ДНКсвязывающего домена с доменом разрезания FokI (например, L7c5 (LRGSISRARPLNPHP (SEQ ID NO: 5), как описано, например, в патенте США № 9567609 отображается в верхней строке столбца, а сайты мутаций FokI в контакте с фосфатами и димеризационных мутаций показаны в рамке под обозначением линкера. В частности, в верхней строке рамки мутантов Fok указан тип мутации, обнаруженной в домене димеризации (например, ELD или KKR, как описано, например, в патенте США № 8962281). Ниже обозначений димеризационных мутантов показаны любые мутации, присутствующие в домене FokI, сделанные для удаления неспецифического фосфатного контакта, показанного внизу (например, K525S или R416S, где остатки серина в позициях аминокислот 525 или 416 были заменены либо лизином, либо аргинином, соответственно, как описано в предварительной заявке на патент США №№ 62/378978 иFinally, in the rightmost column of the table. 1 shows the linker used to link the DNA binding domain to the FokI cutting domain (e.g. L7c5 (LRGSISRARPLNPHP (SEQ ID NO: 5), as described, for example, in US patent No. 9567609 is displayed in the top row of the column, and the FokI mutation sites in contact with phosphates and dimerization mutations are shown in a box below the linker designation. Specifically, the top line of the Fok mutant box indicates the type of mutation found in the dimerization domain (e.g., ELD or KKR, as described, for example, in US Pat. No. 8,962,281). Below the dimerization designations mutants are shown any mutations present in the FokI domain made to remove the nonspecific phosphate contact shown at the bottom (e.g., K525S or R416S, where the serine residues at amino acid positions 525 or 416 were replaced by either lysine or arginine, respectively, as described in the provisional application for US patent No. 62/378978 and

- 34 045868- 34 045868

62/443981). Так, например, в SBS № 63014, линкер представляет собой линкер L7c5, а домен разрезания FokI включает в себя мутанты димеризации ELD и не содержит фосфат-контактных мутаций. Кроме того, для SBS № 65722 линкер представляет собой линкер L0 (LRGSQLVKS (SEQ ID NO: 6), также называемый стандартным линкером, см. патент США № 9567609), и домен разрезания FokI включает мутации димеризации KKR, и фосфат-контактную мутацию K525S FokI.62/443981). Thus, for example, in SBS #63014, the linker is the L7c5 linker, and the FokI cutting domain includes ELD dimerization mutants and does not contain phosphate contact mutations. In addition, for SBS No. 65722, the linker is the L0 linker (LRGSQLVKS (SEQ ID NO: 6), also called the standard linker, see US Pat. No. 9567609), and the FokI cutting domain includes the dimerization mutations KKR, and the phosphate contact mutation K525S FokI.

Все ZFN были протестированы на функциональность (активность разрезания, как определено анализом на наличие инделов, как описано в примере 4 ниже) и были определены как активные.All ZFNs were tested for functionality (cutting activity as determined by the indel assay as described in Example 4 below) and were determined to be active.

Кроме того, чтобы определить, какие конструкции ZFN были наиболее специфичными, в обработанных ZFN CD34+ HSPC были проведены анализы инделов известных сайтов разрезания вне мишени исходной парой ZFN. Для этого человеческие CD34+ HSPC, полученные из мобилизованной периферической крови, обрабатывали исходными и оптимизированными парами ZFN с использованием клинических условий и концентраций мРНК (120 мкг/мл для исходной пары ZFN и 100 мкг/мл для оптимизированной пары). Геномную ДНК выделяли через 2 дня после трансфекции из этих клеток и необработанных контролей с последующей ПЦР-амплификацией каждого локуса-кандидата и глубоким сиквенированием для количественного определения уровней инделов.In addition, to determine which ZFN constructs were most specific, indel analyzes of known off-target cleavage sites by the parent ZFN pair were performed in ZFN-treated CD34+ HSPCs. To do this, human CD34+ HSPCs derived from mobilized peripheral blood were treated with the original and optimized ZFN pairs using clinical conditions and mRNA concentrations (120 μg/ml for the original ZFN pair and 100 μg/ml for the optimized pair). Genomic DNA was isolated 2 days posttransfection from these cells and untreated controls, followed by PCR amplification of each candidate locus and deep sequencing to quantify indel levels.

Уровни модификации в каждом локусе определяли путем глубокого сиквенирования парных концов (paired-end deep sequencing) на Illumina MiSeq с использованием картриджа на 300 циклов. Парные последовательности были объединены, адапторы обрезаны через SeqPrep, отфильтрованы для оценки качества >15 по всем основаниям, а затем картированы в геном человека (сборка hg38). Последовательности, картированные в неправильный локус, были отброшены. Последовательности короче чем ампликон дикого типа, на >70 п.н. или >70% были удалены для минимизации продуктов праймер-димер. Выравнивание по Нидлману-Вуншу (Needleman and Wunsch, (1970), J Mol Biol 48(3):443-53)) выполняли между целевым ампликоном и каждым прочтением MiSeq для картирования инделов. Инделы в выровненных последовательностях были определены, как описано в Gabriel et al. 2011 (там же), за исключением того, что были приняты индексы длиной 1 п.о., чтобы избежать недооценки реальных явлений. Обратите внимание, что часть локусов либо не амплифицировалась, либо не сиквенировалась, либо была отклонена из анализа из-за высокого фона (>1% модификации в контрольных образцах) или недостаточной глубины сиквенирования (<10000 считываний). Результаты этого анализа и сравнения с родительской парой 51857/51949 ZFN представлены ниже в табл. 2.Levels of modification at each locus were determined by paired-end deep sequencing on an Illumina MiSeq using a 300-cycle cartridge. Pairwise sequences were concatenated, adapters trimmed through SeqPrep, filtered for quality scores >15 across all bases, and then mapped to the human genome (assembly hg38). Sequences mapped to the wrong locus were discarded. The sequences are shorter than the wild type amplicon by >70 bp. or >70% were removed to minimize primer-dimer products. A Needleman-Wunsch alignment (Needleman and Wunsch, (1970) J Mol Biol 48(3):443-53) was performed between the target amplicon and each MiSeq read for indel mapping. Indels in the aligned sequences were defined as described in Gabriel et al. 2011 (ibid.), except that 1 bp indices were adopted to avoid underestimating the real phenomena. Note that a subset of loci were either not amplified, not sequenced, or were rejected from analysis due to high background (>1% modification in control samples) or insufficient sequencing depth (<10,000 reads). The results of this analysis and comparison with the parent pair 51857/51949 ZFN are presented in table below. 2.

________Таблица 2. Анализ разрезания вне мишени________________Table 2. Off-target cutting analysis________

Димер Z FN Dimer Z FN Вне мишени: количество локусов Off-target: number of loci количество инделпозитивных локусов ВМ (вне мишени) number of indel-positive VM loci (off-target) Левый Left Правы й Right мкг РНК Л :П mcg RNA L:P BCL11A % инделов BCL11A % indels мишень target ПЦР PCR Привод но для анализа Drive but for analysis Р<0, 05 P<0.05 ручная manual В родитель ском? Захват/ подтверж дено In parental language? Capture/confirmed 51857 51857 51949 51949 60: 60 60: 60 73,0 73.0 23 23 21 21 17 17 15 15 17 17 - - 63014 63014 65722 65722 60: 15 60: 15 82,2 82.2 31 31 24 24 14 14 0 0 4 4 4/3 4/3 63014 63014 65526 65526 60: 15 60: 15 81,2 81.2 23 23 22 22 9 9 3 3 4 4 4/4 4/4 63014 63014 65527 65527 60: 60 60: 60 81,4 81.4 30 thirty 24 24 10 10 4 4 4 4 4/2 4/2 63014 63014 65549 65549 60: 60 60: 60 80,0 80.0 30 thirty 24 24 13 13 0 0 2 2 2/1 2/1 63014 63014 65550 65550 60: 60 60: 60 79,8 79.8 30 thirty 24 24 9 9 0 0 1 1 1/1 1/1 65459 65459 65526 65526 60: 15 60: 15 76, 9 76, 9 23 23 19 19 14 14 0 0 2 2 2/2 2/2

Пример 4. Активность ZFN в CD34+ клетках человекаExample 4: ZFN activity in human CD34+ cells

Для тестирования in vitro нуклеазы тестировали в CD34+ клетках. ZFN поставляли в виде мРНК, где мРНК получали in vitro следующим образом: плазмиды, содержащие гены, кодирующие ZFN, линеаризуют и используют для транскрипции мРНК in vitro с использованием набора mMessage mMachine® T7 Ultra (Ambion/Applied Biosystems). Затем мРНК очищали с использованием мини-набора RNeasy® (Qiagen). CD34+ клетки выделяли из мобилизованной периферической крови и поддерживали в среде XVIVO 10, дополненной пенициллином, стрептомицином и глютамином, а также StemSpan CC110, и инкубировали при 37°С и 5% CO2. Клетки трансфицировали через 48 ч после выделения или после оттаивания. Небольшую аликвоту смешивали в соотношении 1:1 с раствором трипанового синего 0,4% (вес/объем) в PBS (Corning), и количество клеток определяли на автоматическом счетчике клеток ТС20 (Bio-Rad).For in vitro testing, nucleases were tested in CD34+ cells. ZFN was supplied as mRNA, where the mRNA was prepared in vitro as follows: plasmids containing genes encoding ZFN were linearized and used to transcribe the mRNA in vitro using the mMessage mMachine® T7 Ultra kit (Ambion/Applied Biosystems). The mRNA was then purified using the RNeasy® mini kit (Qiagen). CD34+ cells were isolated from mobilized peripheral blood and maintained in XVIVO 10 medium supplemented with penicillin, streptomycin and glutamine, as well as StemSpan CC110, and incubated at 37°C and 5% CO 2 . Cells were transfected 48 h after isolation or after thawing. A small aliquot was mixed 1:1 with trypan blue 0.4% (wt/vol) in PBS (Corning), and cell numbers were determined on a TC20 automatic cell counter (Bio-Rad).

- 35 045868- 35 045868

Для крупномасштабных трансфекций клетки промывали буфером электропорации MaxCyte (Maxcyte) и ресуспендировали при 3-5е7 клеток на мл в буфере электропорации в 100 мкл. Как правило, концентрации мРНК между 60 и 120 мкг/мл использовались для скрининга подходящих наборов ZFN. Затем клетки выращивали в среде для выращивания в 3e6 клеток на мл в течение 18 ч при температуре 30°С, а затем разводили до 1еб клеток на мл в течение дополнительных 24 ч при 37°С. Для определения активности разрезания геномную ДНК выделяли через 2-3 дня после трансфекций, и уровень модификации гена в локусе энхансера BCL11A измеряли путем глубокого сиквенирования на сиквенаторе MiSeq (Illumina).For large-scale transfections, cells were washed with MaxCyte electroporation buffer (Maxcyte) and resuspended at 3-5e7 cells per ml in 100 μl electroporation buffer. Typically, mRNA concentrations between 60 and 120 μg/mL have been used to screen suitable ZFN arrays. Cells were then grown in growth medium at 3e6 cells per ml for 18 h at 30°C and then diluted to 1e6 cells per ml for an additional 24 h at 37°C. To determine cutting activity, genomic DNA was isolated 2–3 days after transfections, and the level of gene modification at the BCL11A enhancer locus was measured by deep sequencing on a MiSeq sequencer (Illumina).

Пары ZFN из табл. 1 были протестированы в CD34+ клетках, и результаты активности показаны ниже в табл. 3.ZFN pairs from table. 1 were tested in CD34+ cells and the activity results are shown in Table 1 below. 3.

Таблица 3. Активность пар ZFN против мишени BCL11ATable 3. Activity of ZFN pairs against the target BCL11A

Правый ZFN Right ZFN Левый ZFN Left ZFN П ZFN конц. (мкг) P ZFN conc. (mcg) Л ZFN конц. (мкг) L ZFN conc. (mcg) Инделы (%) Indels (%) 51857 51857 51949 51949 60 60 60 60 72,98 72.98 63014 63014 65722 65722 15 15 60 60 80, 62 80, 62 63014 63014 65722 65722 60 60 15 15 82,19 82.19 63014 63014 65526 65526 60 60 15 15 81,22 81.22 63014 63014 65527 65527 60 60 60 60 81,43 81.43 63014 63014 65549 65549 60 60 60 60 79, 82 79, 82 63014 63014 65550 65550 60 60 60 60 79, 96 79, 96 GFP-контроль GFP control 0, 07 0.07

В дополнение к анализу нуклеазной активности в CD34+ клетках до эритроидной дифференцировки, отредактированные клетки также дифференцировались in vitro в эритроидные клетки. Протокол был основан на публикации Giarratana et al. ((2011) Blood 120 (15):294 5-53). Вкратце следовали протоколу указанному ниже.In addition to analyzing nuclease activity in CD34+ cells prior to erythroid differentiation, the edited cells were also differentiated in vitro into erythroid cells. The protocol was based on the publication of Giarratana et al. ((2011) Blood 120 (15):294 5-53). The protocol given below was briefly followed.

День 0 - день 7: 4х104 CD34+ клеток культивировали с плотностью 2х104/мл в среде для дифференцировки (EDM) (модифицированная среда Дульбекко Искова [IMDM], 330 мкг/мл трансферрина, 10 мкг/мл человеческого инсулина, 2 Е/мл гепарина натрия, 5% человеческой АВ+плазмы) в присутствии 10-6 М гидрокортизона, 100 нг/мл фактора стволовых клеток (СКФ), 5 нг/мл ИЛ 3 и 3 МЕ/мл эритропоэтина (ЭПО).Day 0 - Day 7: 4x104 CD34+ cells were cultured at a density of 2x104/ml in differentiation medium (EDM) (Iscove's modified Dulbecco's medium [IMDM], 330 μg/ml transferrin, 10 μg/ml human insulin, 2 U/ml heparin sodium, 5% human AB + plasma) in the presence of 10 -6 M hydrocortisone, 100 ng/ml stem cell factor (GFR), 5 ng/ml IL 3 and 3 IU/ml erythropoietin (EPO).

День 4: клетки ресуспендируют в свежем EDM, содержащем SCF, ИЛ-3, ЭПО и гидрокортизон.Day 4: Cells are resuspended in fresh EDM containing SCF, IL-3, EPO and hydrocortisone.

День 7 - День 11: Клетки ресуспендировали с плотностью 1,5х 105 клеток на мл свежего EDM с добавлением SCF и ЭПО.Day 7 - Day 11: Cells were resuspended at a density of 1.5 x 105 cells per ml of fresh EDM supplemented with SCF and EPO.

День 11 - день 21: В день 11 клетки пересаживали в концентрации 1х106/мл в свежем EDM с добавлением ЭПО. Клетки впоследствии были пересажены в эту же среду в концентрации 5х106/мл на 14 день. Рост выходит на плато в течение этого периода времени между 14 и 18 днями, когда жизнеспособность клеток начала падать до прекращения культур на 21 день.Day 11 - Day 21: On Day 11, cells were transplanted at a concentration of 1x10 6 /ml in fresh EDM supplemented with EPO. The cells were subsequently transplanted into the same medium at a concentration of 5x10 6 /ml on day 14. Growth plateaued during this time period between days 14 and 18, when cell viability began to decline until cultures ceased at 21 days.

Клетки подсчитывали перед посевом и на протяжении всей дифференциации путем измерения положительности по Акридиновому Оранжевому и исключению йодида пропидия (AOPI) с использованием клеткомера Nexcelom Bioscience K2 с режимом AOPI Erythroid Assay с флуоресцентным каналом 1 (АО), установленным на 700 мс, и флуоресцентным каналом 2 (PI) установленным на 5000 мс.Cells were counted before plating and throughout differentiation by measuring Acridine Orange positivity and propidium iodide exclusion (AOPI) using a Nexcelom Bioscience K2 cell meter with AOPI Erythroid Assay mode with fluorescence channel 1 (AO) set to 700 ms and fluorescence channel 2 (PI) set to 5000 ms.

Процент энуклеированных клеток (клеток без ядра) определяли на 21 день дифференцировки с использованием следующего протокола. Уровень энуклеации был сопоставим среди нетрансфицированных контролей и ZFN-трансфицированных образцов с процентным содержанием 59-63% из этих двух групп.The percentage of enucleated cells (cells without a nucleus) was determined at day 21 of differentiation using the following protocol. Enucleation rates were comparable among untransfected controls and ZFN-transfected samples, with percentages of 59–63% from the two groups.

1. Количество клеток.1. Number of cells.

2. 100000 клеток, центрифугирование при 450хg, 5 мин, КТ.2. 100,000 cells, centrifugation at 450xg, 5 min, RT.

3. Ресуспендирование в 50 мкл PBS-BSA+1 мкл GlyA-FITC (DAKO).3. Resuspension in 50 µl PBS-BSA + 1 µl GlyA-FITC (DAKO).

4. Окрашивание 15 мин в холодильнике.4. Coloring for 15 minutes in the refrigerator.

5. Добавление 1 мл PBS-BSA, вортекс, центрифугирование.5. Add 1 ml PBS-BSA, vortex, centrifuge.

6. Ресуспендирование в 250 мкл PBS-BSA-NucRed (2 капли NucRed на мл).6. Resuspend in 250 µl PBS-BSA-NucRed (2 drops NucRed per ml).

7. Получение данных на FACS Canto, используя канал АРС для NucRed.7. Receive data on FACS Canto using the APC channel for NucRed.

8. Эритроидные клетки с ядром будут находиться в GlyA-положительной NucRedотрицательной/низкой фракции, а эритробласты будут в двойной GlyA-NucRed-положительной фракции.8. Nucleated erythroid cells will be in the GlyA-positive NucRed-negative/low fraction, and erythroblasts will be in the double GlyA-NucRed-positive fraction.

Модификацию гена BCL11A измеряли с помощью глубокого сиквенирования MiSeq в образцах ДНК, собранных: а) через 48 ч после электропорации, b) в день оттаивания клеток, в то время, когда начиналась дифференцировка in vitro, и с) на 14-й день эритроидной дифференциации in vitro. Хотя дифференцировка проводилось в течение 21 дня, была выбрана временная точка в 14-й день для анализа ДНК, поскольку она предшествует энуклеации большой части эритроидных клеток, которая приводит к потерям при выделении ДНК. Наблюдаемые проценты модификации на энхансере BCL11A приведены в табл. 4 вместе с подробностями условий трансфекции.BCL11A gene modification was measured using MiSeq deep sequencing in DNA samples collected: a) 48 h after electroporation, b) on the day of cell thawing, at the time in vitro differentiation began, and c) on day 14 of erythroid differentiation in vitro. Although differentiation was carried out for 21 days, the time point of day 14 was chosen for DNA analysis because it precedes the enucleation of a large proportion of erythroid cells, which results in losses during DNA extraction. The observed percentages of modification at the BCL11A enhancer are given in Table. 4 along with details of transfection conditions.

- 36 045868- 36 045868

Таблица 4. , Уровни модификации гена BCL11A определенные с помощью анализа MiSeqTable 4. BCL11A gene modification levels determined using MiSeq analysis

Препарат CD34 + A drug CD34+ Трансфекция Transfection Модификация гена BCL11A (%) BCL11A gene modification (%) День 2 Day 2 После After 14 —й день 14th day клеток Препарат №1 cells Drug No. 1 80 мкг/мл 63014+20 мкг/мл 65722 нетрансфецированные 80 µg/ml 63014+20 µg/ml 65722 untransfected после ТФ 78, 6 0, 1 after TF 78, 6 0, 1 оттаивания 81,4 0,2 defrosting 81.4 0.2 дифференциа ции. 72,0 0,2 differentiation. 72.0 0.2 Препарат №2 A drug No. 2 80 мкг/мл 63014+20 мкг/мл 65722 80 µg/ml 63014+20 µg/ml 65722 75, 4 75, 4 77,3 77.3 72,3 72.3 нетрансфецированные untransfected 0, 1 0, 1 0, 1 0, 1 0, 0 0, 0

Эти данные показывают, что трансфекция клеток CD34+ оптимизированной парой мРНК 63014 и 65722 приводит к очень эффективной модификации генов в сайте-мишени энхансера BCL11A (> 75% модифицированных аллелей) и что модификация сохраняется очень хорошо (>90% удержания модификации) после замораживания и оттаивания клеток и после эритроидной дифференцировки. ZFN пара 63014/65722 была выбрана для дальнейшего анализа. Аминокислотные последовательности этих ZFN показаны ниже, причем каждая содержит сигнал ядерной локализации (NLS -nuclear localization signal, Kalderon et al. (1984) Cell 39 (3 Pt 2):499-509) и гидрофильный пептид (Hopp et al. (1988) Nat Biotechnol 6:1204-10), который усиливает активность ZFN на мишени, оба слиты с N-концевой кодирующей последовательностью. Таким образом, последовательность мРНК и аминокислотная последовательность ZFN являются следующими:These data show that transfection of CD34+ cells with the optimized mRNA pair 63014 and 65722 results in very efficient gene modification at the BCL11A enhancer target site (>75% of alleles modified) and that the modification is retained very well (>90% modification retention) after freezing and thawing cells and after erythroid differentiation. ZFN pair 63014/65722 was selected for further analysis. The amino acid sequences of these ZFNs are shown below, each containing a nuclear localization signal (NLS -nuclear localization signal, Kalderon et al. (1984) Cell 39 (3 Pt 2):499-509) and a hydrophilic peptide (Hopp et al. (1988) Nat Biotechnol 6:1204-10), which enhances the activity of ZFN on the target, both fused to the N-terminal coding sequence. Thus, the mRNA sequence and amino acid sequence of ZFN are as follows:

63014 мРНК (1725 нт)63014 mRNA (1725 nt)

5'gggagacaagcuuugaauuacaagcuugcuuguucuuuuugcagaagcucagaauaa acgcucaacuuuggcagaucgaauucgccauggacuacaaagaccaugacggugauuauaaaga ucaugacaucgauuacaaggaugacgaugacaagauggcccccaagaagaagaggaaggucggc auccacgggguacccgccgcuauggcugagaggcccuuccagugucgaaucugcaugcagaacu ucagugaccaguccaaccugcgcgcccacauccgcacccacaccggcgagaagccuuuugccug ugacauuugugggaggaaauuugcccgcaacuucucccugaccaugcauaccaagauacacacg ggcagccaaaagcccuuccagugucgaaucugcaugcagaacuucaguuccaccggcaaccuga ccaaccacauccgcacccacaccggcgagaagccuuuugccugugacauuugugggaggaaauu ugccaccuccggcucccugacccgccauaccaagauacacacgcacccgcgcgccccgaucccg aagcccuuccagugucgaaucugcaugcagaacuucagugaccaguccaaccugcgcgcccaca uccgcacccacaccggcgagaagccuuuugccugugacauuugugggaggaaauuugccgccca guguugucuguuccaccauaccaagauacaccugcggggauccaucagcagagccagaccacug aacccgcacccggagcuggaggagaagaaguccgagcugcggcacaagcugaaguacgugcccc acgaguacaucgagcugaucgagaucgccaggaacagcacccaggaccgcauccuggagaugaa ggugauggaguucuucaugaagguguacggcuacaggggaaagcaccugggcggaagcagaaag ccugacggcgccaucuauacagugggcagccccaucgauuacggcgugaucguggacacaaagg ccuacagcggcggcuacaaucugccuaucggccaggccgacgagauggagagauacguggagga gaaccagacccgggauaagcaccucaaccccaacgagugguggaagguguacccuagcagcgug accgaguucaaguuccuguucgugagcggccacuucaagggcaacuacaaggcccagcugacca ggcugaaccacaucaccaacugcaauggcgccgugcugagcguggaggagcugcugaucggcgg cgagaugaucaaagccggcacccugacacuggaggaggugcggcgcaaguucaacaacggcgag aucaacuucagaucuugauaacucgagucuagaagcucgcuuucuugcuguccaauuucuauua aagguuccuuuguucccuaaguccaacuacuaaacugggggauauuaugaagggccuugagcau cuggauucugccuaauaaaaaacauuuauuuucauugcugcgcuagaagcucgcuuucuugcug uccaauuucuauuaaagguuccuuuguucccuaaguccaacuacuaaacugggggauauuauga agggccuugagcaucuggauucugccuaauaaaaaacauuuauuuucauugcugcgggacauuc uuaauuaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aacuag (SEQ ID NO:28).5'ggggagacaagcuuugaauuacaagcuugcuuguucuuuuugcagaagcucagaauaa acgcucaacuuuggcagaucgaauucgccauggacuacaaagaccaugacggugauuauaaaga ucaugacaucgauuacaaggaugacgaugacaagauggcccccaagaagaagaggaaggucggc auccacgggguacccgccgcuauggcugagaggcccuuccagugucga aucugcaugcagaacu ucagugaccaguccaaccugcgcgcccacauccgcacccacaccggcgagaagccuuuugccug ugacauuugugggaggaaauuugcccgcaacuucucccugaccaugcauaccaagauacacacg ggcagccaaaagcccuuccagugucgaaucugcaugcagaacuucaguuccaccggcaaccuga ccaaccacauccgcaccca caccggcgagaagccuuuugccugugacauuugugggaggaaauu ugccaccuccggcucccugacccgccauaccaagauacacacgcacccgcgcgccccgaucccg aagcccuuccagugucgaaucugcaugcagaacuucagugaccaguccaaccugcgcgcccaca uccgcaccacacaccggcgagaagccuuuugccugugacauuuguggga ggaaauuugccgccca guguugucuguuccaccauaccaagauacaccugcggggauccaucagcagagccagaccacug aacccgcacccggagcuggaggagaagaaguccgagcugcggcacaagcugaaguacgugcccc acgaguacaucgagcugaucgagaucgccaggaacagcacccaggaccgcauccuggagaugaa ggugauggaguucuucaugaagguguacggcu acaggggaaagcaccugggcggaagcagaaag ccugacggcgccaucuauacagugggcagccccaucgauuacggcgugaucguggacacaaagg ccuacagcggcggcuacaaucugccuaucggccaggccgacgagauggagagauacguggagga gaaccagacccgggauaagcaccucaaccccaacgagugguggaagguguacccuagcagcgug accga guucaaguuccuguucgugagcggccacuucaagggcaacuacaaggcccagcugacca ggcugaaccacaucaccaacugcaauggcgccgugcugagcguggaggagcugcugaucggcgg cgagaugaucaaagccggcacccugacacuggaggaggugcggcgcaaguucaacaacggcgag aucaacuucagaucuugauaacucgagucuagaagcuc agg gccuugagcaucuggauucugccuaauaaaaaacauuuauuuucauugcugcgggacauuc uuauauuaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa (SEQ ID NO:28).

Аминокислотная последовательность 63014 (области спирали распознавания подчеркнуты; линкер изображен большими буквами курсивом; мутации в остатках остова пальцев 1, 3 и 5 показаны двойным подчеркиванием; мутации домена димеризации (ELD) показаны жирным шрифтом и курсивом); гидрофильный пептид показан текстом маленькими буквами; и сигнал ядерной локализации (NLS) изображен маленькими буквами курсивом):Amino acid sequence 63014 (recognition helix regions are underlined; linker is shown in capital letters in italics; mutations in backbone residues 1, 3 and 5 are shown in double underlines; mutations in the dimerization domain (ELD) are shown in bold and italics); the hydrophilic peptide is shown in small text; and the nuclear localization signal (NLS) is shown in small italic letters):

- 37 045868- 37 045868

MdykdhdgdykdhdidykddddkMApkkkrkvGIHGVPAAMAERPFQCRICMQNFSDQSNLRAH IRTHTGEKPFACDICGRKFARNFSLTMHTKIHTGSQKPFQCRICMQNFSSTGNLTNHIRTHTGE KPFACDICGRKFATSGSLTRHTKIHTHPRAPIPKPFQCRICMQNFSDQSNLRAHIRTHTGEKPF ACDICGRKFAAQCCLFHHTKIHLRGSISRARPLNPHPELEEKKSELRHKLKYVPHEYIELIEIA RNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPI GQADEMERYVEENQTRDKHLNPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNG AVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRS (SEQ ID NO:29).MdykdhdgdykdhdidykddddkMApkkkrkvGIHGVPAAMAERPFQCRICMQNFSDQSNLRAH IRTHTGEKPFACDICGRKFARNFSLTMHTKIHTGSQKPFQCRICMQNFSSTGNLTNHIRTHTGE KPFACDICGRKFATSGSLTRHTKIHTHPRAPIPKPFQCRICMQNFSDQSNLRAHIRTHTGEKPF ACDICGRKFA AVLSVEELLIGGE MIKAGTLTLEEVRRKFNNGEINFRS (SEQ ID NO:29).

мРНК 65722 (1680 нуклеотидов):mRNA 65722 (1680 nucleotides):

5'gggagacaagcuugaauacaagcuugcuuguucuuuuugcagaagcucagaauaaac gcucaacuuuggcagaucgaauucgccuagagaucuggcggcggagagggcagaggaagucuuc uaaccugcggugacguggaggagaaucccggcccuaggaccauggacuacaaagaccaugacgg ugauuauaaagaucaugacaucgauuacaaggaugacgaugacaagauggcccccaagaagaag aggaaggucggcauucaugggguacccgccgcuauggcugagaggcccuuccagugucgaaucu gcaugcagaaguuugcccgcaacgaccaccgcaccacccauaccaagauacacacgggcgagaa gcccuuccagugucgaaucugcaugcagaacuucagucagaaggcccaccugauccgccacauc cgcacccacaccggcgagaagccuuuugccugugacauuugugggaggaaauuugcccagaagg gcacccugggcgagcauaccaagauacacacgggaucucagaagcccuuccagugucgaaucug caugcagaacuucagucgcggccgcgaccugucccgccacauccgcacccacaccggcgagaag ccuuuugccugugacauuugugggaggaaauuugcccgccgcgacaaccugcacucccauacca agauacaccugcggggaucccagcuggugaagagcgagcuggaggagaagaaguccgagcugcg gcacaagcugaaguacgugccccacgaguacaucgagcugaucgagaucgccaggaacagcacc caggaccgcauccuggagaugaaggugauggaguucuucaugaagguguacggcuacaggggaa agcaccugggcggaagcagaaagccugacggcgccaucuauacagugggcagccccaucgauua cggcgugaucguggacacaaaggccuacagcggcggcuacaaucugccuaucggccaggccgac gagaugcagagauacgugaaggagaaccagacccggaauaagcacaucaaccccaacgaguggu ggaagguguacccuagcagcgugaccgaguucaaguuccuguucgugagcggccacuucagcgg caacuacaaggcccagcugaccaggcugaaccgcaaaaccaacugcaauggcgccgugcugagc guggaggagcugcugaucggcggcgagaugaucaaagccggcacccugacacuggaggaggugc ggcgcaaguucaacaacggcgagaucaacuucugauaacucgagucuagaagcucgcuuucuug cuguccaauuucuauuaaagguuccuuuguucccuaaguccaacuacuaaacugggggauauua ugaagggccuugagcaucuggauucugccuaauaaaaaacauuuauuuucauugcugcgcuaga agcucgcuuucuugcuguccaauuucuauuaaagguuccuuuguucccuaaguccaacuacuaa acugggggauauuaugaagggccuugagcaucuggauucugccuaauaaaaaacauuuauuuuc auugcugcgggacauucuuaauuaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaacuag (SEQ ID NO:30).5'gggagacaagcuugaauacaagcuugcuuguucuuuuugcagaagcucagaauaaac gcucaacuuuggcagaucgaauucgccuagagaucuggcggcggagagggcagaggaagucuuc uaaccugcggugacguggaggagaaucccggcccuaggaccauggacuacaaagaccaugacgg ugauuauaaagaucaugacaucgauuacaaggaugacgaugaca agauggcccccaagaagaag aggaaggucggcauucaugggguacccgccgcuauggcugagaggcccuuccagugucgaaucu gcaugcagaaguuugcccgcaacgaccaccgcaccacccauaccaagauacacgggcgagaa gcccuuccagugucgaaucugcaugcagaacuucagucagaaggcccaccugauccgccacauc cgcacccacaccggcgagaag ccuuuugccugugacauuugugggaggaaauuugcccagaagg gcacccugggcgagcauaccaagauacacacgggaucucagaagcccuuccagugucgaaucug caugcagaacuucagucgcggccgcgaccugucccgccacauccgcacccacaccggcgagaag ccuuuugccugugacauuugugggaggaauuugcccgccgcgacaaccug cacucccauacca agauacaccugcggggaucccagcuggugaagagcgagcuggaggagaagaaguccgagcugcg gcacaagcugaaguacgugccccacgaguacaucgagcugaucgagaucgccaggaacagcacc caggaccgcauccuggagaugaaggugauggaguucuucaugaagguguacggcuacaggggaa agcaccugggcggaagcagaaagccugac ggcgccaucuauacagugggcagccccaucgauua cggcgugaucguggacacaaaggccuacagcggcggcuacaaucugccuaucggccaggccgac gagaugcagagauacgugaaggagaaccagacccggaauaagcacaucaaccccaacgaguggu ggaagguguacccuagcagcgugaccgaguucaaguuccuguucgugagcggccacuucagcgg ca acuacaaggcccagcugaccaggcugaaccgcaaaaccaacugcaauggcgccgugcugagc guggaggagcugcugaucggcggcgagaugaucaaagccggcacccugacuggaggaggugc ggcgcaaguucaacaacggcgagaucaacuucugauaacucgagucuagaagcucgcuuucuug cuguccaauuucuauuaaagguuccuuuguuc ccuaaguccaacuacuaaacugggggauauua ugaagggccuugagcaucuggauucugccuaauaaaaaacauuuuauuuucauugcugcgcuaga agcucgcuuucuugcuguccaauuucuauuaaagguuccuuuguucccuaaguccaacuacuaa acugggggauauuaugaagggccuugagcaucuggauucugccuaauaaaaacauuuau (SEQ ID NO:30).

Аминокислотная последовательность 65722 (области спирали распознавания подчеркнуты; линкер изображен большими буквами курсивом; гидрофильный пептид маленькими буквами; сигнал локализации нуклеазы показан маленькими буквами курсивом; мутации в остатках остова пальцев 1, 2 и 4 показаны двойным подчеркиванием; мутации домена димеризации (ELD) показаны жирным шрифтом и курсивом; а фосфат-контактная мутация(ии) FokI показана волнистым подчеркиванием):Amino acid sequence 65722 (recognition helix regions are underlined; linker is shown in large italic letters; hydrophilic peptide is shown in small letters; nuclease localization signal is shown in small italic letters; mutations in backbone residues 1, 2 and 4 are shown in double underline; dimerization domain (ELD) mutations are shown in bold type and italics; and FokI phosphate contact mutation(s) are shown with wavy underlining):

MdvkdhdgdvkdhdidvkddddkMApkkkrkvGIHGVPAAMAERPFOCRICMOKFARNDMdvkdhdgdvkdhdidvkddddkMApkkkrkvGIHGVPAAMAERPFOCRICMOKFARND

HRTTΗТКIΗТGEКРFQCRICMQNFSQKAHLIRHIRTΗТGEКРFACDIСGRKFAQKGTLGEΗТКI HTGSQKPFQCRICMQNFSRGRDLSRHIRTHTGEKPFACDICGRKFARRDNLHSHTKIHLRGSQL VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFTIKVYGYRGKHLGGSRKP DGAIYTVGS РIDYGVIVDTKAYS GGYNLPIGQADEMQRYVKENQTRNKHINPNEWWKVYPS SVT EFKFLFVSGHFSGNYKAQLTRLNPKTNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEI NF (SEQ ID NO:31).HRTTΗТКIΗТGEКРFQCRICMQNFSQKAHLIRHIRTΗТGEКРFACDИСGRKFAQKGTLGEΗТКI HTGSQKPFQCRICMQNFSRGRDLSRHIRTHTGEKPFACDICGRKFARRDNLHSHTKIHLRGSQL VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFTIKVYGYRGK HLGGSRKP DGAIYTVGS РIDYGVIVDTKAYS GGYNLPIGQADEMQRYVKENQTRNKHINPNEWWKVYPS SVT EFKFLFVSGHFSGNYKAQLTRLNPKTNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEI NF (SEQ ID NO:31).

Пример 5. Оценка уровня глобина в эритроидном потомствеExample 5: Assessment of globin levels in erythroid progeny

Уровни мРНК α-, β- и γ-глобина в клеточной мРНК, выделенной на 14-й день дифференцировки (до того, как общие уровни мРНК резко снижаются в ходе энуклеации и эритроидного созревания) определялись с помощью ОТ-кПЦР для двух препаратов клеток показанных выше в табл. 4. Значения мРНК γглобина показаны нормализованными относительно мРНК β-глобина (фиг. 5А) или значений мРНК αглобина (фиг. 5В) из тех же образцов (с использованием произвольных единиц основанных на соотношении в нетрансфицированноом ОТ-ПЦР стандарте определенном как 1).α-, β-, and γ-globin mRNA levels in cellular mRNA isolated at day 14 of differentiation (before total mRNA levels decline sharply during enucleation and erythroid maturation) were determined by RT-qPCR for the two cell preparations shown above in the table. 4. γglobin mRNA values are shown normalized to β-globin mRNA (Fig. 5A) or αglobin mRNA values (Fig. 5B) from the same samples (using arbitrary units based on the ratio in the untransfected RT-PCR standard defined as 1).

В обращенно фазовой ВЭЖХ образцов белка, выделенных на 21 день, измеряемый параметр дифференцировки эритроида, использовали для определения того, повышает ли опосредованная ZFN модиIn reverse phase HPLC of protein samples isolated at day 21, a measured parameter of erythroid differentiation was used to determine whether ZFN-mediated modi

- 38 045868 фикация энхансера BCL11A эритроцитов гемоглобин плода на уровне белка. Определяли отношение гамма-глобина (сумма пиков Агамма и Ггамма) к альфа-глобину, а также отношения гамма-глобина (сумма пиков Агамма и Ггамма) к бета-подобным глобинам (сумме пиков Агамма, Ггамма, бета и дельта-глобина) и они показаны на фиг. 6.- 38 045868 fication of the BCL11A enhancer of erythrocytes fetal hemoglobin at the protein level. The ratio of gamma globin (sum of Agamma and Ggamma peaks) to alpha globin, as well as the ratio of gamma globin (sum of Agamma and Ggamma peaks) to beta-like globins (sum of Agamma, Ggamma, beta and delta globin peaks) were determined and they are shown in Fig. 6.

В этом эксперименте приблизительно 3-4-кратное повышение процентного содержания белка глобина плода до уровней около 15-20% наблюдалось в эритроидном потомстве HSPC при 63014/65722опосредованном разрушении энхансера BCL11A.In this experiment, an approximately 3-4-fold increase in the percentage of fetal globin protein to levels of about 15-20% was observed in erythroid HSPC progeny upon 63014/65722-mediated disruption of the BCL11A enhancer.

Пример 6. Приживление отредактированных клеток у мышей NSGExample 6 Engraftment of Edited Cells in NSG Mice

Отредактированные человеческие CD34+ клетки затем инъецировали мышам NSG для оценки приживления. Степень человеческой химерности (т.е. процент клеток CD45+ человека) измеряли с использованием проточной цитометрии (FACS fluorescence activated cell sorting) в периферической крови, отобранной через 8, и 12, 16 и 20 недель после трансплантации, и в костном мозге, отобранном через 12 недель и 20 недель. Кроме того, для проверки уровня приживления ZFN-модифицированных клеток уровень разрушения гена в локусе энхансера BCL11A оценивали путем прямого высокопроизводительного сиквенирования локуса-мишени ZFN и сравнивали с уровнями модификации гена-мишени, измеренными в исходном материале.The edited human CD34+ cells were then injected into NSG mice to assess engraftment. The degree of human chimera (ie, the percentage of human CD45+ cells) was measured using flow cytometry (FACS fluorescence activated cell sorting) in peripheral blood collected at 8, and 12, 16 and 20 weeks after transplantation, and in bone marrow collected at 12 weeks and 20 weeks. In addition, to test the level of engraftment of ZFN-modified cells, the level of gene disruption at the BCL11A enhancer locus was assessed by direct high-throughput sequencing of the ZFN target locus and compared with the levels of target gene modification measured in the starting material.

HSPC от двух здоровых доноров (называемых PB-MR-003 и PB-MR-004) были мобилизованы с помощью G-SCF и Plerixafor и очищены, как описано в Yannaki et al. ((2012) Mol Ther 20(1):230-8. doi:10.1038/mt.2011). Деплецию тромбоцитов проводили на продукте лейкафереза с использованием устройства Fresenius-Kabi Lovo до его обогащения клетками CD34+ с использованием инструмента Miltenyi Biotech CliniMACS Plus. Затем очищенные клетки высевали в культуру для трансфекции.HSPCs from two healthy donors (termed PB-MR-003 and PB-MR-004) were mobilized with G-SCF and Plerixafor and purified as described in Yannaki et al. ((2012) Mol Ther 20(1):230-8. doi:10.1038/mt.2011). Platelet depletion was performed on the leukapheresis product using the Fresenius-Kabi Lovo device before enrichment with CD34+ cells using the Miltenyi Biotech CliniMACS Plus instrument. The purified cells were then seeded into culture for transfection.

Через два дня после очистки клеток CD34+ клетки подвергали электропорации с использованием инструмента Maxcyte в присутствии 120 мкг/мл одной мРНК, кодирующей родительскую пару ZFN, 63014/65722, или оптимизированных количеств двух отдельных мРНК, кодирующих оптимизированную пару ZFN 80мкг/мл 63014 и 20 мкг/мл 65722. Перед трансфекцией аликвоту клеток откладывали в качестве нетрансфицированного контроля. 95 миллионов клеток были трансфицированы из PB-MR-003, и 120 миллионов клеток были трансфицированы из PB-MR-004.Two days after cell purification, CD34+ cells were electroporated using the Maxcyte instrument in the presence of 120 μg/ml single mRNA encoding the parental ZFN pair, 63014/65722, or optimized amounts of two separate mRNAs encoding the optimized ZFN pair 80 μg/ml 63014 and 20 μg /ml 65722. Before transfection, an aliquot of cells was set aside as an untransfected control. 95 million cells were transfected from PB-MR-003, and 120 million cells were transfected from PB-MR-004.

После электропорации проводили временное культивирование в течение ночи при 30°С, и затем клетки культивировали в течение дополнительных 24 ч при 37°С. Через два дня после электропорации отбирали аликвоты клеток для анализа ДНК, а оставшиеся клетки собирали, криоконсервировали и хранили в жидком азоте.After electroporation, temporary culture was performed overnight at 30°C, and then the cells were cultured for an additional 24 hours at 37°C. Two days after electroporation, aliquots of cells were collected for DNA analysis, and the remaining cells were collected, cryopreserved, and stored in liquid nitrogen.

Кондиционирование:Conditioning:

Мышей обрабатывали 10 мг/кг/день воды с байтрилом (Baytril) за 1-2 дня до облучения и облучали сублетально 300 RAD за 16-24 ч до трансплантации. Трансплантация проводилась путем инъекции в хвостовую вену (см. ниже). Затем мыши получали свежую воду с байтрилом. Воду с байтрилом заменили через неделю, и добавление в воду байтрила было прекращено через 14 дней после трансплантации.Mice were treated with 10 mg/kg/day Baytril water 1–2 days before irradiation and sublethally irradiated with 300 RAD 16–24 h before transplantation. The transplant was performed by injection into the tail vein (see below). The mice then received fresh water containing Baytril. The Baytril water was changed after a week, and the addition of Baytril to the water was stopped 14 days after transplantation.

Трансплантация:Transplantation:

В день трансплантации предварительно разогрейте X-Vivo 10/1% PSG+коктейль из 3-х цитокинов (рекомбинантный фактор стволовых клеток человека (SCF), рекомбинантный тромбопоэтин человека (ТРО) и рекомбинантный лиганд Flt-3 человека (Flt-3L)) при 37°С, приготовьте свежий PBS/0,1% BSA при температуре окружающей среды (стерильный/отфильтрованный). Криоконсервированные клетки оттаивали при 37°С, осаждали, ресуспендировали в предварительно нагретой среде X-Vivo, снова осаждали, ресуспендировали в PBS/0,1% BSA и подсчитывали. После другого осаждения осадок клеток ресуспендировали в 550 мкл на мышь PBS/0,1% BSA (2χ10Λ6 клеток/мл в расчете на количество клеток). Затем клетки вводили при комнатной температуре в хвостовую вену мыши с помощью иглы 25 калибра. Группы исследования показаны ниже в табл. 5.On the day of transplantation, pre-warm X-Vivo 10/1% PSG + 3-cytokine cocktail (recombinant human stem cell factor (SCF), recombinant human thrombopoietin (TPO) and recombinant human Flt-3 ligand (Flt-3L)) at 37°C, prepare fresh PBS/0.1% BSA at ambient temperature (sterile/filtered). Cryopreserved cells were thawed at 37°C, pelleted, resuspended in prewarmed X-Vivo medium, pelleted again, resuspended in PBS/0.1% BSA, and counted. After another pelleting, the cell pellet was resuspended in 550 μl per mouse PBS/0.1% BSA (2χ10 Λ 6 cells/ml based on cell number). The cells were then injected at room temperature into the tail vein of the mouse using a 25-gauge needle. The study groups are shown in the table below. 5.

Таблица 5. Группы дозирования для приживления отредактированных клеток hCD34+Table 5. Dosing groups for engraftment of edited hCD34+ cells

Виды: Мышь Species: Mouse Пол, Возраст, Количество: 60 самок мышей NSG Gender, Age, Number: 60 female NSG mice Гру ппа № Group No. (Колво/гру ппу) (Quantity/group ppu) Исследуемый препарат Researchable a drug % инде лов (Сут ки 2) % Indian fishing (Day 2) Жизнеспособ ность через Id после оттаивания Viability via Id after defrosting Доза (клеток /мышь) Dose (cells/mouse) Кол-во/ Умерщвление Qty/ Killing 12-я недел я I'm 12 weeks 20-я неде ля 20th week

- 39 045868- 39 045868

Животных наблюдали ежедневно для оценки общего состояния здоровья и взвешивали ежедневно в течение первых 2 недель, а затем взвешивали каждые две недели. Периферическую кровь собирали из поднижнечелюстной вены (100 мкл) через 8, 12, 16 и 20 недель после трансплантации или через пункцию сердца (1 мл) для умерщвленных животных через 12 и 20 недель после трансплантации. Половину животных в каждой группе (5 мышей в группе) подвергали эвтаназии через 12 недель после трансплантации, а костный мозг и терминальную кровь собирали для анализа. Оставшихся животных в каждой группе (5 мышей на группу) умерщвляли через 20 недель после трансплантации.Animals were observed daily to assess general health and weighed daily for the first 2 weeks and then weighed every two weeks. Peripheral blood was collected from the submandibular vein (100 μl) at 8, 12, 16, and 20 weeks after transplantation or through cardiac puncture (1 ml) for sacrificed animals at 12 and 20 weeks after transplantation. Half of the animals in each group (5 mice per group) were euthanized 12 weeks after transplantation, and bone marrow and terminal blood were collected for analysis. The remaining animals in each group (5 mice per group) were sacrificed 20 weeks after transplantation.

Забор крови, сбор и обработка клеток: периферическую кровь отбирали через поднижнечелюстную вену или пункцию сердца в пробирки с ЭДТА и центрифугировали при 500xg в течение 5 мин для удаления плазмы. После промывки фосфатно-солевым буфером (PBS) с бычьим сывороточным альбумином (BSA) и центрифугирования к осадку добавляли 10-кратный объем гемолитического буфера, и смесь инкубировали при 37°С в течение 15 мин, центрифугировали и снова промывали. Осажденную фракцию восстанавливали в 1 мл PBS BSA; аликвоту удаляли и центрифугировали при 1000xg в течение 5 мин, а полученный осадок сохраняли для генотипирования. Фракцию супернатанта использовали для FACS анализов.Blood collection, cell collection and processing: Peripheral blood was collected through the submandibular vein or cardiac puncture into EDTA tubes and centrifuged at 500xg for 5 min to remove plasma. After washing with phosphate-buffered saline (PBS) with bovine serum albumin (BSA) and centrifugation, a 10-fold volume of hemolytic buffer was added to the pellet, and the mixture was incubated at 37°C for 15 min, centrifuged and washed again. The precipitated fraction was reconstituted in 1 ml PBS BSA; the aliquot was removed and centrifuged at 1000xg for 5 min, and the resulting pellet was saved for genotyping. The supernatant fraction was used for FACS analyses.

Костный мозг, бедренную кость, большеберцовую кость и тазовые кости собирали в модифицированную среду Дульбекко Искова (IMDM), содержащую фетальную сыворотку теленка (FCS); весь костный мозг промывали в растворе PBS BSA и фильтровали с использованием нейлонового сита с размером отверстий 70 мкм. Объем доводили до 10 мл с помощью PBS BSA, и аликвоту использовали для подсчета клеток (Cellometer).Bone marrow, femur, tibia, and pelvic bones were collected in Iscove's modified Dulbecco's medium (IMDM) containing fetal calf serum (FCS); the whole bone marrow was washed in PBS BSA solution and filtered using a 70 μm nylon sieve. The volume was adjusted to 10 ml with PBS BSA and an aliquot was used for cell counting (Cellometer).

Активность ZFN анализировали с использованием глубокого сиквенирования MiSeq. Вкратце, геномную ДНК от мышей, которым инъецировали либо нетрансфицированные контрольные CD34+ HSPC, либо CD34+ HSPC, трансфицированные энхансер-направленной мРНК ZFN, выделяли из образцов крови, полученных через 8 недель и 12 недель, или из костного мозга через 12 недель после инъекции. Оласть представляющую интерес (содержащую сайт связывания ZFN в локусе BCL11A) амплифицировали с помощью ПЦР и определяли уровень модификации путем глубокого сиквенирования с парными концами на платформе Illumina (MiSeq).ZFN activity was analyzed using MiSeq deep sequencing. Briefly, genomic DNA from mice injected with either untransfected control CD34+ HSPCs or CD34+ HSPCs transfected with enhancer-targeted ZFN mRNA was isolated from blood samples obtained at 8 weeks and 12 weeks, or from bone marrow at 12 weeks after injection. The region of interest (containing the ZFN binding site in the BCL11A locus) was amplified by PCR and the level of modification was determined by paired-end deep sequencing on the Illumina (MiSeq) platform.

Для создания библиотек, совместимых с платформой сиквенирования Illumina MiSeq, адаптеры, штрих-коды и связующее для проточной ячейки (короткая последовательность ДНК) были прикреплены к целевым специфическим ампликонам с использованием двух наборов праймеров для слияния в последовательных ПЦР. Для MiSeq оценки модификации энхансера BCL11A человека в образцах крови и костного мозга мыши протокол должен быть скорректирован из-за низких количеств целевой ДНК в этих образцах.To generate libraries compatible with the Illumina MiSeq sequencing platform, adapters, barcodes, and a flow cell binder (short DNA sequence) were attached to target specific amplicons using two sets of fusion primers in sequential PCRs. For MiSeq assessment of human BCL11A enhancer modification in mouse blood and bone marrow samples, the protocol must be adjusted due to the low amounts of target DNA in these samples.

Для адаптерного MiSeq ПЦР использовали следующие праймеры: PRJIYLFN-f2:For MiSeq adapter PCR, the following primers were used: PRJIYLFN-f2:

АСА CGA CGC ТСТ ТСС GAT CTN NNN AGT ССТ СТТ СТА ССС САС ССА (SEQ ID NO:32) иASA CGA CGC TCT TCC GAT CTN NNN AGT CCT CTT STA CCC CAC CCA (SEQ ID NO:32) and

PRJIYLFN-r4:PRJIYLFN-r4:

GAC GTG TGC ТСТ ТСС GAT СТС ТАС ТСТ TAG АСА ТАА САС ACC AGG G (SEQ ID NO:33).GAC GTG TGC TST TCC GAT STS TAS TCT TAG ACA TAA CAC ACC AGG G (SEQ ID NO:33).

Для анализа ДНК из образцов костного мозга мыши выделяли с помощью DNeasy и в каждой реакции ПЦР использовали приблизительно 100 нг ДНК. ДНК из образцов крови мыши выделяли с помощью Tissue XS, и в каждой реакции использовали 10 мкл 15 мкл выделенной ДНК. В дополнение к ДНК к каждой реакции MiSeq ПЦР добавляли следующее: 25 мкл смеси HotStar Taq (Qiagen), 0,5 мкл каждого изFor DNA analysis, mouse bone marrow samples were isolated using DNeasy and approximately 100 ng of DNA was used in each PCR reaction. DNA from mouse blood samples was isolated using Tissue XS, and 10 μl of 15 μl of extracted DNA was used in each reaction. In addition to DNA, the following was added to each MiSeq PCR reaction: 25 μl of HotStar Taq mix (Qiagen), 0.5 μl of each

- 40 045868 перечисленных выше праймеров энхансера BCL11A (в концентрации 100 нМ) и воду до 50 мкл общего объема реакции. Типичными условиями для MiSeq ПЦР были: денатурация при 95°С в течение 15 мин и 30 циклов при 94°С в течение 30 с, 62°С в течение 30 с и 72°С в течение 40 с с последующим удлинением в течение 10 мин при 72°С. После MiSeq ПЦР продукт ПЦР разводили водой между 1:50 и 1:200 или оставляли неразбавленным для образцов с очень низким исходным количеством клеток. Штрих-код ПЦР была выполнена с 1 мкл продукта MiSeq ПЦР, разведенного, как описано выше, 25 мкл смеси HotStar Taq, 1 мкл прямого штрих-код праймера, 1 мкл обратного штрих-код праймера (оба в концентрации 10 нМ) и воды до 50 мкл общего объема реакции. Условия штрих-код ПЦР были следующими: денатурация при 95°C в течение 15 мин и 18 циклов при 94°C в течение 30 с, 60°С в течение 30 с и 72°С в течение 30 с с последующим удлинением на протяжении 10 мин при 72°С. Продукты штрих-код ПЦР объединяли и сиквенировали на сиквенаторе Illumina MiSeq. Результаты показаны в табл. 5 выше.- 40 045868 BCL11A enhancer primers listed above (at a concentration of 100 nM) and water up to 50 μl of the total reaction volume. Typical conditions for MiSeq PCR were denaturation at 95°C for 15 min and 30 cycles of 94°C for 30 s, 62°C for 30 s and 72°C for 40 s followed by extension for 10 min. at 72°C. After MiSeq PCR, the PCR product was diluted with water between 1:50 and 1:200 or left undiluted for samples with very low initial cell counts. Barcode PCR was performed with 1 µl MiSeq PCR product diluted as described above, 25 µl HotStar Taq mix, 1 µl forward barcode primer, 1 µl reverse barcode primer (both at a concentration of 10 nM) and water to 50 µl total reaction volume. Barcode PCR conditions were as follows: denaturation at 95°C for 15 min and 18 cycles of 94°C for 30 s, 60°C for 30 s and 72°C for 30 s followed by extension for 10 min at 72°C. Barcode PCR products were pooled and sequenced on an Illumina MiSeq sequencer. The results are shown in table. 5 above.

FACS анализ на химеризм и определение клеточной линии. Для оценки степени человеческого химеризма фракцию клеток периферической крови (через 8, 12, 16 и 20 недель после приживления) и костного мозга (через 12 и 20 недель после приживления) окрашивали hCD45-APC Cy7 (Biolegend) и антителами к hCD45-BV510 (BD Biosciences) соответственно и проводили FACS анализ. Кроме того, проводили анализ гематопоэтических линий путем окрашивания клеток костного мозга специфическими антителами, описанными в табл. 6 ниже:FACS analysis for chimerism and cell lineage determination. To assess the extent of human chimerism, a fraction of peripheral blood cells (8, 12, 16, and 20 weeks postengraftment) and bone marrow (12 and 20 weeks postengraftment) were stained with hCD45-APC Cy7 (Biolegend) and anti-hCD45-BV510 antibodies (BD Biosciences) respectively and performed FACS analysis. In addition, hematopoietic lines were analyzed by staining bone marrow cells with specific antibodies described in Table. 6 below:

Таблица 6. Источники антител для клеточных маркеровTable 6. Sources of antibodies for cellular markers

Антитело Antibody Ссылки Links CD3-FITC: BD 561807 (клон UCHT1) CD3-FITC: BD 561807 (UCHT1 clone) BD 561807 BD 561807 CD19-PE: BD 340364 (клон SJ25C1) CD19-PE: BD 340364 (clone SJ25C1) BD 340364 BD 340364 CD45-BV510 CD45-BV510 BD 563204 BD 563204 Lin-APC (CD3/UCHT1, CD14/HCD14, CD16/3G8, CD19/HIB19, CD20/2H7, CD56/HCD56) Lin-APC (CD3/UCHT1, CD14/HCD14, CD16/3G8, CD19/HIB19, CD20/2H7, CD56/HCD56) BIOLEGEND 348803 BIOLEGEND 348803 CD33-PE-CF594 CD33-PE-CF594 BD 562492 BD 562492 GlyA-FITC GlyA-FITC DAKO 0870 DAKO 0870 CD38-PerCP Су5 . 5 CD38-PerCP Cy5. 5 BD 551400 BD 551400 CD14-РЕ CD14-PE BD 555398 BD 555398 CD34-PE Су7 CD34-PE Cy7 BD 560710 BD 560710 CD71-APC Су7/Н7 CD71-APC Cy7/H7 BD 563671 BD 563671 CD15-BV650 CD15-BV650 BD 564232 BD 564232 CD8-PerCP Су5. 5 CD8-PerCP Cy5. 5 BD 341051 BD 341051 CD4-PE Су7 CD4-PE Cy7 BD 344612 BD 344612 CD56-APC CD56-APC BD 318310 BD 318310 1дМ—АРС Су7 1dM—ARS Su7 BD 314520 BD 314520 CD20-BV650 CD20-BV650 BD 563780 BD 563780

Кроме того, для очистки и сортировки популяций HSPC мы использовали стратегию обогащения/деплеции с использованием магнитного разделения клеток (MACS). Клетки костного мозга сначала окрашивали CD19-6uotuhom, CD3-6uotuhom, В220-биотином, TER119-6uotuhom и m-ckit-биотином (BD Biosciences), а затем инкубировали с анти-биотин гранулами (Miltenyi Biotec).Additionally, we used an enrichment/depletion strategy using magnetic cell separation (MACS) to purify and sort HSPC populations. Bone marrow cells were first stained with CD19-6uotuhom, CD3-6uotuhom, B220-biotin, TER119-6uotuhom, and m-ckit-biotin (BD Biosciences) and then incubated with anti-biotin beads (Miltenyi Biotec).

Положительная фракция и обедненная фракция были разделены с использованием колонок LS (Miltenyi Biotec), помещенных в магнитное поле MACS. После разделения положительную фракцию окрашивали стрептавидином-АРС, CD3-FITC, CD19-PE, CD45-BV510 (BD Biosciences) и дебетированную фракцию с помощью CD34-FITC (BD Biosciences), Gly-A-PE (DAKO), CD19-APC (BD), Lin-APC (Biolegend), стрептавидин-АРС, CD45-BV510, CD33-PE-CF594 (BD) и CD38-PECy-7 (Biolegend).The positive fraction and the depleted fraction were separated using LS columns (Miltenyi Biotec) placed in a MACS magnetic field. After separation, the positive fraction was stained with streptavidin-APC, CD3-FITC, CD19-PE, CD45-BV510 (BD Biosciences) and the debit fraction with CD34-FITC (BD Biosciences), Gly-A-PE (DAKO), CD19-APC ( BD), Lin-APC (Biolegend), streptavidin-APC, CD45-BV510, CD33-PE-CF594 (BD), and CD38-PECy-7 (Biolegend).

Нетрансфицированные HSPC и 63014/65722 трансфицированные HSPC были привиты мышам NSG с использованием стандартных процедур, как описано выше. Степень человеческого химеризма у этих мышей после приживления оценивали путем измерения доли hCD45-положительных клеток с использованием FACS.Untransfected HSPCs and 63014/65722 transfected HSPCs were engrafted into NSG mice using standard procedures as described above. The extent of human chimerism in these mice after engraftment was assessed by measuring the proportion of hCD45-positive cells using FACS.

На фиг. 7 изображен процент клеток CD45+ человека в периферической крови, собранных через 8 и 12 недель после трансплантации, а на фиг. 8 изображены проценты клеток костного мозга, собранных на 12 неделе. Как показано, уровни приживления в этом исследовании были сопоставимы с человеческим химеризмом после приживления нетрансфицированного контроля и 63014/65722 трансфицированных HSPC. Только 3 мыши из 60, распределенных по группам, не имели клеток CD45+, что указывает на отсутствие приживления.In fig. 7 depicts the percentage of human CD45+ cells in peripheral blood collected at 8 and 12 weeks post-transplant, and FIG. Figure 8 depicts the percentages of bone marrow cells collected at week 12. As shown, engraftment levels in this study were comparable to human chimerism after engraftment of untransfected control and 63014/65722 transfected HSPCs. Only 3 mice out of 60 allocated to groups had no CD45+ cells, indicating lack of engraftment.

Восстановление различных гематопоэтических клеточных линий проверяли с помощью FACSанализа клеток костного мозга, полученных на 12-й неделе, с помощью антител, распознающих маркеры клеточной поверхности, специфичные для линий, с использованием стандартных процедур. Как показано на фиг. 9, наблюдали сравнимое представление всех проанализированных гематопоэтических линий человека в костном мозге на 12-й неделе после инъекции между потомством CD34+ клеток обработанныхRecovery of various hematopoietic cell lines was tested by FACS analysis of bone marrow cells obtained at week 12 using antibodies recognizing lineage-specific cell surface markers using standard procedures. As shown in FIG. 9 observed comparable representation of all analyzed human hematopoietic lineages in the bone marrow at 12 weeks post-injection between CD34+ cell-treated progeny

- 41 045868- 41 045868

BCLllA-специфичной мРНК, кодирующей ZFN, и потомством нетрансфицированных клеток. Костный мозг мышей, умерщвленных на 12-й неделе после приживления, выделяли, и распределение различных гематопоэтических линий было проанализировано с помощью FACS с использованием антител, распознающих указанные маркеры линий. Все числа приведены в виде отношения клеток, окрашенных положительно по указанному маркеру линии, к проценту человеческих CD45-положительных клеток, за исключением клеток, экспрессирующих эритроидный маркер Cd71+ (Ter119) на фиг. 9С, которые представлены как процент положительно окрашенных клеток во всей популяции, поскольку эритроидные клетки не являются CD45-положительными.BCLllA-specific mRNA encoding ZFN and the progeny of untransfected cells. Bone marrow from mice sacrificed at 12 weeks postengraftment was isolated, and the distribution of different hematopoietic lineages was analyzed by FACS using antibodies recognizing the indicated lineage markers. All numbers are given as the ratio of cells staining positive for the indicated lineage marker to the percentage of human CD45-positive cells, with the exception of cells expressing the erythroid marker Cd71+ (Ter119) in Fig. 9C, which are presented as the percentage of positively stained cells in the entire population, since erythroid cells are not CD45 positive.

Уровни модификации гена в эритроидном энхансере BCL11A (% аллелей со вставками и делециями [инделы]) оценивали путем глубокого сиквенирования области-мишени ZFN с использованием платформы сиквенирования MiSeq, как описано выше. Данные показаны на фиг. 10 для образцов крови 8-й недели и 12-й недели, а также на фиг. 11 для образцов костного мозга 12-й недели и отсортированных линий, полученных из образцов клеток костного мозга 12-й недели клеток обработанных 63014/65722. Для сравнения, процентные доли инделов, измеренные через 2 дня после трансфекции (как указано в табл. 5), также показаны на графиках фиг. 10 и 11.Levels of gene modification at the BCL11A erythroid enhancer (% insertion and deletion alleles [indels]) were assessed by deep sequencing of the ZFN target region using the MiSeq sequencing platform as described above. The data is shown in Fig. 10 for the 8th week and 12th week blood samples, and FIG. 11 for week 12 bone marrow samples and sorted lines derived from week 12 bone marrow samples of cells treated with 63014/65722. For comparison, the percentages of indels measured 2 days after transfection (as listed in Table 5) are also shown in the plots of Fig. 10 and 11.

Кроме того, для обоих наборов доноров HSPC, обработанных 63014/65722, было обнаружено сохранение генной модификации в энхансере BCL11A в различные моменты времени и в различных линиях. Сопоставимая модификация наблюдалась как в BCL11А-зависимых (В-клетках, 'CD19'; примитивных предшественниках, 'CD38H'), так и в BCLHA-независимых (миелоидных 'CD33') линиях. Хотя уровни вводимой генной модификации были выше в образце донора PB-MR-003, чем в образце донора PB-MR004, клетки полученные из PB-MR-004 последовательно демонстрируют более высокие уровни модификации, т.е. лучшее сохранение модификации у мышей, чем те, которые полученны из PB-MR-003.In addition, both sets of HSPC donors treated with 63014/65722 were found to maintain a gene modification in the BCL11A enhancer at different time points and in different lines. Comparable modification was observed in both BCL11A-dependent (B cells, 'CD19'; primitive progenitors, 'CD38H') and BCLHA-independent (myeloid 'CD33') lineages. Although the levels of introduced gene modification were higher in the donor sample PB-MR-003 than in the donor sample PB-MR004, cells derived from PB-MR-004 consistently exhibited higher levels of modification, i.e. better retention of the modification in mice than those derived from PB-MR-003.

В целом, наблюдаемое сохранение генной модификации у энхансера BCL11A у мышей соответствовало тому, что наблюдалось в предыдущих экспериментах на мышах с использованием ряда ZFN, нацеленных на различные генные мишени.Overall, the observed conservation of gene modification at the BCL11A enhancer in mice was consistent with what was observed in previous mouse experiments using a range of ZFNs targeting different gene targets.

Кроме того, поскольку эритроидные предшественники человека не способны дифференцироваться у мышей, чтобы определить количество, нацеленных на BCL11A, генных модификаций, которые имели место в этих клетках, клетки костного мозга были изъяты из мышей и дифференцированы in vitro. В этих экспериментах человеческие клетки, полученные из костного мозга, были изъяты из умерщвленных мышей на 12 неделе после приживления и дифференцированы in vitro, как описано выше. Модификацию гена-мишени BCL11A измеряли с помощью высокопроизводительного Miseq сиквенирования ДНК, выделенной из клеток, на 14-й день дифференцировки.Additionally, since human erythroid progenitors are unable to differentiate in mice, to determine the number of BCL11A-targeting gene modifications that occurred in these cells, bone marrow cells were removed from mice and differentiated in vitro. In these experiments, human bone marrow-derived cells were removed from sacrificed mice at 12 weeks postengraftment and differentiated in vitro as described above. BCL11A target gene modification was measured using Miseq high-throughput sequencing of DNA isolated from cells at day 14 of differentiation.

Данные модификации (инделы) представлены на фиг. 12, которая показывает уровни модификации на 14-й день эритроидной дифференцировки. Проценты инделов на 14-й день дифференцировки in vitro заметно варьируют для каждой культуры, полученной из клеток, выделенных от одной мыши, что отражает олигоклеточную природу экспансии, полученной в этих условиях. Эти данные показывают, что модификация энхансера BCL11A, опосредованная ZFN 63014/65722, не была заметно изменена во время эритроидной дифференцировки. Как наблюдалось в образцах крови и костного мозга, образцы эритроидного потомства клеток, полученных из PB-MR-004, показали более высокие средние уровни модификации, чем эритроидное потомство клеток, полученных из PB-MR-003.These modifications (indels) are presented in Fig. 12, which shows modification levels at day 14 of erythroid differentiation. The percentages of indels at day 14 of in vitro differentiation varied markedly for each culture obtained from cells isolated from a single mouse, reflecting the oligocyte nature of the expansion obtained under these conditions. These data indicate that ZFN 63014/65722-mediated modification of the BCL11A enhancer was not markedly altered during erythroid differentiation. As observed in blood and bone marrow samples, samples of erythroid progeny cells derived from PB-MR-004 showed higher average levels of modification than erythroid progeny cells derived from PB-MR-003.

Относительные уровни различных мРНК глобина определяли с помощью ОТ-ПЦР-анализа РНК, выделенной из клеток, на 14-й день эритроидной дифференцировки in vitro, и данные представлены на фиг. 13А, на которой относительные отношения мРНК γ-глобина к мРНК β-глобина и мРНК γ-глобина к мРНК α-глобина (фиг. 13В) усреднены для 5 эритроидных культур из каждой группы. Как в нетрансфицированных, так и в обработанных 63014/65722 образцах отношения мРНК γ-глобина к мРНК β-глобина и мРНК γ-глобина к мРНК α-глобина сильно различаются между эритроидными потомками отдельных мышей из той же группы. Культуры, полученные из донора PB-MR-004, демонстрируют в среднем более низкие отношения γ-глобина, чем культуры, полученные из донора PB-MR-003, что согласуется с лучшим созреванием, которое наблюдается для образцов, полученных из PB-MR-004. Однако, несмотря на эту вариабельность, средние значения для образцов, обработанных ZFN, показывают ~1,5-2-кратное увеличение уровней мРНК γ-глобина по сравнению с их соответствующими нетрансфицированными аналогами.The relative levels of various globin mRNAs were determined by RT-PCR analysis of RNA isolated from cells on day 14 of erythroid differentiation in vitro, and the data are presented in FIG. 13A, in which the relative ratios of γ-globin mRNA to β-globin mRNA and γ-globin mRNA to α-globin mRNA (FIG. 13B) are averaged for 5 erythroid cultures from each group. In both untransfected and 63014/65722-treated samples, the ratios of γ-globin mRNA to β-globin mRNA and γ-globin mRNA to α-globin mRNA varied greatly between the erythroid offspring of individual mice from the same group. Cultures derived from donor PB-MR-004 exhibited lower γ-globin ratios on average than cultures derived from donor PB-MR-003, which is consistent with the better maturation observed for samples derived from PB-MR- 004. However, despite this variability, average values for ZFN-treated samples show ∼1.5- to 2-fold increases in γ-globin mRNA levels compared to their corresponding untransfected counterparts.

Уровни белка глобина оценивали анализом ВЭЖХ. Фиг. 14 демонстрирует анализ белков глобина в образцах, отобранных на 16-й день дифференцировки. Определяли отношение гамма-глобина (сумма пиков Агамма и Ггамма) к альфа-глобину, а также отношения гамма-глобина (сумма пиков Агамма и Ггамма) к бета-подобным глобинам (сумме пиков Агамма, Ггамма, бета и дельта-глобина) и среднее для каждой группы показано над каждым столбцом. Согласуясь с плохой эритроидной дифференцировкой образцов, полученных из PB-MR-003, уровни гамма-глобина в нетрансфицированных клетках, полученных от этого донора, были очень высокими (~30%), и поэтому обработка ZFN привела только к 1,2кратному увеличению уровней гамма-глобина. PB-MR-004 демонстрировал более типичные нетрансфицированные уровни (~9%) и показывал ~2-кратное увеличение уровней белка гамма-глобина после 12Globin protein levels were assessed by HPLC analysis. Fig. 14 shows analysis of globin proteins in samples collected on day 16 of differentiation. The ratio of gamma globin (sum of Agamma and Ggamma peaks) to alpha globin, as well as the ratio of gamma globin (sum of Agamma and Ggamma peaks) to beta-like globins (sum of Agamma, Ggamma, beta and delta globin peaks) and the average for each group is shown above each column. Consistent with the poor erythroid differentiation of samples derived from PB-MR-003, gamma globin levels in untransfected cells obtained from this donor were very high (~30%), and therefore ZFN treatment resulted in only a 1.2-fold increase in gamma levels. -globin. PB-MR-004 exhibited more typical untransfected levels (~9%) and showed a ~2-fold increase in gamma globin protein levels after 12

--

Claims (23)

недельной циркуляции через тело мыши.weekly circulation through the mouse body. Считается, что пациенты, которые имеют >8,6% γ-глобина естественным образом, имеют преимущество по сравнению с пациентами с уровнем γ-глобина <8,6% (Platt et al. (1994) N Engl J Med, 330:163944). Фактически, достижение химерного процента не серповидных эритроцитов на уровне 10-20% посредством приживления отредактированных клеток может привести к клиническому улучшению (Chang et al. (2017) Mol Ther Methods Clin Dev 4:137-148. doi:10.1016/j.omtm. 2016.12.009). Таким образом, несмотря на необходимость прохождения процесса эритроидной дифференцировки in vitro, процент химерных клеток и уровень детектируемого белка γ-глобина являются индикаторами терапевтической эффективности.Patients who have >8.6% naturally occurring γ-globin are considered to have an advantage over patients with <8.6% γ-globin (Platt et al. (1994) N Engl J Med, 330:163944 ). In fact, achieving a chimeric percentage of non-sickle red blood cells of 10-20% through engraftment of edited cells may lead to clinical improvement (Chang et al. (2017) Mol Ther Methods Clin Dev 4:137-148. doi:10.1016/j.omtm. 2016.12.009). Thus, despite the need to undergo the process of erythroid differentiation in vitro, the percentage of chimeric cells and the level of detectable γ-globin protein are indicators of therapeutic efficacy. Все патенты, патентные заявки и публикации, упомянутые в данном документе, включены в него во всей их полноте посредством ссылки.All patents, patent applications and publications referenced herein are incorporated herein by reference in their entirety. Хотя раскрытие было предложено с некоторыми деталями в качестве иллюстрации и примера для целей ясности понимания, для специалистов в данной области техники будет очевидно, что различные изменения и модификации могут быть осуществлены на практике, не отступая от сущности или объема данного раскрытия. Соответственно, вышеприведенные описания и примеры не должны рассматриваться как ограничивающие.Although the disclosure has been offered in some detail by way of illustration and example for purposes of clarity of understanding, it will be apparent to those skilled in the art that various changes and modifications may be practiced without departing from the spirit or scope of the disclosure. Accordingly, the above descriptions and examples should not be construed as limiting. ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Пара нуклеаз цинкового пальца (ZFN), содержащая левую и правую ZFN, которые димеризуются в виде пары, где левая ZFN содержит аминокислотную последовательность, показанную в SEQ ID NO: 29, и правая ZFN содержит аминокислотную последовательность, показанную в SEQ ID NO: 31.1. A pair of zinc finger nucleases (ZFNs) comprising a left and a right ZFN that dimerize as a pair, where the left ZFN contains the amino acid sequence shown in SEQ ID NO: 29 and the right ZFN contains the amino acid sequence shown in SEQ ID NO: 29 31. 2. Полинуклеотид, кодирующий пару нуклеаз цинкового пальца по п.1.2. A polynucleotide encoding a pair of zinc finger nucleases according to claim 1. 3. Полинуклеотид по п.2, где указанный полинуклеотид представляет собой мРНК.3. The polynucleotide according to claim 2, wherein said polynucleotide is mRNA. 4. Полинуклеотид по п.3, содержащий SEQ ID NO: 28 и SEQ ID NO: 30.4. The polynucleotide according to claim 3, containing SEQ ID NO: 28 and SEQ ID NO: 30. 5. Клетка, содержащая нуклеазы цинкового пальца по п.1 или полинуклеотид по любому из пп.2-4.5. A cell containing zinc finger nucleases according to claim 1 or a polynucleotide according to any of claims 2-4. 6. Клетка по п.5, где указанная клетка представляет собой стволовую клетку или клеткупредшественник.6. The cell of claim 5, wherein said cell is a stem cell or a progenitor cell. 7. Клетка по п.6, где указанная клетка представляет собой клетку человека.7. The cell of claim 6, wherein said cell is a human cell. 8. Клетка по любому из пп.5-7, где геном указанной клетки модифицирован нуклеазами цинкового пальца в области +58 энхансерной последовательности BCL11A.8. The cell according to any one of claims 5-7, where the genome of said cell is modified by zinc finger nucleases in the +58 region of the BCL11A enhancer sequence. 9. Клетка по п.8, где указанная геномная модификация выбрана из группы, состоящей из вставок, делеций и их комбинаций.9. The cell of claim 8, wherein said genomic modification is selected from the group consisting of insertions, deletions, and combinations thereof. 10. Клетка, происходящая от клетки по любому из пп.5-9, где указанная клетка получена культивированием клетки по любому из пп.5-9.10. A cell derived from a cell according to any one of claims 5 to 9, wherein said cell is obtained by culturing a cell according to any one of claims 5 to 9. 11. Клеточная линия, происходящая от клетки по любому из пп.5-9, где указанная клеточная линия получена культивированием клетки по любому из пп.5-9.11. A cell line derived from a cell according to any one of claims 5 to 9, wherein said cell line is obtained by culturing a cell according to any one of claims 5 to 9. 12. Частично или полностью дифференцированная клетка, происходящая от клетки по любому из пп.5-10 или клеточной линии по п.11.12. A partially or fully differentiated cell derived from a cell according to any one of claims 5 to 10 or a cell line according to claim 11. 13. Клетка по любому из пп.5-10, где указанная клетка проявляет повышенную экспрессию гамма и/или бета-глобина, по сравнению с клеткой без указанной геномной модификации.13. A cell according to any one of claims 5 to 10, wherein said cell exhibits increased expression of gamma and/or beta globin compared to a cell without said genomic modification. 14. Фармацевтическая композиция, содержащая пару нуклеаз цинкового пальца по п.1, полинуклеотид по любому из пп.2-4 или клетку по любому из пп.5-10.14. A pharmaceutical composition containing a pair of zinc finger nucleases according to claim 1, a polynucleotide according to any of claims 2-4 or a cell according to any of claims 5-10. 15. Способ модификации эндогенной последовательности энхансера BCL11 в клетке, причем способ включает введение нуклеазы цинкового пальца по п.1 или полинуклеотида по любому из пп.2-4 в указанную клетку таким образом, что эндогенная последовательность энхансера BCL11A модифицируется.15. A method of modifying an endogenous BCL11 enhancer sequence in a cell, the method comprising introducing a zinc finger nuclease according to claim 1 or a polynucleotide according to any one of claims 2 to 4 into said cell such that the endogenous BCL11A enhancer sequence is modified. 16. Способ по п.15, дополнительно включающий введение экзогенной последовательности в указанную клетку таким образом, что указанная экзогенная последовательность вставляется в эндогенную последовательность энхансера BCL11A.16. The method of claim 15, further comprising introducing an exogenous sequence into said cell such that said exogenous sequence is inserted into an endogenous BCL11A enhancer sequence. 17. Способ по п.15, где указанная модификация содержит делецию.17. The method according to claim 15, wherein said modification comprises a deletion. 18. Способ увеличения выработки глобина у субъекта, включающий введение указанному субъекту клетки по любому из пп.5-10.18. A method of increasing globin production in a subject, comprising administering to said subject a cell according to any one of claims 5 to 10. 19. Способ по п.18, где указанным субъектом является человек, а клетка представляет собой стволовую клетку человека или клетку-предшественник человека.19. The method of claim 18, wherein the subject is a human and the cell is a human stem cell or a human progenitor cell. 20. Способ по п.19, где указанная клетка вводится пациенту и клетка приживается, дифференцируется и созревает в указанном субъекте.20. The method of claim 19, wherein said cell is administered to a patient and the cell engrafts, differentiates and matures in said subject. 21. Способ по любому из пп.18-20, где у указанного субъекта имеется гемоглобинопатия.21. The method according to any one of claims 18-20, wherein said subject has hemoglobinopathy. 22. Способ по п.21, где указанная гемоглобинопатия представляет собой бета-талассемию или серповидноклеточную анемию.22. The method according to claim 21, wherein said hemoglobinopathy is beta thalassemia or sickle cell anemia. 23. Способ получения генетически модифицированной клетки, содержащей геномную модификацию в эндогенной энхансерной последовательности BCL11A, причем указанный способ включает ста23. A method for producing a genetically modified cell containing a genomic modification in the endogenous enhancer sequence BCL11A, wherein said method includes one hundred --
EA201990568 2016-08-24 2017-08-24 REGULATION OF GENE EXPRESSION USING CONSTRUCTED NUCLEASES EA045868B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US62/378,978 2016-08-24
US62/443,981 2017-01-09
US62/545,778 2017-08-15

Publications (1)

Publication Number Publication Date
EA045868B1 true EA045868B1 (en) 2024-01-11

Family

ID=

Similar Documents

Publication Publication Date Title
AU2021204432B2 (en) Regulation of gene expression using engineered nucleases
US20210024606A1 (en) Nuclease-mediated regulation of gene expression
US10619154B2 (en) Nuclease-mediated regulation of gene expression
EP3068881B1 (en) Nuclease-mediated regulation of gene expression
TWI758316B (en) Regulation of gene expression using engineered nucleases
EA045868B1 (en) REGULATION OF GENE EXPRESSION USING CONSTRUCTED NUCLEASES
OA19369A (en) Regulation of gene expression using engineered nucleases.
NZ791706A (en) Regulation of gene expression using engineered nucleases