RU2796949C2 - Non-human animals containing the humanized asgr1 locus - Google Patents

Non-human animals containing the humanized asgr1 locus Download PDF

Info

Publication number
RU2796949C2
RU2796949C2 RU2020101936A RU2020101936A RU2796949C2 RU 2796949 C2 RU2796949 C2 RU 2796949C2 RU 2020101936 A RU2020101936 A RU 2020101936A RU 2020101936 A RU2020101936 A RU 2020101936A RU 2796949 C2 RU2796949 C2 RU 2796949C2
Authority
RU
Russia
Prior art keywords
asgr1
human
domain
protein
sequence
Prior art date
Application number
RU2020101936A
Other languages
Russian (ru)
Other versions
RU2020101936A3 (en
RU2020101936A (en
Inventor
Александер О. МУДЖИКА
Виктория Гусарова
Ченг ВАНГ
Кристос КИРАТСУС
Терра ПОТОКИ
Катрин СИГНАР
Джоэл Мартин
Original Assignee
Регенерон Фармасьютикалз, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Регенерон Фармасьютикалз, Инк. filed Critical Регенерон Фармасьютикалз, Инк.
Priority claimed from PCT/US2018/039864 external-priority patent/WO2019006034A1/en
Publication of RU2020101936A publication Critical patent/RU2020101936A/en
Publication of RU2020101936A3 publication Critical patent/RU2020101936A3/ru
Application granted granted Critical
Publication of RU2796949C2 publication Critical patent/RU2796949C2/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: invention relates to a non-human animal containing a genetically modified endogenous Asgr1 locus that contains an endogenous Asgr1 promoter, wherein the non-human animal is a rodent and the endogenous Asgr1 promoter is operably linked to a nucleic acid encoding modified Asgr1 protein, modified Asgr1 protein contains a cytoplasmic domain, a transmembrane domain and an extracellular domain, the extracellular domain contains a supercoiled domain.
EFFECT: invention is effective for evaluating delivery of a therapeutic complex to the liver via human ASGR1-mediated internalization in vivo, as well as for evaluating the effectiveness of a therapeutic molecule for protein targeting in relation to liver internalization via human ASGR1 in vivo.
31 cl, 9 dwg, 4 tbl, 4 ex

Description

[0001] Перечень последовательностей, записанный в файле 10362WO01_ST25.txt, имеет размер 50 килобайт, создан 26 июня 2018 года и включен в данный документ посредством ссылки. [0001] The sequence listing recorded in file 10362WO01_ST25.txt has a size of 50 kilobytes, was created on June 26, 2018, and is incorporated herein by reference.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯBACKGROUND OF THE INVENTION

[0002] Лечение многих заболеваний является недостаточно эффективным из-за неудовлетворительного нацеливания терапевтических молекул на соответствующие ткань или орган. Доставка биологически активных средств зачастую ограничена из-за трудностей с компонентами, достигающими целевых клетки или ткани.[0002] The treatment of many diseases is not effective enough due to poor targeting of therapeutic molecules to the appropriate tissue or organ. Delivery of biologically active agents is often limited due to difficulties in getting the components to reach the target cell or tissue.

[0003] Специфические для типа клеток эффекторы интернализации, такие как специфические для типа клеток рецепторы, например, ASGR1 человека, которые опосредованно или прямо интернализуются клеткой-мишенью, могут быть использованы для облегчения и улучшения доставки терапевтических молекул к специфическим клеткам-мишеням in vivo. Аналогично такие эффекторы интернализации, специфические для типа клеток, могут быть использованы с целью терапии для облегчения интернализации рецептора-мишени клеточной поверхности или растворимых белков-мишеней in vivo. Однако остается потребность в подходящих моделях для оценки эффективности таких механизмов доставки и терапевтических механизмов in vivo.[0003] Cell-type-specific internalization effectors, such as cell-type-specific receptors, e.g., human ASGR1, that are indirectly or directly internalized by a target cell, can be used to facilitate and improve the delivery of therapeutic molecules to specific target cells in vivo. Similarly, such cell type-specific internalization effectors can be used therapeutically to facilitate the internalization of a cell surface target receptor or soluble target proteins in vivo. However, there remains a need for suitable models to evaluate the effectiveness of such delivery mechanisms and therapeutic mechanisms in vivo.

КРАТКОЕ ОПИСАНИЕSHORT DESCRIPTION

[0004] Представлены животные, отличные от человека, содержащие гуманизированный локус Asgr1 и экспрессирующие гуманизированный или химерный белок ASGR1 в гуманизированном локусе Asgr1, а также способы использования таких животных, отличных от человека (например, грызуна, например, крысы или мыши), клетки и/или ткани, полученные от таких животных, отличных от человека, и нуклеотиды (например, целенаправленно воздействующие векторы, геномы и т.д.), применимые для создания таких животных.[0004] Non-human animals comprising a humanized Asgr1 locus and expressing a humanized or chimeric ASGR1 protein at the humanized Asgr1 locus are provided, as well as methods for using such non-human animals (e.g., a rodent, e.g., rat or mouse), cells and /or tissues derived from such non-human animals, and nucleotides (eg, targeting vectors, genomes, etc.) useful for making such animals.

[0005] В одном аспекте представлены животные, отличные от человека, содержащие генетически модифицированный эндогенный локус Asgr1, кодирующий модифицированный белок Asgr1, где модифицированный белок Asgr1 содержит цитоплазматический домен, трансмембранный домен и внеклеточный домен, и при этом весь внеклеточный домен или его часть кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. У некоторых таких животных, отличных от человека, внеклеточный домен содержит суперспиральный домен и лектиновый домен С-типа, и весь лектиновый домен С-типа или его часть кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. Необязательно лектиновый домен С-типа представляет собой лектиновый домен С-типа ASGR1 человека. Необязательно лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28.[0005] In one aspect, non-human animals are provided comprising a genetically modified endogenous Asgr1 locus encoding a modified Asgr1 protein, wherein the modified Asgr1 protein comprises a cytoplasmic domain, a transmembrane domain, and an extracellular domain, and all or part of the extracellular domain is encoded by a segment an endogenous Asgr1 locus that has been deleted and replaced with an orthologous human ASGR1 sequence. In some of these non-human animals, the extracellular domain contains a supercoiled domain and a C-type lectin domain, and all or part of the C-type lectin domain is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced by an orthologous human ASGR1 sequence. Optionally, the C-type lectin domain is the C-type lectin domain of human ASGR1. Optionally, the C-type lectin domain contains the sequence set forth under SEQ ID NO: 28.

[0006] У некоторых таких животных внеклеточный домен содержит суперспиральный домен и лектиновый домен С-типа, и весь суперспиральный домен или его часть кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. Необязательно суперспиральный домен представляет собой суперспиральный домен ASGR1 человека. Необязательно суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27.[0006] In some of these animals, the extracellular domain contains a supercoiled domain and a C-type lectin domain, and all or part of the supercoiled domain is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced with an orthologous human ASGR1 sequence. Optionally, the supercoiled domain is the human ASGR1 supercoiled domain. Optionally, the supercoiled domain contains the sequence set forth under SEQ ID NO: 27.

[0007] У некоторых таких животных как весь суперспиральный домен, так и весь лектиновый домен С-типа или часть и того и другого кодируются сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. Необязательно лектиновый домен С-типа представляет собой лектиновый домен С-типа ASGR1 человека, и суперспиральный домен представляет собой суперспиральный домен ASGR1 человека. Необязательно лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28, и суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27.[0007] In some such animals, either the entire supercoil domain or the entire C-type lectin domain, or part of both, is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced by an orthologous human ASGR1 sequence. Optionally, the C-type lectin domain is a human ASGR1 C-type lectin domain, and the supercoiled domain is a human ASGR1 supercoiled domain. Optionally, the C-type lectin domain contains the sequence set forth in SEQ ID NO: 28 and the supercoiled domain contains the sequence set forth in SEQ ID NO: 27.

[0008] У некоторых таких животных ортологичная последовательность ASGR1 человека содержит экзоны 3 8 гена ASGR1 человека. Необязательно ортологичная последовательность ASGR1 человека кодирует сегмент белка ASGR1, содержащий последовательность, изложенную под SEQ ID NO: 31.[0008] In some of these animals, the orthologous human ASGR1 sequence contains exons 3-8 of the human ASGR1 gene. Optionally, the orthologous human ASGR1 sequence encodes an ASGR1 protein segment containing the sequence set forth under SEQ ID NO: 31.

[0009] У некоторых таких животных весь цитоплазматический домен или его часть кодируется эндогенной последовательностью Asgr1 животного, отличного от человека. У некоторых таких животных весь трансмембранный домена или его часть кодируется эндогенной последовательностью Asgr1 животного, отличного от человека. Необязательно как весь цитоплазматический домен, так и весь трансмембранный домен или часть и того и другого кодируются эндогенной последовательностью Asgr1 животного, отличного от человека.[0009] In some of these animals, all or part of the cytoplasmic domain is encoded by the endogenous Asgr1 sequence of the non-human animal. In some of these animals, all or part of the transmembrane domain is encoded by the endogenous Asgr1 sequence of the non-human animal. Optionally, all of the cytoplasmic domain and all of the transmembrane domain, or part of both, are encoded by the endogenous Asgr1 sequence of the non-human animal.

[0010] В другом аспекте представлены клетки или ткани животных, отличных от человека (например, гепатоциты, эмбриональные стволовые клетки (ES) или другие плюрипотентные клетки, отличные от человеческих, такие как клетки зародышевой линии), содержащие гуманизированный локус Asgr1, и композиции in vitro, содержащие их. В одном аспекте представлены клетки животных, отличных от человека, содержащие генетически модифицированный эндогенный локус Asgr1, кодирующий модифицированный белок Asgr1, где модифицированный белок Asgr1 содержит цитоплазматический домен, трансмембранный домен и внеклеточный домен, и при этом весь внеклеточный домен или его часть кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. У некоторых таких клеток животных, отличных от человека, внеклеточный домен содержит суперспиральный домен и лектиновый домен С-типа, и весь лектиновый домен С-типа или его часть кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. Необязательно лектиновый домен С-типа представляет собой лектиновый домен С-типа ASGR1 человека. Необязательно лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28.[0010] In another aspect, non-human animal cells or tissues (e.g., hepatocytes, embryonic stem (ES) cells, or other non-human pluripotent cells, such as germline cells) containing a humanized Asgr1 locus are provided, and compositions in vitro containing them. In one aspect, non-human animal cells are provided comprising a genetically modified endogenous Asgr1 locus encoding a modified Asgr1 protein, wherein the modified Asgr1 protein comprises a cytoplasmic domain, a transmembrane domain, and an extracellular domain, and all or part of the extracellular domain is encoded by a segment of the endogenous locus. Asgr1 that was deleted and replaced with an orthologous human ASGR1 sequence. In some of these non-human animal cells, the extracellular domain contains a supercoiled domain and a C-type lectin domain, and all or part of the C-type lectin domain is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced by an orthologous human ASGR1 sequence. Optionally, the C-type lectin domain is the C-type lectin domain of human ASGR1. Optionally, the C-type lectin domain contains the sequence set forth under SEQ ID NO: 28.

[0011] У некоторых таких клеток животных, отличных от человека, внеклеточный домен содержит суперспиральный домен и лектиновый домен С-типа, и весь суперспиральный домен или его часть кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. Необязательно суперспиральный домен представляет собой суперспиральный домен ASGR1 человека. Необязательно суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27.[0011] In some of these non-human animal cells, the extracellular domain contains a supercoiled domain and a C-type lectin domain, and all or part of the supercoiled domain is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced with an orthologous human ASGR1 sequence. Optionally, the supercoiled domain is the human ASGR1 supercoiled domain. Optionally, the supercoiled domain contains the sequence set forth under SEQ ID NO: 27.

[0012] У некоторых таких клеток животных, отличных от человека, как весь суперспиральный домен, так и весь лектиновый домен С-типа или часть и того и другого кодируются сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека. Необязательно лектиновый домен С-типа представляет собой лектиновый домен С-типа ASGR1 человека, и суперспиральный домен представляет собой суперспиральный домен ASGR1 человека Необязательно лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28, и суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27.[0012] In some of these non-human animal cells, both the entire supercoil domain and all of the C-type lectin domain, or part of both, are encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced with an orthologous human ASGR1 sequence. Optionally, the C-type lectin domain is the C-type lectin domain of human ASGR1 and the supercoiled domain is the human ASGR1 supercoiled domain. SEQ ID NO: 27.

[0013] У некоторых таких клеток животных, отличных от человека, ортологичная последовательность ASGR1 человека содержит экзоны 3-8 гена ASGR1 человека. Необязательно ортологичная последовательность ASGR1 человека кодирует сегмент белка ASGR1, содержащий последовательность, изложенную под SEQ ID NO: 31.[0013] In some of these non-human animal cells, the orthologous human ASGR1 sequence contains exons 3-8 of the human ASGR1 gene. Optionally, the orthologous human ASGR1 sequence encodes an ASGR1 protein segment containing the sequence set forth under SEQ ID NO: 31.

[0014] У некоторых таких клеток животных, отличных от человека, весь цитоплазматический домен или его часть кодируется эндогенной последовательностью Asgr1 животного, отличного от человека. У некоторых таких клеток животных весь трансмембранный домен или его часть кодируется эндогенной последовательностью Asgr1 животного, отличного от человека. Необязательно как весь цитоплазматический домен, так и весь трансмембранный домен или часть и того и другого кодируются эндогенной последовательностью Asgr1 животного, отличного от человека.[0014] In some of these non-human cells, all or part of the cytoplasmic domain is encoded by the endogenous non-human Asgr1 sequence. In some of these animal cells, all or part of the transmembrane domain is encoded by the endogenous non-human Asgr1 sequence. Optionally, all of the cytoplasmic domain and all of the transmembrane domain, or part of both, are encoded by the endogenous Asgr1 sequence of the non-human animal.

[0015] Некоторые такие животные и/или клетки животных являются гетерозиготными по генетически модифицированному эндогенному локусу Asgr1. Некоторые такие животные и/или клетки животных являются гомозиготными по генетически модифицированному эндогенному локусу Asgr1.[0015] Some such animals and/or animal cells are heterozygous for the genetically modified endogenous Asgr1 locus. Some such animals and/or animal cells are homozygous for the genetically modified endogenous Asgr1 locus.

[0016] Некоторые такие животные, отличные от человека, и/или клетки животных, отличных от человека, являются млекопитающими и/или клетками млекопитающих. Необязательно млекопитающее является грызуном. Необязательно грызун представляет собой крысу или мышь. Необязательно грызун представляет собой мышь. Необязательно весь цитоплазматический домен или его часть кодируется эндогенной последовательностью Asgr1 мыши. Необязательно цитоплазматический домен содержит последовательность, изложенную под SEQ ID NO: 29. Необязательно весь трансмембранный домен или его часть кодируется эндогенной последовательностью Asgr1 мыши. Необязательно трансмембранный домен содержит последовательность, изложенную под SEQ ID NO: 30. Необязательно как весь цитоплазматический домен, так и весь трансмембранный домен или часть и того и другого кодируются эндогенной последовательностью Asgr1 мыши. Необязательно цитоплазматический домен содержит последовательность, изложенную под SEQ ID NO: 29, и трансмембранный домен содержит последовательность, изложенную под SEQ ID NO: 30. Необязательно внеклеточный домен содержит суперспиральный домен и лектиновый домен С-типа, и где как весь суперспиральный домен, так и весь лектиновый домен С-типа или часть и того и другого кодируются сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека, и при этом как весь цитоплазматический домен, так и весь трансмембранный домен или часть и того и другого кодируются эндогенной последовательностью Asgr1 мыши. Необязательно лектиновый домен С-типа представляет собой лектиновый домен С-типа ASGR1 человека, и суперспиральный домен представляет собой суперспиральный домен ASGR1 человека, цитоплазматический домен представляет собой цитоплазматический домен Asgr1 мыши, а трансмембранный домен представляет собой трансмембранный домен Asgr1 мыши. Необязательно лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28, суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27, цитоплазматический домен содержит последовательность, изложенную под SEQ ID NO: 29, и трансмембранный домен содержит последовательность, изложенную под SEQ ID NO: 30. Необязательно модифицированный белок Asgr1 содержит последовательность, изложенную под SEQ ID NO: 3.[0016] Some such non-human animals and/or non-human animal cells are mammalian and/or mammalian cells. Optionally, the mammal is a rodent. Optionally, the rodent is a rat or mouse. Optionally, the rodent is a mouse. Optionally, all or part of the cytoplasmic domain is encoded by the endogenous mouse Asgr1 sequence. Optionally, the cytoplasmic domain contains the sequence set forth under SEQ ID NO: 29. Optionally, all or part of the transmembrane domain is encoded by the endogenous mouse Asgr1 sequence. Optionally, the transmembrane domain contains the sequence set forth under SEQ ID NO: 30. Optionally, all of the cytoplasmic domain and all of the transmembrane domain, or part of both, are encoded by endogenous mouse Asgr1 sequence. Optionally, the cytoplasmic domain contains the sequence set forth under SEQ ID NO: 29, and the transmembrane domain contains the sequence set forth under SEQ ID NO: 30. Optionally, the extracellular domain contains a supercoiled domain and a C-type lectin domain, and where both the entire supercoiled domain and the entire C-type lectin domain, or part of both, is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced by the orthologous human ASGR1 sequence, while both the entire cytoplasmic domain and the entire transmembrane domain, or part of both, are encoded by the endogenous sequence mouse asgr1. Optionally, the C-type lectin domain is the C-type lectin domain of human ASGR1 and the supercoil domain is the human ASGR1 supercoil domain, the cytoplasmic domain is the mouse Asgr1 cytoplasmic domain, and the transmembrane domain is the mouse Asgr1 transmembrane domain. Optionally, the C-type lectin domain contains the sequence set forth in SEQ ID NO: 28, the supercoiled domain contains the sequence set forth in SEQ ID NO: 27, the cytoplasmic domain contains the sequence set forth in SEQ ID NO: 29, and the transmembrane domain contains the sequence set forth in SEQ ID NO: 29 under SEQ ID NO: 30. Optionally, the modified Asgr1 protein contains the sequence set forth under SEQ ID NO: 3.

[0017] В другом аспекте представлены способы оценки доставки терапевтического комплекса в печень посредством интернализации, опосредованной ASGR1 человека, in vivo. Некоторые такие способы предусматривают: (а) введение терапевтического комплекса любому из указанных выше животных, отличных от человека, где терапевтический комплекс содержит терапевтическую молекулу и антиген связывающий белок или лиганд, который специфически связывает ASGR1 человека; и (b) оценку доставки терапевтической молекулы в печень животного, отличного от человека. Необязательно терапевтическая молекула представляет собой лизосомальный заместительный белок или фермент или нуклеиновую кислоту, кодирующую лизосомальный заместительный белок или фермент, и стадия (b) предусматривает оценку присутствия или активности лизосомального заместительного белка или фермента в печени животного, отличного от человека. Необязательно терапевтическая молекула представляет собой нуклеиновую кислоту, кодирующую терапевтический секретируемый белок, и стадия (b) предусматривает оценку уровней в сыворотке крови или активности терапевтического секретируемого белка у животного, отличного от человека.[0017] In another aspect, methods are provided for assessing liver delivery of a therapeutic complex via human ASGR1-mediated internalization in vivo. Some such methods include: (a) administering the therapeutic complex to any of the above non-human animals, wherein the therapeutic complex comprises the therapeutic molecule and an antigen binding protein or ligand that specifically binds human ASGR1; and (b) evaluating delivery of the therapeutic molecule to the liver of a non-human animal. Optionally, the therapeutic molecule is a lysosomal replacement protein or an enzyme or nucleic acid encoding a lysosomal replacement protein or enzyme, and step (b) involves assessing the presence or activity of the lysosomal replacement protein or enzyme in the liver of a non-human animal. Optionally, the therapeutic molecule is a nucleic acid encoding a therapeutic secreted protein, and step (b) involves assessing serum levels or activity of the therapeutic secreted protein in a non-human animal.

[0018] В другом аспекте представлены способы оценки эффективности терапевтической молекулы, целенаправленно воздействующей на поверхностный белок клеток печени или на растворимый белок в печени, в отношении интернализации посредством ASGR1 человека in vivo. Некоторые такие способы предусматривают: (а) введение терапевтической молекулы любому из указанных выше животных, отличных от человека, где терапевтическая молекула содержит биспецифический антигенсвязывающий белок, который специфически связывает поверхностный белок клеток печени или растворимый белок и специфически связывает ASGR1 человека; и (b) оценку уровней на клеточной поверхности или активности поверхностного белка клеток печени в печени животного, отличного от человека, или оценку экспрессии или активности растворимого белка в печени животного, отличного от человека.[0018] In another aspect, methods are provided for evaluating the efficacy of a therapeutic molecule targeting a liver cell surface protein or a soluble protein in the liver for internalization by human ASGR1 in vivo. Some such methods include: (a) administering the therapeutic molecule to any of the above non-human animals, wherein the therapeutic molecule comprises a bispecific antigen-binding protein that specifically binds a liver cell surface protein or soluble protein and specifically binds human ASGR1; and (b) assessing the cell surface levels or activity of a liver cell surface protein in the liver of a non-human animal, or assessing the expression or activity of a soluble protein in the liver of a non-human animal.

[0019] В другом аспекте представлены нуклеиновые кислоты, например, целенаправленно воздействующие векторы, предназначенные для создания гуманизированного локуса Asgr1, как это описано в данном документе, эндогенный локус Asgr1 животного, отличного от человека, экспрессирующий гуманизированный или химерный белок ASGR1, и/или геном животного, отличного от человека, содержащий локус Asgr1 человека, описанный в данном документе. Некоторые такие нуклеиновые кислоты содержат последовательность, выбранную из группы, включающей SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23 и их комбинацию. Некоторые такие нуклеиновые кислоты содержат последовательность, которая кодирует аминокислотную последовательность, изложенную под SEQ ID NO: 3, например, содержат последовательность, изложенную под SEQ ID NO: 24.[0019] In another aspect, nucleic acids, e.g., targeting vectors, are provided to generate a humanized Asgr1 locus as described herein, an endogenous Asgr1 locus of a non-human animal expressing a humanized or chimeric ASGR1 protein, and/or a genome a non-human animal containing the human Asgr1 locus described herein. Some such nucleic acids contain a sequence selected from the group consisting of SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, and combinations thereof. Some such nucleic acids contain a sequence that encodes the amino acid sequence set forth under SEQ ID NO: 3, for example, contain the sequence set forth under SEQ ID NO: 24.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHICS

[0020] Файл с патентом или заявкой содержит по меньшей мере один графический материал, выполненный в цвете. Копии данного патента или публикации заявки на патент с цветным (цветными) графическим (графическими) материалом (материалами) будут предоставлены Ведомству после запроса и уплаты необходимой пошлины.[0020] The file with the patent or application contains at least one graphic material, made in color. Copies of this patent or the publication of the patent application with color(s) of graphic(s) material(s) will be made available to the Office upon request and upon payment of the required fee.

[0021] На фигуре 1А показано схематическое изображение локуса ASGR1 человека. Восемь экзонов обозначены черными прямоугольниками, нетранслируемые участки (UTR) обозначены белыми прямоугольниками, а трансмембранный, суперспиральный домены и лектиновый домен С-типа указаны вверху фигуры. Звездочками обозначены местоположения 5'-праймера (7302hTU) и 3'-праймера (7302hTD), предназначенных для анализа приобретения аллеля. Фрагмент, подлежащий включению в локус Asgr1 мыши для обеспечения гуманизации, показан внизу.[0021] Figure 1A shows a schematic representation of the human ASGR1 locus. The eight exons are indicated by black boxes, the untranslated regions (UTRs) are indicated by white boxes, and the transmembrane, supercoiled, and C-type lectin domains are indicated at the top of the figure. Asterisks indicate the locations of the 5' primer (7302hTU) and 3' primer (7302hTD) for allele acquisition analysis. The fragment to be included in the mouse Asgr1 locus to allow for humanization is shown below.

[0022] На фигуре 1В показано схематическое изображение локуса Asgr1 мыши. Восемь экзонов обозначены черными прямоугольниками, UTR обозначены белыми прямоугольниками, а трансмембранный, суперспиральный домены и лектиновый домен С-типа указаны вверху фигуры. Звездочками обозначены местоположения 3'-праймера (7302mTU) и 3'-праймера (7302mTD), предназначенных для анализа потери аллеля. Фрагмент, подлежащий удалению и замене соответствующим фрагментом из локуса ASGR1 человека, показан внизу.[0022] Figure 1B shows a schematic representation of the mouse Asgr1 locus. The eight exons are indicated by black boxes, the UTRs are indicated by white boxes, and the transmembrane, supercoiled, and C-type lectin domains are indicated at the top of the figure. Asterisks indicate the locations of the 3' primer (7302mTU) and 3' primer (7302mTD) for allele loss analysis. The fragment to be deleted and replaced with the corresponding fragment from the human ASGR1 locus is shown below.

[0023] На фигуре 2А показано схематическое изображение крупного целенаправленно воздействующего вектора, предназначенного для получения гуманизированного аллеля Asgr1 (аллель 7302), содержащего самоудаляющуюся кассету, содержащую ген устойчивости к гигромицину. Экзоны мыши обозначены серыми прямоугольниками, экзоны человека обозначены черными прямоугольниками, a UTR обозначены белыми прямоугольниками. Границы между различными участками (мышь/человек, человек/кассета и кассета/мышь) указаны линиями, соответственно обозначенными А, В и С, в нижней части рисунка.[0023] Figure 2A shows a schematic of a large targeting vector for generating a humanized Asgr1 allele (allele 7302) containing a self-removing cassette containing a hygromycin resistance gene. Mouse exons are indicated by gray boxes, human exons are indicated by black boxes, and UTRs are indicated by white boxes. The boundaries between the different sites (mouse/human, human/cassette, and cassette/mouse) are indicated by lines, respectively labeled A, B, and C, at the bottom of the figure.

[0024] На фигуре 2В показано схематическое изображение варианта гуманизированного аллеля Asgr1 с удаленной кассетой на фигуре 2А. Экзоны мыши обозначены серыми прямоугольниками, экзоны человека обозначены черными прямоугольниками, a UTR обозначены белыми прямоугольниками. Границы между различными участками (5'-граница мышь/человек, 3'-граница человек/мышь) указаны линиями, соответственно обозначенными A, D, в нижней части рисунка.[0024] Figure 2B shows a schematic representation of the cassette-deleted humanized Asgr1 allele variant in Figure 2A. Mouse exons are indicated by gray boxes, human exons are indicated by black boxes, and UTRs are indicated by white boxes. The boundaries between the different sites (5'-mouse/human interface, 3'-human/mouse interface) are indicated by lines, respectively labeled A, D, at the bottom of the figure.

[0025] На фигуре 3 показано выравнивание белка ASGR1 человека (hASGR1; SEQ ID NO: 1), белка Asgr1 мыши (mAsgr1; SEQ ID NO: 2) и гуманизированного белка Asgr1 мыши (7302 humln; SEQ ID NO: 3). Подчеркнутые остатки представляют собой такие остатки, которые кодируются введенными экзонами человека. Остатки, заключенные в рамку, составляют трансмембранный домен. Пунктирная линия обозначает лектиновый домен С-типа. Сплошная жирная линия обозначает суперспиральный участок.[0025] Figure 3 shows the alignment of human ASGR1 protein (hASGR1; SEQ ID NO: 1), mouse Asgr1 protein (mAsgr1; SEQ ID NO: 2), and humanized mouse Asgr1 protein (7302 humln; SEQ ID NO: 3). The underlined residues are those that are encoded by the introduced human exons. The framed residues constitute the transmembrane domain. The dotted line indicates the C-type lectin domain. The solid thick line denotes the supercoiled region.

[0026] На фигуре 4 показано, что у гуманизированных по Asgr1 мышей (Asgr1hu/hu) липидные профили в плазме крови (включая общий холестерин, триглицериды, LDL-C и HDL-C) аналогичны таким профилям у их однопометников дикого типа (Asgr1+/+).[0026] Figure 4 shows that Asgr1 humanized mice (Asgr1 hu/hu ) have plasma lipid profiles (including total cholesterol, triglycerides, LDL-C and HDL-C) similar to those of their wild-type littermates (Asgr1 +/+ ).

[0027] На фигуре 5 показано, что у гуманизированных по Asgr1 мышей (Asgr1hu/hu) вес тела и уровень глюкозы в крови аналогичны таким показателям у их однопометников дикого типа.[0027] Figure 5 shows that Asgr1 humanized mice (Asgr1 hu/hu ) have body weight and blood glucose levels similar to those of their wild-type littermates.

[0028] На фигуре 6 показано, что гуманизированный белок Asgr1 гуманизированных по Asgr1 мышей (Asgr1hu/hu) совместно локализуется в мембранах клеток печени, аналогично Asgr1 мыши. Трансферриновый рецептор (TRFR) и глицеральдегид-3-фосфатдегидрогеназу (GAPDH) использовали в качестве загрузочного контроля для мембранных и цитозольных фракций печени соответственно. Показано N=4 на группу.[0028] Figure 6 shows that humanized Asgr1 protein from Asgr1 humanized mice (Asgr1 hu/hu ) co-localizes in liver cell membranes similar to mouse Asgr1. Transferrin receptor (TRFR) and glyceraldehyde-3-phosphate dehydrogenase (GAPDH) were used as loading controls for membrane and cytosolic liver fractions, respectively. Shown N=4 per group.

[0029] На фигуре 7 показано выравнивание белка ASGR1 человека (SEQ ID NO: 1), Macaca fascicularis (макак-крабоед) (SEQ ID NO: 39), белка Asgr1 мыши (SEQ ID NO: 2) и белка Asgr1 крысы (SEQ ID NO: 41). Подчеркнутые остатки представляют собой такие остатки, которые кодируются введенными экзонами человека. Наблюдается 97,6% идентичность последовательности белков ASGR1 человека и макака-крабоеда (98,3% идентичность последовательности во внеклеточном домене), 77% идентичность последовательности белков ASGR1 человека и мыши и 78,4% идентичность последовательности белков ASGR1 человека и крысы.[0029] Figure 7 shows the alignment of human ASGR1 protein (SEQ ID NO: 1), Macaca fascicularis (cynomolgus macaque) (SEQ ID NO: 39), mouse Asgr1 protein (SEQ ID NO: 2), and rat Asgr1 protein (SEQ ID NO: 41). The underlined residues are those that are encoded by the introduced human exons. There is 97.6% sequence identity between human and cynomolgus ASGR1 proteins (98.3% sequence identity in the extracellular domain), 77% sequence identity between human and mouse ASGR1 proteins, and 78.4% sequence identity between human and rat ASGR1 proteins.

[0030] На фигурах 8А - 8С представлены изображения, полученные с помощью иммунофлуоресцентной микроскопии, образцов печени (А), селезенки (В) или почки (С), отобранных у мышей C57BL/6, трансгенно модифицированных с целью экспрессии ASGR1 человека клетками печени (i-iv), или мышей C57BL/6 дикого типа (v-viii) через десять дней после внутривенного введения 1×1011 scAAV2-CMV-eGFP дикого типа (i, v), физиологического раствора (ii, vi), 1×1011 вирусных векторов scAAV2-N587myc-CMV-eGFP отдельно (iii, vii) или вирусных векторов scAAV2-N587myc-CMV-eGFP с биспецифическим антителом к myc-ASGR1 (iv, viii).[0030] Figures 8A - 8C are immunofluorescence microscopy images of liver (A), spleen (B), or kidney (C) samples taken from C57BL/6 mice transgenically modified to express human ASGR1 by liver cells ( i-iv), or wild-type C57BL/6 mice (v-viii) ten days after intravenous administration of 1×10 11 wild-type scAAV2-CMV-eGFP (i, v), saline (ii, vi), 1× 10 11 scAAV2-N587myc-CMV-eGFP viral vectors alone (iii, vii) or scAAV2-N587myc-CMV-eGFP viral vectors with a bispecific anti-myc-ASGR1 antibody (iv, viii).

[0031] На фигурах 9A - 9R представлены изображения, полученные с помощью иммунофлуоресцентной микроскопии, образцов печени, отобранных у мышей C57BL/6, трансгенно модифицированных с целью экспрессии ASGR1 человека клетками печени (фигура 9D - 9F, 9J - 9L, 9Р - 9R), или мышей C57BL/6 дикого типа (фигуры 9А - 9С, 9G - 9I, 9М - 90) через четыре недели после внутривенного введения 2,18×1011 ssAAV2-CAGG-eGFP дикого типа (фигуры 9В, 9С, 9Е, 9F), физиологического раствора (фигуры 9А, 9D), 2,18×1011 вирусных векторов ssAAV2-N587myc-CAGG-eGFP отдельно (фигуры 9G - 9I, 9J - 9L) или вирусных векторов ssAAV2-N587myc-CAGG-eGFP с биспецифическим антителом к myc-ASGR1 (фигуры 9М - 90, 9Р - 9R). Каждое изображение представляет одну мышь.[0031] Figures 9A - 9R are immunofluorescence microscopy images of liver samples taken from C57BL/6 mice transgenically modified to express human ASGR1 in liver cells (Figure 9D - 9F, 9J - 9L, 9P - 9R) , or wild-type C57BL/6 mice (Figures 9A-9C, 9G-9I, 9M-90) four weeks after intravenous administration of wild-type 2.18×10 11 ssAAV2-CAGG-eGFP (Figures 9B, 9C, 9E, 9F ), saline (Figures 9A, 9D), 2.18×10 11 ssAAV2-N587myc-CAGG-eGFP viral vectors alone (Figures 9G-9I, 9J-9L) or ssAAV2-N587myc-CAGG-eGFP viral vectors with a bispecific antibody to myc-ASGR1 (Figures 9M - 90, 9P - 9R). Each image represents one mouse.

ОПРЕДЕЛЕНИЯDEFINITIONS

[0032] Термины «белок», «полипептид» и «пептид», используемые в данном документе взаимозаменяемо, включают полимерные формы аминокислот любой длины, включая кодируемые и некодируемые аминокислоты и химически или биохимически модифицированные или дериватизированные аминокислоты. Термины также включают полимеры, которые были модифицированы, такие как полипептиды, содержащие модифицированные пептидные остовы. Термин «домен» относится к любой части белка или полипептида, обладающего конкретной функцией или структурой.[0032] The terms "protein", "polypeptide" and "peptide", used interchangeably herein, include polymeric forms of amino acids of any length, including encoded and non-encoded amino acids and chemically or biochemically modified or derivatized amino acids. The terms also include polymers that have been modified, such as polypeptides containing modified peptide backbones. The term "domain" refers to any portion of a protein or polypeptide having a particular function or structure.

[0033] Считается, что белки имеют «N-конец» и «С-конец». Термин «N-конец» относится к началу белка или полипептида, оканчивающемуся аминокислотой со свободной аминогруппой (-NH2). Термин «С-конец» относится к концу аминокислотной цепи (белка или полипептида), оканчивающейся свободной карбоксильной группой (-СООН).[0033] Proteins are considered to have an "N-terminus" and a "C-terminus". The term "N-terminus" refers to the beginning of a protein or polypeptide ending in an amino acid with a free amino group (-NH2). The term "C-terminus" refers to the end of an amino acid chain (of a protein or polypeptide) ending in a free carboxyl group (-COOH).

[0034] Термины «нуклеиновая кислота» и «полинуклеотид», используемые в данном документе взаимозаменяемо, включают полимерные формы нуклеотидов любой длины, включая рибонуклеотиды, дезоксирибонуклеотиды или их аналоги или модифицированные варианты. Они включают одно-, двух- и многонитевые ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК и полимеры, содержащие пуриновые основания, пиримидиновые основания или другие природные, химически модифицированные, биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.[0034] The terms "nucleic acid" and "polynucleotide", used interchangeably herein, include polymeric forms of nucleotides of any length, including ribonucleotides, deoxyribonucleotides, or analogs or modified variants thereof. These include single-, double-, and multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrids, and polymers containing purine bases, pyrimidine bases, or other natural, chemically modified, biochemically modified, non-natural, or derivatized nucleotide bases.

[0035] Считается, что нуклеиновые кислоты имеют «5'-концы» и «3'-концы», потому что мононуклеотиды вступают в реакцию с образованием олигонуклеотидов таким образом, что 5'-фосфат пентозного кольца одного мононуклеотида присоединяется к 3'-кислороду своего соседа в одном направлении через фосфодиэфирную связь. Конец олигонуклеотида называют «5'-концом», если его 5'-фосфат не связан с 3'-кислородом пентозного кольца мононуклеотида. Конец олигонуклеотида называют «3'-концом», если его 3'-кислород не связан с 5'-фосфатом пентозного кольца другого мононуклеотида. Можно также сказать, что последовательность нуклеиновой кислоты, даже если она находится внутри более крупного олигонуклеотида, имеет 5'- и 3'-концы. В молекуле линейной или кольцевой ДНК дискретные элементы называются как «расположенные выше» или в 5'-направлении по отношению к «расположенным ниже» элементам или элементам в 3'-направлении.[0035] Nucleic acids are considered to have "5'-ends" and "3'-ends" because mononucleotides react to form oligonucleotides such that the 5'-phosphate of the pentose ring of one mononucleotide is attached to the 3'-oxygen its neighbor in one direction through a phosphodiester bond. The end of an oligonucleotide is called the "5' end" if its 5' phosphate is not bonded to the 3' oxygen of the pentose ring of the mononucleotide. The end of an oligonucleotide is called the "3' end" if its 3' oxygen is not bonded to the 5' phosphate of the pentose ring of another mononucleotide. It can also be said that a nucleic acid sequence, even if it is within a larger oligonucleotide, has 5' and 3' ends. In a linear or circular DNA molecule, discrete elements are referred to as "upstream" or in the 5' direction relative to "downstream" elements or elements in the 3' direction.

[0036] Термин «геномно интегрированный» относится к нуклеиновой кислоте, которая была введена в клетку таким образом, что нуклеотидная последовательность интегрируется в геном клетки и способна наследоваться ее потомством. Любой протокол может быть использован для стабильного включения нуклеиновой кислоты в геном клетки.[0036] The term "genomically integrated" refers to a nucleic acid that has been introduced into a cell such that the nucleotide sequence is integrated into the cell's genome and is capable of being inherited by its offspring. Any protocol can be used to stably incorporate a nucleic acid into a cell's genome.

[0037] Термин «целенаправленно воздействующий вектор» относится к рекомбинантной нуклеиновой кислоте, которая может быть введена путем гомологичной рекомбинации, лигирования, опосредованного негомологичным соединением концов, или любым другим способом рекомбинации в целевое местоположение в геноме клетки.[0037] The term "targeting vector" refers to a recombinant nucleic acid that can be introduced by homologous recombination, non-homologous end joining mediated ligation, or any other method of recombination to a target location in a cell's genome.

[0038] Термин «вирусный вектор» относится к рекомбинантной нуклеиновой кислоте, которая включает по меньшей мере один элемент вирусного происхождения и включает элементы, достаточные для упаковки или допускающие упаковку в частицу вирусного вектора. Вектор и/или частица могут быть использованы с целью переноса ДНК, РНК или других нуклеиновых кислот в клетки ex vivo или in vivo. Известны многочисленные формы вирусных векторов.[0038] The term "viral vector" refers to a recombinant nucleic acid that includes at least one element of viral origin and includes elements sufficient to package or allow packaging into a viral vector particle. The vector and/or particle can be used to transfer DNA, RNA or other nucleic acids into cells ex vivo or in vivo. Numerous forms of viral vectors are known.

[0039] Термин «дикий тип» включает объекты, обладающие структурой и/или активностью, обнаруживаемой в нормальном состоянии (в отличие от мутантного, поврежденного, измененного и т.д.) или окружении. Гены и полипептиды дикого типа часто существуют в нескольких различных формах (например, аллелях).[0039] The term "wild type" includes objects having the structure and/or activity found in the normal state (as opposed to mutated, damaged, altered, etc.) or environment. Wild-type genes and polypeptides often exist in several different forms (eg, alleles).

[0040] Термин «эндогенный» относится к последовательности нуклеиновой кислоты, которая встречается в природе внутри клетки или животного, отличного от человека. Например, эндогенная последовательность Asgr1 животного, отличного от человека, относится к нативной последовательности Asgr1, которая встречается в природе в локусе Asgr1 животного, отличного от человека.[0040] The term "endogenous" refers to a nucleic acid sequence that occurs naturally within a non-human cell or animal. For example, an endogenous non-human Asgr1 sequence refers to a native Asgr1 sequence that occurs naturally at the Asgr1 locus of a non-human animal.

[0041] «Экзогенные» молекулы или последовательности включают молекулы или последовательности, которые обычно не присутствуют в клетке в такой форме. Присутствие в нормальном состоянии включает присутствие относительно определенной стадии развития и условий окружающей среды клетки. Например, экзогенная молекула или последовательность могут включать мутантный вариант соответствующей эндогенной последовательности в клетке, например, гуманизированный вариант эндогенной последовательности, или могут включать последовательность, соответствующую эндогенной последовательности в клетке, но в другой форме (т.е. не в составе хромосомы). И наоборот, эндогенные молекулы или последовательности включают молекулы или последовательности, которые обычно присутствуют в такой форме в определенной клетке на определенной стадии развития в определенных условиях окружающей среды.[0041] "Exogenous" molecules or sequences include molecules or sequences that are not normally present in the cell in such form. Presence in the normal state includes the presence of a relatively certain developmental stage and environmental conditions of the cell. For example, an exogenous molecule or sequence may include a mutant variant of the corresponding endogenous sequence in the cell, such as a humanized variant of the endogenous sequence, or may include a sequence corresponding to the endogenous sequence in the cell, but in a different form (i.e., not on a chromosome). Conversely, endogenous molecules or sequences include molecules or sequences that are normally present in such form in a particular cell at a particular developmental stage under certain environmental conditions.

[0042] Термин «гетерологичный» при использовании в контексте нуклеиновой кислоты или белка указывает на то, что нуклеиновая кислота или белок содержат по меньшей мере две части, которые не встречаются в природе вместе в одной и той же молекуле. Например, термин «гетерологичный» при использовании его в отношении частей нуклеиновой кислоты или частей белка указывает, что нуклеиновая кислота или белок содержат две или более подпоследовательности, которые не встречаются в природе в таком же соотношении друг с другом (например, объединенными вместе). В качестве одного примера «гетерологичный» участок вектора, представляющего собой нуклеиновую кислоту, представляет собой сегмент нуклеиновой кислоты в пределах или присоединенный к другой молекуле нуклеиновой кислоты, который не встречается в природе в ассоциации с другой молекулой. Например, гетерологичный участок вектора, представляющего собой нуклеиновую кислоту, может включать кодирующую последовательность, фланкированную последовательностями, которые не встречаются в природе в ассоциации с кодирующей последовательностью. Аналогичным образом «гетерологичный» участок белка представляет собой сегмент аминокислот в пределах или присоединенный к другой пептидной молекуле, который не встречается в природе в ассоциации с другой пептидной молекулой (например, слитый белок или белок с меткой). Аналогичным образом нуклеиновая кислота или белок могут содержать гетерологичную метку или гетерологичную последовательность секреции или последовательность локализации.[0042] The term "heterologous" when used in the context of a nucleic acid or protein indicates that the nucleic acid or protein contains at least two parts that do not naturally occur together in the same molecule. For example, the term "heterologous" when used with respect to parts of a nucleic acid or parts of a protein indicates that the nucleic acid or protein contains two or more subsequences that do not naturally occur in the same ratio to each other (eg, combined together). As one example, a "heterologous" region of a nucleic acid vector is a segment of a nucleic acid within or attached to another nucleic acid molecule that does not naturally occur in association with another molecule. For example, a heterologous region of a nucleic acid vector may include a coding sequence flanked by sequences that do not naturally occur in association with the coding sequence. Similarly, a "heterologous" region of a protein is a segment of amino acids within or attached to another peptide molecule that does not naturally occur in association with another peptide molecule (eg, a fusion protein or a tagged protein). Similarly, a nucleic acid or protein may contain a heterologous tag or a heterologous secretion or localization sequence.

[0043] «Оптимизация кодонов» использует преимущества вырожденности кодонов, что проявляется в множественности комбинаций кодонов из трех пар оснований, которые определяют аминокислоту, и, как правило, включает процесс модификации последовательности нуклеиновой кислоты с целью улучшения экспрессии в определенных клетках-хозяевах путем замены по меньшей мере одного кодона нативной последовательности кодоном, который более часто или чаще всего задействован в генах данной клетки-хозяина, сохраняя при этом нативную аминокислотную последовательность. Например, нуклеиновая кислота, кодирующая белок Cas9, может быть модифицирована с целью замены кодонов на другие, имеющие более высокую частоту используемости в данной прокариотической или эукариотической клетке, включая бактериальную клетку, дрожжевую клетку, клетку человека, клетку, отличную от человеческой, клетку млекопитающего, клетку грызуна, клетку мыши, клетку крысы, клетку хомяка или любую другую клетку-хозяина, по сравнению со встречающейся в природе последовательностью нуклеиновой кислоты. Списки используемости кодонов являются общедоступными, например, в Базе данных используемости кодонов «Codon Usage Database)). Эти таблицы можно адаптировать в ряде способов. См. Nakamura et al. (2000) Nucleic Acids Research 28:292, включенную в данный документ посредством ссылки во всей своей полноте для всех целей. Также доступны компьютерные алгоритмы оптимизации кодонов определенной последовательности, предназначенную для экспрессии в конкретном хозяине, см., например, Gene Forge.[0043] "Codon optimization" takes advantage of codon degeneracy, which manifests itself in the multiplicity of combinations of three base pair codons that define an amino acid, and typically involves the process of modifying a nucleic acid sequence to improve expression in certain host cells by substitution at at least one native sequence codon by a codon that is more frequently or most frequently involved in the genes of a given host cell, while retaining the native amino acid sequence. For example, a nucleic acid encoding a Cas9 protein can be modified to change codons to codons that have a higher frequency of use in a given prokaryotic or eukaryotic cell, including a bacterial cell, a yeast cell, a human cell, a non-human cell, a mammalian cell, a rodent cell, a mouse cell, a rat cell, a hamster cell, or any other host cell, compared to a naturally occurring nucleic acid sequence. Codon usage lists are publicly available, for example in the Codon Usage Database). These tables can be adapted in a number of ways. See Nakamura et al. (2000) Nucleic Acids Research 28:292, incorporated herein by reference in its entirety for all purposes. Also available are computer algorithms for optimizing codons of a particular sequence for expression in a particular host, see, for example, Gene Forge.

[0044] Термин «локус» относится к конкретному местоположению гена (или значимой последовательности), последовательности ДНК, последовательности, кодирующей полипептид, или положению на хромосоме генома организма. Например, «локус Asgr1» может относиться к конкретному местоположению гена Asgr1, последовательности ДНК Asgr1, последовательности, кодирующей Asgr1, или к положению Asgr1 на хромосоме генома организма, которое было идентифицировано как такое положение, в котором расположена такая последовательность. «Локус Asgr1» может содержать регуляторный элемент гена Asgr1, включая, например, энхансер, промотор, 5'-концевой и/или 3'-концевой нетранслируемый участок (UTR) или их комбинацию.[0044] The term "locus" refers to a specific location of a gene (or sequence of interest), a DNA sequence, a polypeptide coding sequence, or a position on a chromosome of an organism's genome. For example, an "Asgr1 locus" may refer to a specific location of an Asgr1 gene, an Asgr1 DNA sequence, an Asgr1 coding sequence, or an Asgr1 position on a chromosome of an organism's genome that has been identified as such a position at which such a sequence is located. An "Asgr1 locus" may contain a regulatory element of the Asgr1 gene, including, for example, an enhancer, a promoter, a 5' and/or 3' untranslated region (UTR), or a combination thereof.

[0045] Термин «ген» относится к последовательности ДНК в хромосоме, которая кодирует продукт (например, продукт РНК и/или полипептидный продукт) и включает кодирующий участок, прерываемый некодирующими нитронами, и последовательность, расположенную смежно с кодирующим участком как на 5'-конце, так и на 3'-конце, таким образом, что ген соответствует полноразмерной мРНК (включая 5'- и 3'-нетранслируемые последовательности). Термин «ген» также включает другие некодирующие последовательности, включая регуляторные последовательности (например, промоторы, энхансеры и сайты связывания факторов транскрипции), сигналы полиаденилирования, участки внутренней посадки рибосом, сайленсеры, инсуляторные последовательности и участки прикрепления к матриксу. Эти последовательности могут быть расположены близко к кодирующему участку гена (например, в пределах 10 т.о.) или в отдаленных сайтах, и они влияют на уровень или скорость транскрипции и трансляции гена.[0045] The term "gene" refers to a DNA sequence on a chromosome that encodes a product (e.g., an RNA product and/or a polypeptide product) and includes a coding region interrupted by non-coding introns and a sequence located adjacent to the coding region as 5'- end, and at the 3'-end, so that the gene corresponds to full-length mRNA (including 5'- and 3'-untranslated sequences). The term "gene" also includes other non-coding sequences, including regulatory sequences (eg, promoters, enhancers, and transcription factor binding sites), polyadenylation signals, internal ribosome entry sites, silencers, insulator sequences, and matrix attachment sites. These sequences may be located close to the coding region of the gene (eg, within 10 kb) or at distant sites, and they affect the level or rate of transcription and translation of the gene.

[0046] Термин «аллель» относится к вариантной форме гена. Некоторые гены имеют множество различных форм, которые расположены в одном и том же положении или генетическом локусе на хромосоме. Диплоидный организм имеет два аллеля в каждом генетическом локусе. Каждая пара аллелей представляет генотип определенного генетического локуса. Генотипы описаны как гомозиготные, если в конкретном локусе содержатся два идентичных аллеля, и как гетерозиготные, если эти два аллеля различаются.[0046] The term "allele" refers to a variant form of a gene. Some genes have many different forms that are located in the same position or genetic locus on a chromosome. A diploid organism has two alleles at each genetic locus. Each pair of alleles represents the genotype of a particular genetic locus. Genotypes are described as homozygous if a particular locus contains two identical alleles, and as heterozygous if the two alleles are different.

[0047] «Промотор» представляет собой регуляторный участок ДНК, обычно содержащий ТАТА-бокс, способный управлять РНК-полимеразой II с целью инициации синтеза РНК в соответствующем сайте инициации транскрипции для конкретной полинуклеотидной последовательности. Промотор может дополнительно содержать другие участки, которые влияют на скорость инициации транскрипции. Описанные в данном документе промоторные последовательности модулируют транскрипцию функционально связанного полинуклеотида. Промотор может быть активным в одном или более типах клеток, раскрытых в данном документе (например, в эукариотической клетке, клетке млекопитающего, отличного от человека, клетке человека, клетке грызуна, плюрипотентной клетке, эмбрионе стадии одной клетки, дифференцированной клетке или их комбинации). Промотор может быть, например, конститутивно активным промотором, условным промотором, индуцируемым промотором, ограниченным во времени промотором (например, промотором, регулируемым развитием) или пространственно ограниченным промотором (например, клеточноспецифическим или тканеспецифическим промотором). Примеры промоторов можно найти, например, в WO 2013/176772, включенной в данный документ посредством ссылки во всей своей полноте для всех целей.[0047] A "promoter" is a DNA regulatory region, typically containing a TATA box, capable of directing RNA polymerase II to initiate RNA synthesis at the appropriate transcription initiation site for a particular polynucleotide sequence. The promoter may additionally contain other regions that affect the rate of transcription initiation. The promoter sequences described herein modulate the transcription of an operably linked polynucleotide. A promoter may be active in one or more of the cell types disclosed herein (e.g., eukaryotic cell, non-human mammalian cell, human cell, rodent cell, pluripotent cell, single cell stage embryo, differentiated cell, or combinations thereof). The promoter can be, for example, a constitutively active promoter, a conditional promoter, an inducible promoter, a temporally limited promoter (eg, a developmental promoter), or a spatially limited promoter (eg, a cell-specific or tissue-specific promoter). Examples of promoters can be found, for example, in WO 2013/176772, incorporated herein by reference in its entirety for all purposes.

[0048] Термины «функциональная связь» или «функционально связанный» включают сопоставление двух или более компонентов (например, промотора и другого элемента последовательности) таким образом, что оба компонента функционируют нормально и допускают возможность того, что по меньшей мере один из компонентов может опосредовать функцию, которая воздействует по меньшей мере на один из других компонентов. Например, промотор может быть функционально связан с кодирующей последовательностью, если промотор контролирует уровень транскрипции кодирующей последовательности в ответ на присутствие или отсутствие одного или более транскрипционных регуляторных факторов. Функциональная связь может включать такие последовательности, которые являются смежными друг с другом или проявляют активность в транс-положении (например, регуляторная последовательность может действовать на расстоянии для контроля транскрипции кодирующей последовательности).[0048] The terms "operably linked" or "operably linked" include matching two or more components (e.g., a promoter and another sequence element) such that both components function normally and allow for the possibility that at least one of the components may mediate a function that affects at least one of the other components. For example, a promoter may be operably linked to a coding sequence if the promoter controls the level of transcription of the coding sequence in response to the presence or absence of one or more transcriptional regulatory factors. A functional linkage may include those sequences that are contiguous to each other or are active in trans (eg, a regulatory sequence may act at a distance to control transcription of a coding sequence).

[0049] Термин «вариант» относится к нуклеотидной последовательности, отличающейся от последовательности, наиболее распространенной в популяции (например, по одному нуклеотиду), или последовательности белка, отличающейся от последовательности, наиболее распространенной в популяции (например, по одной аминокислоте).[0049] The term "variant" refers to a nucleotide sequence that is different from the sequence most common in the population (eg, one nucleotide), or a protein sequence that is different from the sequence most common in the population (eg, one amino acid).

[0050] Термин «фрагмент» применительно к белку означает белок, который короче или содержит меньше аминокислот, чем полноразмерный белок. Термин «фрагмент» применительно к нуклеиновой кислоте означает нуклеиновую кислоту, которая короче или содержит меньше нуклеотидов, чем полноразмерная нуклеиновая кислота. Фрагмент может представлять собой, например, N-концевой фрагмент (т.е. удаление части С-конца белка), С-концевой фрагмент (т.е. удаление части N-конца белка) или внутренний фрагмент.[0050] The term "fragment" in relation to a protein means a protein that is shorter or contains fewer amino acids than a full-length protein. The term "fragment" when applied to a nucleic acid means a nucleic acid that is shorter or contains fewer nucleotides than a full-length nucleic acid. A fragment may be, for example, an N-terminal fragment (ie, removal of part of the C-terminus of the protein), a C-terminal fragment (ie, removal of part of the N-terminus of the protein), or an internal fragment.

[0051] «Идентичность последовательности» или «идентичность» в контексте двух полинуклеотидных или полипептидных последовательностей относится к остаткам в двух последовательностях, которые являются одинаковыми при выравнивании для максимального соответствия в указанном окне сравнения. Когда процент идентичности последовательности используется в отношении белков, положения остатков, которые не являются идентичными, часто отличаются консервативными аминокислотными заменами, где аминокислотные остатки заменены другими аминокислотными остатками со сходными химическими свойствами (например, зарядом или гидрофобностью) и, следовательно, не изменяют функциональные свойства молекулы. Когда две или более аминокислотных последовательностей отличаются консервативными заменами, процент идентичности можно повышать для коррекции характера консервативности замены. Считается, что последовательности, которые отличаются такими консервативными заменами, имеют «сходство последовательностей» или «сходство». Средства для такой корректировки хорошо известны. Как правило, они включают оценку консервативного замещения как частичного, а не полного несоответствия, за счет чего увеличивается процент идентичности последовательности. Таким образом, например, когда идентичной аминокислоте присваивают оценку 1, а неконсервативной замене присваивают оценку ноль, консервативная замена получает оценку от нуля до 1. Оценка в баллах консервативных замен рассчитывается таким образом, как это, например, реализовано в программе PC/GENE (Intelligenetics, Маунтин-Вью, Калифорния, США)[0051] "Sequence identity" or "identity" in the context of two polynucleotide or polypeptide sequences refers to residues in two sequences that are the same when aligned for maximum match in a specified comparison window. When percent sequence identity is used with proteins, positions of residues that are not identical are often distinguished by conservative amino acid substitutions, where amino acid residues are replaced by other amino acid residues with similar chemical properties (e.g., charge or hydrophobicity) and therefore do not change the functional properties of the molecule . When two or more amino acid sequences differ by conservative substitutions, the percent identity can be increased to correct for the conservative nature of the substitution. Sequences that differ by such conservative substitutions are considered to have "sequence similarity" or "similarity". Means for such adjustment are well known. Typically, they include the evaluation of conservative substitution as a partial rather than a complete mismatch, thereby increasing the percentage of sequence identity. Thus, for example, when an identical amino acid is assigned a score of 1 and a non-conservative substitution is assigned a score of zero, the conservative substitution is given a score from zero to 1. The score of conservative substitutions is calculated in such a manner as, for example, implemented in the PC/GENE program (Intelligenetics , Mountain View, California, USA)

[0052] «Процент идентичности последовательности» включает значение, определенное путем сравнения двух оптимально выровненных в окне сравнения последовательностей (наибольшее количество идеально совпадающих остатков), где часть полинуклеотидной последовательности в окне сравнения может содержать добавления или делеции (т.е. гэпы) по сравнению с эталонной последовательностью (которая не содержит добавлений или делеций) для оптимального выравнивания двух последовательностей. Процентное значение рассчитывают путем определения количества положений, в которых в обеих последовательностях встречается идентичное основание нуклеиновой кислоты или идентичный аминокислотный остаток, с получением количества положений с совпадениями, деления количества положений с совпадениями на общее количество положений в окне сравнения и умножения результата на 100 с получением процента идентичности последовательности. Если не указано иное (например, более короткая последовательность включает связанную гетерологичную последовательность), окно сравнения представляет собой полную длину более короткой из двух последовательностей сравнения.[0052] "Percent sequence identity" includes a value determined by comparing two optimally aligned in the comparison window sequences (highest number of perfectly matching residues), where part of the polynucleotide sequence in the comparison window may contain additions or deletions (i.e. gaps) compared with a reference sequence (which contains no additions or deletions) for optimal alignment of the two sequences. The percentage is calculated by determining the number of positions at which the identical nucleic acid base or identical amino acid residue occurs in both sequences to obtain the number of positions with matches, dividing the number of positions with matches by the total number of positions in the comparison window, and multiplying the result by 100 to obtain a percentage sequence identity. Unless otherwise noted (eg, the shorter sequence includes an associated heterologous sequence), the comparison window is the full length of the shorter of the two comparison sequences.

[0053] Если не указано иное, значения идентичности/сходства последовательности включают значение, полученное с использованием программы GAP версии 10 с использованием следующих параметров: % идентичности и % сходства для нуклеотидной последовательности с использованием штрафа за открытие гэпа 50 и штрафа за продление гэпа 3 и матрицы замен nwsgapdna.cmp; % идентичности и % сходства для аминокислотной последовательности с использованием штрафа за открытие гэпа 8 и штрафа за продление гэпа 2 и матрицы замен BLOSUM62 или любой эквивалентной программы. «Эквивалентная программа» включает любую программу сравнения последовательностей, которая для любых двух рассматриваемых последовательностей генерирует выравнивание, имеющее совпадения идентичных нуклеотидных или аминокислотных остатков и идентичный процент идентичности последовательностей по сравнению с соответствующим выравниванием, полученным с помощью GAP версии 10.[0053] Unless otherwise noted, sequence identity/similarity values include the value obtained using the GAP version 10 program using the following parameters: % identity and % similarity for the nucleotide sequence using a gap opening penalty of 50 and a gap extension penalty of 3 and substitution matrices nwsgapdna.cmp; % identity and % similarity for an amino acid sequence using a gap opening penalty of 8 and a gap extension penalty of 2 and a BLOSUM62 substitution matrix or any equivalent program. An "equivalent program" includes any sequence comparison program that, for any two sequences in question, generates an alignment having identical nucleotide or amino acid residue matches and an identical percent sequence identity compared to the corresponding alignment obtained using GAP version 10.

[0054] Термин «консервативная аминокислотная замена» относится к замене аминокислоты, которая обычно присутствует в последовательности, другой аминокислотой с аналогичными размером, зарядом или полярностью. Примеры консервативных замен включают замену неполярного (гидрофобного) остатка, такого как изолейцин, валин или лейцин, другим неполярным остатком. Аналогичным образом примеры консервативных замен включают замену одного полярного (гидрофильного) остатка другим, например, аргинина лизином, глутамина аспарагином или глицина серином. Кроме того, замена основного остатка, такого как лизин, аргинин или гистидин, другим, или замена одного кислотного остатка, такого как аспарагиновая кислота или глутаминовая кислота, другим кислотным остатком являются дополнительными примерами консервативных замен. Примеры неконсервативных замен включают замену неполярного (гидрофобного) аминокислотного остатка, такого как изолейцин, валин, лейцин, аланин или метионин, полярным (гидрофильным) остатком, таким как цистеин, глутамин, глутаминовая кислота или лизин, и/или полярного остатка неполярным остатком. Типичное распределение аминокислот по категориям обобщено ниже.[0054] The term "conservative amino acid substitution" refers to the replacement of an amino acid that is normally present in a sequence with another amino acid of similar size, charge, or polarity. Examples of conservative substitutions include replacing a non-polar (hydrophobic) moiety such as isoleucine, valine, or leucine with another non-polar moiety. Similarly, examples of conservative substitutions include replacing one polar (hydrophilic) residue with another, such as arginine with lysine, glutamine with asparagine, or glycine with serine. Furthermore, substitution of a basic residue such as lysine, arginine or histidine with another, or substitution of one acidic residue such as aspartic acid or glutamic acid with another acidic residue are further examples of conservative substitutions. Examples of non-conservative substitutions include replacing a non-polar (hydrophobic) amino acid residue such as isoleucine, valine, leucine, alanine, or methionine with a polar (hydrophilic) residue such as cysteine, glutamine, glutamic acid, or lysine, and/or a polar residue with a non-polar residue. A typical categorization of amino acids is summarized below.

Figure 00000001
Figure 00000001

[0055] «Гомологичная» последовательность (например, последовательность нуклеиновой кислоты) включает последовательность, которая является либо идентичной, либо по сути аналогичной известной эталонной последовательности таким образом, что она, например, на по меньшей мере 50%, на по меньшей мере 55%), на по меньшей мере 60%, на по меньшей мере 65%), на по меньшей мере 70%, на по меньшей мере 75%, на по меньшей мере 80%, на по меньшей мере 85%, на по меньшей мере 90%, на по меньшей мере 95%), на по меньшей мере 96%, на по меньшей мере 97%, на по меньшей мере 98%), на по меньшей мере 99% или на 100% идентична известной эталонной последовательности. Гомологичные последовательности могут включать, например, ортологичные последовательности и паралогичные последовательности. Например, гомологичные гены обычно передаются от общей предковой последовательности ДНК, либо через событие видообразования (ортологичные гены), либо через событие генетической дупликации (паралогичные гены). «Ортологичные» гены включают гены разных видов, которые произошли от общего предкового гена путем видообразования. Ортологи обычно сохраняют ту же функцию в ходе эволюции. «Паралогичные» гены включают гены, связанные путем дупликации в геноме. У паралогов могут появляться новые функции в ходе эволюции.[0055] A "homologous" sequence (e.g., a nucleic acid sequence) includes a sequence that is either identical to or substantially similar to a known reference sequence such that it is, for example, at least 50%, at least 55% ), at least 60%, at least 65%), at least 70%, at least 75%, at least 80%, at least 85%, at least 90 %, at least 95%), at least 96%, at least 97%, at least 98%), at least 99%, or 100% identical to the known reference sequence. Homologous sequences may include, for example, orthologous sequences and paralogous sequences. For example, homologous genes are usually passed down from a common ancestral DNA sequence, either through a speciation event (orthologous genes) or through a genetic duplication event (paralogous genes). "Orthologous" genes include genes from different species that have evolved from a common ancestral gene through speciation. Orthologues usually retain the same function over the course of evolution. "Paralogous" genes include genes linked by duplication in the genome. Paralogs may have new functions in the course of evolution.

[0056] Термин «in vitro» включает искусственную среду и процессы или реакции, которые происходят в искусственной среде (например, в тестовой пробирке). Термин «т vivo» включает природную среду (например, клетку, организм или тело) и процессы или реакции, которые происходят в природной среде. Термин «ех vivo» включает клетки, которые были удалены из организма человека, а также процессы или реакции, которые происходят внутри таких клеток.[0056] The term "in vitro" includes an artificial environment and processes or reactions that occur in an artificial environment (eg, in a test tube). The term "t vivo" includes the natural environment (eg, cell, organism or body) and processes or reactions that occur in the natural environment. The term "ex vivo" includes cells that have been removed from the human body, as well as processes or reactions that occur within such cells.

[0057] Термин «репортерный ген» относится к нуклеиновой кислоте, имеющей последовательность, кодирующую продукт гена (как правило, фермент), который с легкостью поддается количественному анализу, когда конструкцию, содержащую последовательность репортерного гена, функционально связанную с гетерологичным промоторным и/или энхансерным элементом вводят в клетки, содержащие (или которые могут содержать) факторы, необходимые для активации промоторных и/или энхансерных элементов. Примеры репортерных генов включают без ограничения гены, кодирующие бета-галактозидазу (lacZ), гены бактериальной хлорамфеникол-ацетилтрансферазы (cat), гены люциферазы светлячка, гены, кодирующие бета-глюкуронидазу (GUS), и гены, кодирующие флуоресцентные белки. «Репортерный белою) относится к белку, кодируемому репортерным геном.[0057] The term "reporter gene" refers to a nucleic acid having a sequence encoding a gene product (typically an enzyme) that is readily quantifiable when the construct containing the reporter gene sequence operably linked to a heterologous promoter and/or enhancer the element is introduced into cells containing (or which may contain) the factors necessary for the activation of promoter and/or enhancer elements. Examples of reporter genes include, but are not limited to, genes encoding beta-galactosidase (lacZ), bacterial chloramphenicol acetyltransferase (cat) genes, firefly luciferase genes, genes encoding beta-glucuronidase (GUS), and genes encoding fluorescent proteins. "Reporter white" refers to a protein encoded by a reporter gene.

[0058] Используемый в данном документе термин «флуоресцентный репортерный белок» означает репортерный белок, который поддается обнаружению за счет флуоресценции, причем флуоресценция может возникать либо непосредственно от репортерного белка, либо в результате активности репортерного белка на флуорогенном субстрате, либо от белка с аффинностью связывания с флуоресцентно меченным соединением. Примеры флуоресцентных белков включают зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP и ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, Citrine, Venus, YPet, PhiYFP и ZsYellowl), синие флуоресцентные белки (например, BFP, eBFP, eBFP2, азурит, mKalamal, GFPuv, Sapphire и T-sapphire), голубые флуоресцентные белки (например, CFP, eCFP, лазурь, CyPet, AmCyanl и Midoriishi-Cyan), красные флуоресцентные белки (например, RFP, mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFPl, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, AsRed2, eqFP611, mRaspberry, m Strawberry и Jred), оранжевые флуоресцентные белки (например, mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine и tdTomato) и любой другой подходящий флуоресцентный белок, присутствие которого в клетках можно обнаружить с помощью методик проточной цитометрии.[0058] As used herein, the term "fluorescent reporter protein" means a reporter protein that is detectable by fluorescence, wherein the fluorescence may arise either directly from the reporter protein, or as a result of the activity of the reporter protein on a fluorogenic substrate, or from a protein with a binding affinity with a fluorescently labeled compound. Examples of fluorescent proteins include green fluorescent proteins (e.g., GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, and ZsGreenl), yellow fluorescent proteins (e.g., YFP, eYFP, Citrine, Venus, YPet, PhiYFP, and ZsYellowl), blue fluorescent proteins (e.g., BFP, eBFP, eBFP2, azurite, mKalamal, GFPuv, Sapphire, and T-sapphire), blue fluorescent proteins (e.g., CFP, eCFP, sky blue, CyPet, AmCyanl and Midoriishi-Cyan), red fluorescent proteins (e.g., RFP, mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFPl, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, AsRed2, eqFP611, mRaspberry, m Strawberry, and Jred ), orange fluorescent proteins (eg, mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine and tdTomato) and any other suitable fluorescent protein whose presence in cells can be detected using flow cytometry techniques.

[0059] Термин «рекомбинация» включает любой процесс обмена генетической информацией между двумя полинуклеотидами и может происходить осуществляться посредством любого механизма. Рекомбинация в ответ на двухнитевые разрывы (DSB) происходит главным образом за счет двух консервативных путей репарации ДНК: негомологичное соединение концов (NHEJ) и гомологичная рекомбинация (HR). См. Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897, включенную в данный документ посредством ссылки во всей своей полноте для всех целей. Аналогичным образом репарация целевой нуклеиновой кислоты, опосредованное экзогенной донорной нуклеиновой кислотой, может включать любой процесс обмена генетической информацией между двумя полинуклеотидами.[0059] The term "recombination" includes any process of exchange of genetic information between two polynucleotides and can occur through any mechanism. Recombination in response to double strand breaks (DSBs) occurs primarily through two conservative DNA repair pathways: nonhomologous end joining (NHEJ) and homologous recombination (HR). See Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897, incorporated herein by reference in its entirety for all purposes. Similarly, repair of a target nucleic acid mediated by an exogenous donor nucleic acid may include any exchange of genetic information between two polynucleotides.

[0060] NHEJ включает репарацию двухнитевых разрывов в нуклеиновой кислоте путем прямого лигирования концов разрыва друг с другом или с экзогенной последовательностью без потребности в гомологичной матрице. Лигирование не являющихся смежными последовательностей с помощью NHEJ часто может приводить к делециям, вставкам или транслокациям вблизи сайта двухнитевого разрыва. Например, NHEJ также может приводить к направленной интеграции экзогенной донорной нуклеиновой кислоты посредством прямого лигирования концов разрыва с концами экзогенной донорной нуклеиновой кислоты (т.е. захват на основе NHEJ). Такая NHEJ-опосредованная направленная интеграция может быть предпочтительной для вставки экзогенной донорной нуклеиновой кислоты, если пути гомологичной репарации (HDR) не всегда могут использоваться (например, в неделящихся клетках, первичных клетках и клетках, в которых гомологичная репарация ДНК осуществляется недостаточно эффективно). Кроме того, в отличие от гомологичной репарации, не требуется информация об относительно больших участках идентичности последовательности, фланкирующих сайт расщепления, что может быть полезным при попытке целенаправленной вставки в организмы с геномами, знание о геномной последовательности которых ограничено. Интеграция может происходить посредством лигирования «тупых концов» экзогенной донорной нуклеиновой кислоты и расщепленной геномной последовательности или посредством лигирования «липких концов» (т.е. имеющих 5'- или 3'-свисающие концы) с использованием экзогенной донорной нуклеиновой кислоты, которая фланкирована свисающими концами, которые совместимы с такими концами, образующимся за счет нуклеазного средства в расщепленной геномной последовательности. См., например, US 2011/020722, WO 2014/033644, WO 2014/089290 и Maresca et al. (2013) Genome Res. 23(3): 539-546, каждая из которых включена в данный документ посредством ссылки во всей своей полноте для всех целей. Если «тупые концы» лигированы, может потребоваться эксцизия мишени и/или донора для получения участков микрогомологии, необходимых для соединения фрагментов, что может привести к нежелательным изменениям в целевой последовательности.[0060] NHEJ involves the repair of double-strand breaks in nucleic acid by direct ligation of the break ends to each other or to an exogenous sequence without the need for a homologous template. Ligation of non-contiguous sequences with NHEJ can often result in deletions, insertions or translocations near the double strand break site. For example, NHEJ can also result in targeted integration of the exogenous donor nucleic acid by direct ligation of the break ends to the ends of the exogenous donor nucleic acid (ie, NHEJ-based capture). Such NHEJ-mediated targeted integration may be preferred for exogenous donor nucleic acid insertion when homologous repair (HDR) pathways cannot always be used (e.g., in non-dividing cells, primary cells, and cells in which DNA homologous repair is not efficient enough). In addition, unlike homologous repair, information about the relatively large regions of sequence identity flanking the cleavage site is not required, which can be useful when attempting targeted insertion into organisms with genomes whose genomic sequence knowledge is limited. Integration can occur by ligating "blunt ends" of the exogenous donor nucleic acid and the cleaved genomic sequence, or by ligating "sticky ends" (i.e., having 5' or 3' overhanging ends) using the exogenous donor nucleic acid that is flanked by overhanging ends that are compatible with such ends generated by the nuclease agent in the cleaved genomic sequence. See, for example, US 2011/020722, WO 2014/033644, WO 2014/089290 and Maresca et al. (2013) Genome Res. 23(3): 539-546, each of which is incorporated herein by reference in its entirety for all purposes. If the "blunt ends" are ligated, the target and/or donor may need to be excised to obtain the microhomologies needed to join the fragments, which may lead to undesirable changes in the target sequence.

[0061] Рекомбинация также может происходить посредством гомологичной репарации (HDR) или гомологичной рекомбинации (HR). HDR или HR включает форму репарации нуклеиновой кислоты, для которая может потребоваться гомология нуклеотидной последовательности, использование «донорной» молекулы в качестве матрицы для репарации «целевой» молекулы (то есть той, в которой произошел двухнитевой разрыв), и которая приводит к передаче генетической информации от донора к мишени. Без ограничения какой-либо конкретной теорией, такой перенос может включать коррекцию несоответствия гетеродуплексной ДНК, которое образуется между поврежденной мишенью и донором, и/или отжиг нитей, зависимый от синтеза, при котором донор используется для повторного синтеза генетической информации, которая станет частью мишени и/или связанных процессов. В ряде случаев донорный полинуклеотид, часть донорного полинуклеотида, копия донорного полинуклеотида или часть копии донорного полинуклеотида интегрируют в ДНК-мишень. См. Wang et al. (2013) Cell 153:910-918; Mandalos et al. (2012) PLOS ONE 7:e45768:1-9; и Wang et al. (2013) Nat Biotechnol. 31:530-532, каждая из которых включена в данный документ посредством ссылки во всей своей полноте для всех целей.[0061] Recombination can also occur via homologous repair (HDR) or homologous recombination (HR). HDR or HR includes a form of nucleic acid repair that may require nucleotide sequence homology, the use of a "donor" molecule as a template for the repair of a "target" molecule (i.e., one in which a double-strand break has occurred), and which results in the transfer of genetic information from donor to target. Without being limited to any particular theory, such transfer may include correcting the heteroduplex DNA mismatch that forms between the damaged target and the donor, and/or fusion-dependent strand annealing, in which the donor is used to resynthesize genetic information that will become part of the target and /or related processes. In some cases, the donor polynucleotide, a portion of the donor polynucleotide, a copy of the donor polynucleotide, or a portion of a copy of the donor polynucleotide is integrated into the target DNA. See Wang et al. (2013) Cell 153:910-918; Mandalos et al. (2012) PLOS ONE 7:e45768:1-9; and Wang et al. (2013) Nat Biotechnol. 31:530-532, each of which is incorporated herein by reference in its entirety for all purposes.

[0062] Термин «антигенсвязывающий белок» включает любой белок, который связывается с антигеном. Примеры антигенсвязывающих белков включают антитело, антигенсвязывающий фрагмент антитела, полиспецифическое антитело (например, биспецифическое антитело), scFV, бис-scFV, диатело, триатело, тетратело, V-NAR, VHH, VL, F(ab), F(ab)2, DVD (антигенсвязывающий белок с двумя вариабельными доменами), SVD (антигенсвязывающий белок с одним вариабельным доменом), биспецифический рекрутер Т-клеток (BiTE) или Davisbody (патент США №8586713, включенный в данный документ посредством ссылки во всей своей полноте для всех целей).[0062] The term "antigen binding protein" includes any protein that binds to an antigen. Examples of antigen-binding proteins include an antibody, an antigen-binding fragment of an antibody, a polyspecific antibody (e.g., a bispecific antibody), scFV, bis-scFV, diabody, triatebody, tetrabody, V-NAR, VHH, VL, F(ab), F(ab) 2 . DVD (antigen-binding protein with two variable domains), SVD (antigen-binding protein with a single variable domain), bispecific T-cell recruiter (BiTE), or Davisbody (U.S. Patent No. 8,586,713, incorporated herein by reference in its entirety for all purposes) .

[0063] Термин «полиспецифический» или «биспецифический» в отношении антиген связывающего белка означает, что белок распознает разные эпитопы, либо на одном и том же антигене, либо на разных антигенах. Полиспецифическая антиген связывающая молекула может представлять собой отдельный многофункциональный полипептид или может представлять собой мультимерный комплекс из двух или более полипептидов, ковалентно или нековалентно связанных друг с другом. Например, антитело или его фрагмент могут быть функционально связаны (например, путем химического сочетания, генетического слияния, нековалентной ассоциации или прочих) с одним или более другими молекулярными объектами, такими как белок или его фрагмент, с получением биспецифической или полиспецифической антигенсвязывающей молекулы со второй специфичностью связывания.[0063] The term "multispecific" or "bispecific" in relation to an antigen binding protein means that the protein recognizes different epitopes, either on the same antigen or on different antigens. The multispecific antigen binding molecule may be a single multifunctional polypeptide or may be a multimeric complex of two or more polypeptides covalently or non-covalently linked to each other. For example, an antibody or fragment thereof may be operably linked (eg, by chemical coupling, genetic fusion, non-covalent association, or others) to one or more other molecular entities, such as a protein or fragment thereof, to produce a bispecific or polyspecific antigen-binding molecule with a second specificity. binding.

[0064] Термин «антиген» относится к веществу, целой молекуле или домену в составе молекулы, которое способно инициировать продуцирование антител со специфичностью связывания с данным веществом. Термин антиген также включает вещества, которые в организмах-хозяевах дикого типа не вызывают продуцирование антител за счет распознавания «своего», но могут вызывать такой ответ у животного-хозяина с соответствующими генноинженерными модификациями, предназначенными для нарушения иммунологической толерантности.[0064] The term "antigen" refers to a substance, an entire molecule, or a domain within a molecule that is capable of initiating the production of antibodies with binding specificity for that substance. The term antigen also includes substances that, in wild-type hosts, do not induce antibody production through self recognition, but can induce such a response in the host animal with appropriate genetic modifications designed to break immunological tolerance.

[0065] Термин «эпитоп» относится к сайту на антигене, с которым связывается антигенсвязывающий белок (например, антитело). Эпитоп может образовываться из смежных аминокислот или несмежных аминокислот, сближенных за счет фолдинга одного или более белков в третичную структуру. Эпитопы, образованные смежными аминокислотами (также известные как линейные эпитопы), как правило, сохраняются при воздействии денатурирующими растворителями, тогда как эпитопы, образованные за счет фолдинга в третичную структуру (также известные как конформационные эпитопы), как правило, утрачиваются при обработке денатурирующими растворителями. Как правило, эпитоп включает по меньшей мере 3, а обычно по меньшей мере 5 или 8 10 аминокислот в уникальной пространственной конформации. Способы определения пространственной конформации эпитопов включают, например, рентгеновскую кристаллографию и 2-мерный ядерный магнитный резонанс. См., например, Epitope Mapping Protocols, in Methods in Molecular Biology, Vol.66, Glenn E. Morris, Ed. (1996), включенный в данный документ посредством ссылки во всей своей полноте для всех целей.[0065] The term "epitope" refers to a site on an antigen to which an antigen-binding protein (eg, antibody) binds. An epitope may be formed from contiguous amino acids or non-contiguous amino acids brought together by the folding of one or more proteins into a tertiary structure. Epitopes formed by contiguous amino acids (also known as linear epitopes) are generally retained upon exposure to denaturing solvents, while epitopes formed by folding into a tertiary structure (also known as conformational epitopes) are generally lost upon exposure to denaturing solvents. Typically, an epitope comprises at least 3, and usually at least 5 or 8 to 10 amino acids in a unique spatial conformation. Methods for determining the spatial conformation of epitopes include, for example, x-ray crystallography and 2D nuclear magnetic resonance. See, for example, Epitope Mapping Protocols, in Methods in Molecular Biology, Vol. 66, Glenn E. Morris, Ed. (1996), incorporated herein by reference in its entirety for all purposes.

[0066] Паратоп антитела, как описано в данном документе, обычно содержит по меньшей мере определяющий комплементарность участок (CDR), который специфически распознает гетерологичный эпитоп (например, участок CDR3 вариабельного домена тяжелой и/или легкой цепи).[0066] An antibody paratope as described herein typically contains at least a complementarity determining region (CDR) that specifically recognizes a heterologous epitope (eg, heavy and/or light chain variable domain CDR3 region).

[0067] Термин «антитело» предусматривает молекулы иммуноглобулинов, содержащие четыре полипептидные цепи, две тяжелые (Н) цепи и две легкие (L) цепи, соединенные между собой дисульфидными связями. Каждая тяжелая цепь содержит вариабельный домен тяжелой цепи и константный участок тяжелой цепи (CH). Константный участок тяжелой цепи содержит три домена: CH1, CH2 и CH3. Каждая легкая цепь содержит вариабельный домен легкой цепи и константный участок легкой цепи (CL). Вариабельные домены тяжелой цепи и легкой цепи могут быть дополнительно подразделены на участки гипервариабельности, называемые определяющими комплементарность участками (CDR), чередующиеся с более консервативными участками, называемыми каркасными участками (FR). Каждый вариабельный домен тяжелой и легкой цепей содержит три CDR и четыре FR, расположенных в направлении от амино-конца к карбокси-концу в следующем порядке: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4 (CDR тяжелой цепи могут сокращенно называться как HCDR1, HCDR2 и HCDR3; CDR легкой цепи могут сокращенно называться как LCDR1, LCDR2 и LCDR3). Термин «высокоаффинное» антитело относится к антителу, которое характеризуется Kd по отношению к своему целевому эпитопу, составляющей приблизительно 10-9 М или менее (например, приблизительно 1×10-9 М, 1×10-10 М, 1×10-11 М или приблизительно 1×10-12 М). В одном варианте осуществления Kd измеряют с помощью поверхностного плазмонного резонанса, например, BIACORE™; в другом варианте осуществления, Kd измеряют с помощью ELISA.[0067] The term "antibody" refers to immunoglobulin molecules containing four polypeptide chains, two heavy (H) chains, and two light (L) chains linked together by disulfide bonds. Each heavy chain contains a heavy chain variable domain and a heavy chain constant region (C H ). The heavy chain constant region contains three domains: C H 1 , C H 2 and C H 3. Each light chain contains a light chain variable domain and a light chain constant region (C L ). The heavy chain and light chain variable domains can be further subdivided into regions of hypervariability called complementarity determining regions (CDRs) interspersed with more conserved regions called framework regions (FRs). Each heavy and light chain variable domain contains three CDRs and four FRs, arranged from amino to carboxy in the following order: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4 (heavy chain CDRs may be abbreviated as HCDR1, HCDR2, and HCDR3; light chain CDRs may be abbreviated as LCDR1, LCDR2, and LCDR3). The term "high affinity" antibody refers to an antibody that has a Kd relative to its target epitope of about 10 -9 M or less (e.g., about 1 x 10 -9 M, 1 x 10 -10 M, 1 x 10 -11 M or approximately 1×10 -12 M). In one embodiment, Kd is measured using surface plasmon resonance, for example, BIACORE™; in another embodiment, Kd is measured using ELISA.

[0068] Термин «биспецифическое антитело» включает антитело, способное селективно связывать два или более эпитопа. Биспецифические антитела обычно содержат две разные тяжелые цепи, при этом каждая тяжелая цепь специфически связывается с отдельным эпитопом либо на двух разных молекулах (например, на двух разных антигенах), либо на одной и той же молекуле (например, на одном и том же антигене). Если биспецифическое антитело способно селективно связываться с двумя разными эпитопами (первым эпитопом и вторым эпитопом), то аффинность первой тяжелой цепи по отношению к первому эпитопу обычно будет по меньшей мере на один, два, или три, или четыре порядка ниже аффинности первой тяжелой цепи по отношению ко второму эпитопу, и наоборот. Эпитопы, распознаваемые биспецифическим антителом, могут располагаться на одной и той же или на другой мишени (например, на одном и том же или на другом белке). Биспецифические антитела могут быть получены, например, путем объединения тяжелых цепей, которые распознают разные эпитопы одного и того же антигена. Например, последовательности нуклеиновой кислоты, кодирующие те вариабельные последовательности тяжелой цепи, которые распознают разные эпитопы одного и того же антигена, могут быть слиты с последовательностями нуклеиновой кислоты, кодирующими разные константные участки тяжелой цепи, и при этом такие последовательности могут быть экспрессированы в клетке, которая экспрессирует легкую цепь иммуноглобулина. Типичное биспецифическое антитело имеет две тяжелые цепи, каждая из которых содержит три CDR тяжелой цепи, за которыми следует (от N-конца к С-концу) СН1-домен, шарнирный участок, СН2-домен и СН3-домен, и легкую цепь иммуноглобулина, которая либо не наделяет антиген-связывающей специфичностью, но которая при этом может ассоциироваться с каждой тяжелой цепью, либо которая может ассоциироваться с каждой тяжелой цепью и которая может связываться с одним или более эпитопами, связывающимися антиген-связывающими участками тяжелой цепи, либо которая может ассоциироваться с каждой тяжелой цепью и обеспечивать связывание либо одной, либо обеих тяжелых цепей с одним или обоими эпитопами.[0068] The term "bispecific antibody" includes an antibody that can selectively bind two or more epitopes. Bispecific antibodies usually contain two different heavy chains, with each heavy chain specifically binding to a different epitope, either on two different molecules (for example, on two different antigens) or on the same molecule (for example, on the same antigen) . If the bispecific antibody is capable of selectively binding to two different epitopes (a first epitope and a second epitope), then the first heavy chain's affinity for the first epitope will typically be at least one, two, or three, or four orders of magnitude lower than the first heavy chain's affinity for relation to the second epitope, and vice versa. Epitopes recognized by a bispecific antibody may be on the same or different target (eg, on the same or different protein). Bispecific antibodies can be obtained, for example, by combining heavy chains that recognize different epitopes of the same antigen. For example, nucleic acid sequences encoding those heavy chain variable sequences that recognize different epitopes of the same antigen can be fused to nucleic acid sequences encoding different heavy chain constant regions, and such sequences can be expressed in a cell that expresses the immunoglobulin light chain. A typical bispecific antibody has two heavy chains, each containing three heavy chain CDRs, followed (from N-terminus to C-terminus) by a CH1 domain, a hinge region, a CH2 domain, and a CH3 domain, and an immunoglobulin light chain, which either does not confer antigen-binding specificity, but which may associate with each heavy chain, or which may associate with each heavy chain and which may bind to one or more epitopes that bind antigen-binding regions of the heavy chain, or which may associate with each heavy chain and allow either one or both heavy chains to bind to one or both epitopes.

[0069] Термин «тяжелая цепь» или «тяжелая цепь иммуноглобулина» включает последовательность тяжелой цепи иммуноглобулина, в том числе последовательность константного участка тяжелой цепи иммуноглобулина, из любого организма. Вариабельные домены тяжелой цепи содержат три CDR тяжелой цепи и четыре FR-участка, если не указано иное. Фрагменты тяжелых цепей включают CDR, CDR и FR и их комбинации. Типичная тяжелая цепь после вариабельного домена (от N-конца к С-концу) содержит CH1-домен, шарнирный участок, CH2-домен и СН3-домен. Функциональный фрагмент тяжелой цепи включает фрагмент, который способен специфически распознавать эпитоп (например, распознавать эпитоп с Kd в микромолярном, наномолярном или пикомолярном диапазоне), который способен к экспрессии и секреции из клетки и который содержит по меньшей мере одну CDR. Вариабельные домены тяжелой цепи кодируются нуклеотидной последовательностью вариабельного участка, который обычно содержит сегменты VH, DH и JH, полученные из репертуара сегментов VH, DH и JH, присутствующих в антителах зародышевой линии. Последовательности, местоположения и номенклатуру для сегментов V, D и J тяжелой цепи для различных организмов можно найти в базе данных IMGT, которая доступна через Интернет во всемирной паутине (www) по адресу ресурса в сети «imgt.org».[0069] The term "heavy chain" or "immunoglobulin heavy chain" includes an immunoglobulin heavy chain sequence, including an immunoglobulin heavy chain constant region sequence, from any organism. Heavy chain variable domains contain three heavy chain CDRs and four FR regions, unless otherwise noted. Heavy chain fragments include CDR, CDR and FR and combinations thereof. A typical heavy chain after the variable domain (N-terminus to C-terminus) contains a C H 1 domain, a hinge region, a C H 2 domain, and a C H 3 domain. A functional heavy chain fragment includes a fragment that is capable of specifically recognizing an epitope (eg, recognizing an epitope with a Kd in the micromolar, nanomolar, or picomolar range), that is capable of being expressed and secreted from a cell, and that contains at least one CDR. Heavy chain variable domains are encoded by the nucleotide sequence of the variable region, which typically contains V H , D H and J H segments derived from the repertoire of V H , D H and J H segments present in germline antibodies. Sequences, locations and nomenclature for the V, D and J segments of the heavy chain for various organisms can be found in the IMGT database, which is available via the Internet on the World Wide Web (www) at the resource address on the network "imgt.org".

[0070] Термин «легкая цепь» включает последовательность легкой цепи иммуноглобулина из любого организма, и, если не указано иное, включает каппа (κ) и лямбда (λ) легкие цепи человека и VpreB, а также суррогатные легкие цепи. Вариабельные домены легкой цепи обычно включают три CDR легкой цепи и четыре каркасных (FR) участка, если не указано иное. Как правило, полноразмерная легкая цепь включает в направлении от аминоконца к карбоксильному концу вариабельный домен, который включает FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4, и аминокислотную последовательность константного участка легкой цепи. Вариабельные домены легкой цепи кодируются нуклеотидной последовательностью вариабельного участка легкой цепи, который обычно включает сегменты гена VL легкой цепи и JL легкой цепи, полученные из репертуара сегментов гена V и J легкой цепи, присутствующих в антителах зародышевой линии. Последовательности, местоположения и номенклатуру для сегментов гена V и J легкой цепи для различных организмов можно найти в базе данных IMGT, которая доступна через Интернет во всемирной паутине (www) по адресу ресурса в сети Ошибка! Недопустимый объект гиперссылки.. Легкие цепи включают, например, цепи, которые селективно не связывают ни первый, ни второй эпитопы, селективно связанные эпитоп-связывающим белком, в котором они встречаются. Легкие цепи также включают те цепи, которые связывают и распознают или помогают тяжелой цепи в связывании и распознавании одного или более эпитопов, селективно связанных эпитоп-связывающим белком, в котором они находятся.[0070] The term "light chain" includes an immunoglobulin light chain sequence from any organism, and unless otherwise indicated, includes kappa (κ) and lambda (λ) human and VpreB light chains, as well as surrogate light chains. Light chain variable domains typically include three light chain CDRs and four framework (FR) regions unless otherwise noted. Typically, a full-length light chain includes, in the amino-to-carboxyl-terminal direction, a variable domain that includes FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4 and the amino acid sequence of the light chain constant region. The light chain variable domains are encoded by the nucleotide sequence of the light chain variable region, which typically includes the V L light chain and J L light chain gene segments derived from the repertoire of V and J light chain gene segments present in germline antibodies. Sequences, locations, and nomenclature for the V and J light chain gene segments for various organisms can be found in the IMGT database, which is available via the Internet on the World Wide Web (www) at the web resource address Error! Invalid hyperlink object. . Light chains include, for example, chains that selectively bind neither the first nor the second epitopes selectively bound by the epitope-binding protein in which they occur. Light chains also include those chains that bind and recognize or assist the heavy chain in binding and recognizing one or more epitopes selectively bound by the epitope binding protein in which they are found.

[0071] Используемый в данном документе термин «определяющий комплементарность участок» или «CDR» предусматривает аминокислотную последовательность, кодируемую последовательностью нуклеиновой кислоты генов иммуноглобулина организма, которая обычно (т.е. у животного дикого типа) располагается между двумя каркасными участками в вариабельном участке легкой или тяжелой цепей молекулы иммуноглобулина (например, антитела или рецептора Т-клетки). CDR может кодироваться, например, последовательностью зародышевой линии или перегруппированной последовательностью, и, например, наивной или зрелой В-клеткой или Т-клеткой. CDR может быть подвергнут соматической мутации (например, отличаться от последовательности, кодируемой в зародышевой линии у животного), гуманизации и/или модификации с помощью аминокислотных замен, добавлений или делеций. В некоторых случаях (например, в случае CDR3) CDR могут кодироваться двумя или более последовательностями (например, последовательностями зародышевой линии), которые не являются смежными (например, в случае неперегруппированной последовательности нуклеиновой кислоты), но они являются смежными в последовательности нуклеиновой кислоты в В-клетке, например, как результат сплайсинга или соединения последовательностей (например, V-D-J-рекомбинация с образованием CDR3 тяжелой цепи).[0071] As used herein, the term "complementarity determining region" or "CDR" refers to the amino acid sequence encoded by the nucleic acid sequence of the immunoglobulin genes of an organism, which is usually (i.e., in a wild-type animal) located between two framework regions in the variable region of the lung or the heavy chains of an immunoglobulin molecule (eg, antibody or T cell receptor). The CDR may be encoded by, for example, a germline sequence or a rearranged sequence, and, for example, a naive or mature B cell or T cell. The CDR may be somatically mutated (eg, different from the sequence encoded in the animal's germline), humanized, and/or modified by amino acid substitutions, additions, or deletions. In some cases (for example, in the case of CDR3), CDRs may be encoded by two or more sequences (for example, germline sequences) that are not contiguous (for example, in the case of a non-rearranged nucleic acid sequence), but they are contiguous in the nucleic acid sequence in B cell, for example, as a result of splicing or joining sequences (eg, V-D-J recombination to form heavy chain CDR3).

[0072] Специфическое связывание антиген связывающего белка с его целевым антигеном включает связывание с аффинностью, составляющей по меньшей мере 106, 107, 108, 109 или 1010 М-1. Специфическое связывание явно выше по значению и отличается от неспецифического связывания, происходящего по меньшей мере с одной неродственной мишенью. Специфическое связывание может быть результатом образования связей между определенными функциональными группами или определенного пространственного соответствия (например, взаимодействия по типу «замок и ключ»), тогда как неспецифическое связывание обычно является результатом действия ван-дер-ваальсовых сил. Однако специфическое связывание не обязательно подразумевает, что антигенсвязывающий белок связывает одну и только одну мишень.[0072] Specific binding of an antigen binding protein to its target antigen includes binding with an affinity of at least 10 6 , 10 7 , 10 8 , 10 9 , or 10 10 M -1 . Specific binding is clearly superior and distinct from non-specific binding occurring to at least one unrelated target. Specific binding may result from the formation of bonds between certain functional groups or a certain spatial correspondence (for example, lock and key interactions), while non-specific binding is usually the result of van der Waals forces. However, specific binding does not necessarily imply that the antigen binding protein binds to one and only one target.

[0073] Композиции или способы, «содержащие» или «включающие» один или более перечисленных элементов, могут включать другие элементы, которые конкретно не указаны. Например, композиция, которая «содержит» или «включает» белок, может содержать белок отдельно или в комбинации с другими ингредиентами. Переходная фраза «состоящий по сути из» означает, что объем формулы изобретения следует интерпретировать как охватывающий указанные элементы, перечисленные в формуле изобретения, и те элементы, которые не оказывают существенного влияния на основную и новую характеристику (характеристики) заявляемого изобретения. Таким образом, выражение «состоящий по сути из» при использовании в формуле настоящего изобретения не предназначен для того, чтобы истолковываться как эквивалент выражению «содержащий».[0073] Compositions or methods "comprising" or "comprising" one or more of the listed elements may include other elements that are not specifically indicated. For example, a composition that "comprises" or "comprises" a protein may contain the protein alone or in combination with other ingredients. The transitional phrase "consisting essentially of" means that the scope of the claims should be interpreted as covering the specified elements listed in the claims, and those elements that do not significantly affect the main and new characteristic (characteristics) of the claimed invention. Thus, the expression "consisting essentially of" when used in the claims of the present invention is not intended to be construed as equivalent to the expression "comprising".

[0074] «Необязательный» или «необязательно» означает, что описываемое последующее событие или обстоятельство может произойти или может не произойти, и что данное описание включает случаи, когда событие или обстоятельство возникают, и случаи, когда они не возникают.[0074] "Optional" or "optional" means that the subsequent event or circumstance described may or may not occur, and that the description includes cases where the event or circumstance occurs and cases where it does not occur.

[0075] Обозначение диапазона значений включает все целые числа определяющие диапазон и все поддиапазоны или в их пределах, определенные целыми числами в пределах диапазона.[0075] The range designation includes all integers defining the range and all or within subranges defined by integers within the range.

[0076] Если иное не очевидно из контекста, выражение «приблизительно» охватывает значения в пределах стандартного предела погрешности измерения (например, SEM) указанного значения.[0076] Unless otherwise clear from the context, the expression "approximately" covers values within the standard margin of error of measurement (eg, SEM) of the specified value.

[0077] Союзы «и/или» относятся к любым возможным комбинациям одного или более связанных перечисленных элементов, а также к отсутствию комбинаций при интерпретации в виде альтернативы («или») и охватывают их.[0077] The conjunctions "and/or" refer to and encompass any possible combinations of one or more of the related listed elements, as well as the absence of combinations when interpreted as an alternative ("or").

[0078] Союз «или» относится к любому одному представителю определенного списка, а также включает любую комбинацию представителей этого списка.[0078] The union "or" refers to any one representative of a particular list, and also includes any combination of representatives of this list.

[0079] Формы единственного числа включают ссылки на формы множественного числа, если контекст явно не указывает иное. Например, термины «белок» или «по меньшей мере один белок» могут включать множество белков, в том числе их смеси.[0079] Singular forms include references to plural forms unless the context clearly indicates otherwise. For example, the terms "protein" or "at least one protein" can include many proteins, including mixtures thereof.

[0080] Статистически значимое означает р≤0,05.[0080] Statistically significant means p≤0.05.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

I. ОбзорI. Overview

[0081] В данном документе раскрыты клетки животных, отличных от человека, и животные, отличные от человека, содержащие гуманизированный локус Asgr1, и способы применения таких клеток животных, отличных от человека, и животных, отличных от человека. Клетки животных, отличных от человека, или животные, отличные от человека, содержащие гуманизированный локус Asgr1, экспрессируют белок ASGR1 человека или химерный белок Asgr1, содержащий один или более фрагментов белка ASGR1 человека (например, весь внеклеточный домен ASGR1 человека или его часть). В качестве высокоэффективного специфического для печени рецептора эндоцитоза ASGR1 человека может быть использован для специфической для печени доставки терапевтических средств, таких как антитела, малые молекулы (в качестве части конъюгатов антитело-лекарственное средство) и ДНК. Однако антигенсвязывающие белки или биспецифические антигенсвязывающие белки, которые специфически связывают ASGR1 человека, зачастую не будут связываться с ортологичными белками Asgr1 животного, отличного от человека, такими как Asgr1 мыши, из-за различий между последовательностями ASGR1 человека и Asgr1 животного, отличного от человека. Например, антитела, полученные к внеклеточному домену ASGR1 человека, не связываются с ортологом Asgr1 мыши (данные не показаны). По этой причине эффективность in vivo механизмов доставки, опосредованной ASGR1 человека, или терапевтических механизмов невозможно эффективно оценить у животных, отличных от человека, с немодифицированными эндогенными (т.е. нативными) локусами Asgr1. Гуманизированные по Asgr1 животные, отличные от человека, (например, мыши с гуманизированным Asgr1) можно использовать для валидации специфической для печени доставки различных терапевтических средств посредством интернализации, опосредованной ASGR1 человека, с использованием ряда различных подходов. Например, животные, отличные от человека, содержащие гуманизированный локус Asgr1, могут быть использованы для оценки in vivo эффективности опосредованной ASGR1 человека доставки терапевтических молекул или терапевтических комплексов в печень. Аналогично животные, отличные от человека, содержащие гуманизированный локус Asgr1, могут быть использованы для оценки эффективности терапевтических молекул или терапевтических комплексов, действующих посредством механизмов, опосредованных ASGR1 человека.[0081] Disclosed herein are non-human and non-human animal cells containing a humanized Asgr1 locus and methods of using such non-human and non-human animal cells. Non-human or non-human animal cells containing a humanized Asgr1 locus express a human ASGR1 protein or a chimeric Asgr1 protein containing one or more human ASGR1 protein fragments (e.g., all or part of the human ASGR1 extracellular domain). As a highly efficient liver-specific endocytosis receptor, human ASGR1 can be used for liver-specific delivery of therapeutic agents such as antibodies, small molecules (as part of antibody-drug conjugates), and DNA. However, antigen-binding proteins or bispecific antigen-binding proteins that specifically bind human ASGR1 will often not bind to orthologous non-human Asgr1 proteins, such as mouse Asgr1, due to sequence differences between human ASGR1 and non-human Asgr1. For example, antibodies raised against the extracellular domain of human ASGR1 do not bind to the mouse Asgr1 orthologue (data not shown). For this reason, the effectiveness of in vivo human ASGR1-mediated delivery mechanisms or therapeutic mechanisms cannot be effectively assessed in non-human animals with unmodified endogenous (ie, native) Asgr1 loci. Asgr1 humanized non-human animals (eg, Asgr1 humanized mice) can be used to validate liver-specific delivery of various therapeutic agents through human ASGR1-mediated internalization using a number of different approaches. For example, non-human animals containing a humanized Asgr1 locus can be used to assess the in vivo efficacy of human ASGR1 mediated delivery of therapeutic molecules or therapeutic complexes to the liver. Similarly, non-human animals containing a humanized Asgr1 locus can be used to evaluate the efficacy of therapeutic molecules or therapeutic complexes acting through mechanisms mediated by human ASGR1.

II. Животные, отличные от человека, содержащие гуманизированный локус Asgr1II. Non-human animals containing a humanized Asgr1 locus

[0082] Клетки и животные, отличные от человека, раскрытые в данном документе, содержат гуманизированный локус Asgr1. Клетки или животные, отличные от человека, содержащие гуманизированный локус Asgr1, экспрессируют белок ASGR1 человека или частично гуманизированный химерный белок Asgr1, в котором один или более фрагментов нативного белка Asgr1 были заменены соответствующими фрагментами из ASGR1 человека (например, весь внеклеточный домен или его часть).[0082] Non-human cells and animals disclosed herein contain the humanized Asgr1 locus. Non-human cells or animals containing a humanized Asgr1 locus express a human ASGR1 protein or a partially humanized Asgr1 chimeric protein in which one or more fragments of the native Asgr1 protein have been replaced with corresponding fragments from human ASGR1 (e.g., all or part of the extracellular domain) .

А. Асиалогликопротеиновый рецептор 1 (ASGR1)A. Asialoglycoprotein receptor 1 (ASGR1)

[0083] Клетки и животные, отличные от человека, описанные в данном документе, содержат гуманизированный локус Asgr1. Асиалогликопротеиновый рецептор 1 (представитель H1 семейства 4 белков с лектиновым доменом С-типа, печеночный лектин H1, HL-1, ASGP-R 1, ASGPR 1, ASGR1) кодируется геном ASGR1 (CLEC4H1) и является основной субъединицей асиалогликопротеинового рецептора (ASGPR или ASGR). ASGPR представляет собой гетероолигомерный белок, экспрессируемый в основном на клеточной поверхности гепатоцитов, с примерно 1-5×105 сайтов связывания/клетка, который играет важную роль в интернализации и расщеплении десиалилированных гликопротеинов с удалением их из кровотока. ASGPR представляет собой хорошо изученный печеночный лектин С-типа, экспрессирующийся главным образом на синусоидальной поверхности гепатоцитов. ASGPR является ответственным за селективное связывание и интернализацию гликопротеинов с концевыми остатками галактозы или N-ацетилгалактозамина клетками паренхимы печени посредством рецептор-опосредованного эндоцитоза. Он содержит два белка, асиалогликопротеиновые рецепторы 1 и 2 (ASGR1 и ASGR2), кодируемые генами ASGR1 и ASGR2. Обе субъединицы представляют собой однопроходные белки типа II, которые обычно содержат N-концевой цитоплазматический домен, один трансмембранный домен и С-концевой внеклеточный домен распознавания углеводов (CRD). ASGR1 содержит N-концевой цитоплазматический домен (~40 аминокислот), однопроходный трансмембранный домен (~20 аминокислот), внеклеточный суперспиральный стволовой участок (олигомеризация) (~80 аминокислот) и функциональный домен распознавания углеводов С-типа (кальций-зависимый) (лектиновые домены С-типа) (*-140 аминокислот). CRD связывается с гликопротеинами с концевыми галактозными или N-ацетилгалактозаминовыми (GalNac) мотивами. CRD характеризуется низкой аффинностью к десиалилированным гликопротеинам в мономерном состоянии.[0083] The non-human cells and animals described herein contain the humanized Asgr1 locus. Asialoglycoprotein receptor 1 (a member of the H1 family of 4 proteins with a C-type lectin domain, liver lectin H1, HL-1, ASGP-R 1, ASGPR 1, ASGR1) is encoded by the ASGR1 gene (CLEC4H1) and is the main subunit of the asialoglycoprotein receptor (ASGPR or ASGR ). ASGPR is a heterooligomeric protein expressed primarily on the cell surface of hepatocytes, with approximately 1-5×10 5 binding sites/cell, which plays an important role in the internalization and cleavage of desialylated glycoproteins and their removal from the circulation. ASGPR is a well-studied C-type hepatic lectin expressed primarily on the sinusoidal surface of hepatocytes. ASGPR is responsible for the selective binding and internalization of glycoproteins to terminal galactose or N-acetylgalactosamine residues by liver parenchymal cells via receptor-mediated endocytosis. It contains two proteins, asialoglycoprotein receptors 1 and 2 (ASGR1 and ASGR2), encoded by the ASGR1 and ASGR2 genes. Both subunits are single pass type II proteins that typically contain an N-terminal cytoplasmic domain, one transmembrane domain, and a C-terminal extracellular carbohydrate recognition domain (CRD). ASGR1 contains an N-terminal cytoplasmic domain (~40 amino acids), a single-pass transmembrane domain (~20 amino acids), an extracellular supercoiled stem region (oligomerization) (~80 amino acids), and a functional C-type carbohydrate recognition domain (calcium-dependent) (lectin domains C-type) (*-140 amino acids). CRD binds to glycoproteins with terminal galactose or N-acetylgalactosamine (GalNac) motifs. CRD is characterized by low affinity for desialylated glycoproteins in the monomeric state.

[0084] Гены, кодирующие ASGR1 и ASGR2 (ASGR1 и ASGR2 соответственно), расположены на коротком плече хромосомы 17 на расстоянии примерно 58,6 тысяч оснований (т.о.) друг от друга. Гены характеризуются эволюционным родством, но существенно различаются по своей структурной организации: ASGR1 содержит 8 экзонов и имеет длину приблизительно 6 т.о., a ASGR2 содержит 9 экзонов и имеет длину приблизительно 13,5 т.о.[0084] The genes encoding ASGR1 and ASGR2 (ASGR1 and ASGR2, respectively) are located on the short arm of chromosome 17 at a distance of approximately 58.6 kb (i.e.) from each other. The genes are evolutionarily related, but differ significantly in their structural organization: ASGR1 contains 8 exons and is approximately 6 kb long, and ASGR2 contains 9 exons and is approximately 13.5 kb long.

[0085] Иллюстративной кодирующей последовательности для ASGR1 человека присвоен номер доступа NM_001671 (SEQ ID NO: 5) в NCBI. Иллюстративной кодирующей последовательности для Asgr1 мыши присвоен номер доступа NM_009714 (SEQ ID NO: 4) в NCBI. Иллюстративному белку ASGR1 человека присвоен номер доступа Р07306 (SEQ ID NO: 1) в UniProt. Иллюстративному белку Asgr1 мыши присвоен номер доступа Р34927 (SEQ ID NO: 2) в UniProt. Иллюстративный белок Asgr1 мыши с гуманизированными суперспиральным доменом и лектиновым доменом С-типа изложен под SEQ ID NO: 3. Иллюстративному белку Asgr1 крысы присвоен номер доступа: Р02706 в UniProt. Иллюстративному белку Asgr1 орангутана присвоен номер доступа Q5RBQ8 в UniProt.[0085] An exemplary coding sequence for human ASGR1 has been assigned accession number NM_001671 (SEQ ID NO: 5) by the NCBI. An exemplary coding sequence for mouse Asgr1 has been assigned accession number NM_009714 (SEQ ID NO: 4) at NCBI. An exemplary human ASGR1 protein has been assigned UniProt accession number P07306 (SEQ ID NO: 1). An exemplary mouse Asgr1 protein has been assigned UniProt accession number P34927 (SEQ ID NO: 2). An exemplary mouse Asgr1 protein with a humanized supercoil domain and a C-type lectin domain is set forth under SEQ ID NO: 3. An exemplary rat Asgr1 protein has been assigned accession number: P02706 in UniProt. An exemplary orangutan Asgr1 protein has been assigned UniProt accession number Q5RBQ8.

В. Гуманизированные локусы Asgr1B. Humanized Asgr1 loci

[0086] Гуманизированный локус Asgr1 может представлять собой локус Asgr1, в котором весь ген Asgr1 заменен соответствующей ортологичной последовательностью ASGR1 человека, или он может представлять собой локус Asgr1, в котором только часть гена Asgr1 заменена соответствующей ортологичной последовательностью ASGR1 человека, (т.е. гуманизирован). Необязательно соответствующую ортологичную последовательность ASGR1 человека подвергают модификации с целью оптимизации кодонов на основе частоты использования кодонов у животных, отличных от человека. Замененные (т.е. гуманизированные) участки могут включать кодирующие участки, такие как экзон, некодирующие участки, такие как интрон, нетранслируемый участок или регуляторный участок (например, промотор, энхансер или элемент, связывающий транскрипционный репрессор) или любую их комбинацию. В качестве одного примера экзоны, соответствующие 1, 2, 3, 4, 5, 6, 7 или всем 8 экзонам гена ASGR1 человека, могут быть гуманизированы. Например, экзоны, соответствующие экзонам 3-8 гена ASGR1 человека, могут быть гуманизированы. Альтернативно участок Asgr1, кодирующий эпитоп, распознаваемый антигенсвязывающим белком, представляющим собой антитело к ASGR1 человека, может быть гуманизирован. В качестве другого примера один или более или все домены, включающие N-концевой цитоплазматический домен, трансмембранный домен, суперспиральный домен или лектиновый домен С-типа, могут быть гуманизированы. Например, весь участок локуса Asgr1 или его часть, кодирующего суперспиральный домен, могут быть гуманизированы, весь участок локуса Asgr1 или его часть, кодирующего лектиновый домен С-типа, могут быть гуманизированы, весь участок локуса Asgr1 или его часть, кодирующего трансмембранный домен, могут быть гуманизированы, и/или весь участок локуса Asgr1 или его часть, кодирующего цитоплазматический домен, могут быть гуманизированы. В одном примере только весь участок локуса Asgr1 или его часть, кодирующего суперспиральный домен, гуманизированы, только весь участок локуса Asgr1 или его часть, кодирующего лектиновый домен С-типа, гуманизированы, или только весь участок локуса Asgr1 или его часть, кодирующего внеклеточный участок (т.е. суперспиральный домен и лектиновый домен С-типа). Например, участки локуса Asgr1, кодирующего суперспиральный домен и лектиновый домен С-типа, могут быть гуманизированы таким образом, что химерный белок Asgr1 будет продуцироваться с эндогенным N-концевым цитоплазматическим доменом, эндогенным трансмембранным доменом, гуманизированным суперспиральным доменом и гуманизированным лектиновым доменом С-типа. Аналогичным образом интроны, соответствующие 1, 2, 3, 4, 5, 6 или всем 7 интронам гена ASGR1 человека, могут быть гуманизированы. Фланкирующие нетранслируемые участки, в том числе регуляторные последовательности, также могут быть гуманизированы. Например, 5'-нетранслируемый участок (UTR), 3'-UTR или и 5'-UTR, и 3'-UTR могут быть гуманизированы, или 5'-UTR, 3'-UTR или и 5'-UTR, и 3-'UTR могут оставаться эндогенными. В одном конкретном примере 3-'UTR гуманизирован, но 5'-UTR остается эндогенным. В зависимости от степени замены ортологичными последовательностями регуляторные последовательности, такие как промотор, могут быть эндогенными или обеспечены замещающей ортологичной последовательностью человека. Например, гуманизированный локус Asgr1 может включать эндогенный промотор Asgr1 животного, отличного от человека.[0086] A humanized Asgr1 locus may be an Asgr1 locus in which the entire Asgr1 gene is replaced by a corresponding orthologous human ASGR1 sequence, or it may be an Asgr1 locus in which only a portion of the Asgr1 gene is replaced by a corresponding orthologous human ASGR1 sequence, (i.e. humanized). Optionally, the corresponding human ASGR1 orthologous sequence is modified to optimize codons based on codon usage in non-human animals. Replaced (ie, humanized) regions may include coding regions, such as an exon, non-coding regions, such as an intron, an untranslated region, or a regulatory region (eg, a promoter, enhancer, or transcriptional repressor binding element), or any combination thereof. As one example, exons corresponding to exons 1, 2, 3, 4, 5, 6, 7 or all 8 of the human ASGR1 gene can be humanized. For example, exons corresponding to exons 3-8 of the human ASGR1 gene can be humanized. Alternatively, the Asgr1 region encoding the epitope recognized by the antigen-binding protein, which is an antibody to human ASGR1, can be humanized. As another example, one or more or all of the domains, including an N-terminal cytoplasmic domain, a transmembrane domain, a supercoiled domain, or a C-type lectin domain, can be humanized. For example, all or part of the Asgr1 locus encoding a supercoiled domain can be humanized, all or part of the Asgr1 locus encoding a C-type lectin domain can be humanized, all or part of the Asgr1 locus encoding a transmembrane domain can be humanized. be humanized, and/or all or part of the Asgr1 locus encoding the cytoplasmic domain can be humanized. In one example, only all or part of the Asgr1 locus encoding the supercoil domain is humanized, only all or part of the Asgr1 locus encoding the C-type lectin domain is humanized, or only all or part of the Asgr1 locus encoding the extracellular region ( i.e. supercoiled domain and C-type lectin domain). For example, regions of the Asgr1 locus encoding a supercoiled domain and a C-type lectin domain can be humanized such that the Asgr1 chimeric protein is produced with an endogenous N-terminal cytoplasmic domain, an endogenous transmembrane domain, a humanized supercoiled domain, and a humanized C-type lectin domain. . Similarly, introns corresponding to introns 1, 2, 3, 4, 5, 6 or all 7 of the human ASGR1 gene can be humanized. Flanking non-translated regions, including regulatory sequences, can also be humanized. For example, the 5'-UTR, 3'-UTR or both 5'-UTR and 3'-UTR can be humanized, or 5'-UTR, 3'-UTR or both 5'-UTR and 3 -'UTRs may remain endogenous. In one specific example, the 3-'UTR is humanized, but the 5'-UTR remains endogenous. Depending on the degree of replacement by orthologous sequences, regulatory sequences such as a promoter may be endogenous or provided by a replacement human orthologous sequence. For example, a humanized Asgr1 locus may include the endogenous Asgr1 promoter of a non-human animal.

[0087] Белок Asgr1, кодируемый гуманизированным локусом Asgr1, может содержать один или более доменов, происходящих из белка ASGR1 человека. Например, белок Asgr1 может содержать один или более доменов, включающих суперспиральный домен ASGR1 человека, лектиновый домен С-типа ASGR1 человека, трансмембранный домен ASGR1 человека и цитоплазматический домен ASGR1 человека, или все их. В качестве одного примера белок Asgr1 может содержать только суперспиральный домен ASGR1 человека, только лектиновый домен С-типа ASGR1 человека или только внеклеточный домен ASGR1 человека (т.е. суперспиральный домен и лектиновый домен С-типа). Необязательно белок Asgr1, кодируемый гуманизированным локусом Asgr1, также может содержать один или более доменов, происходящих из эндогенного (т.е. нативного) белка Asgr1 животного, отличного от человека. В качестве одного примера белок Asgr1, кодируемый гуманизированным локусом Asgr1, может содержать суперспиральный домен из белка ASGR1 человека, лектиновый домен С-типа из белка ASGR1 человека, N-концевой цитоплазматический домен из эндогенного (т.е. нативного) белка Asgr1 животного, отличного от человека, и трансмембранный домен из эндогенного (т.е. нативного) белка Asgr1 животного, отличного от человека. Домены из белка ASGR1 человека могут кодироваться полностью гуманизированной последовательностью (т.е. вся последовательность, кодирующая этот домен, заменена ортологичной последовательностью ASGR1 человека), или могут кодироваться частично гуманизированной последовательностью (т.е. некоторые последовательности, кодирующие домен, заменены ортологичной последовательностью ASGR1 человека, а оставшаяся эндогенная (т.е. нативная) последовательность, кодирующая этот домен, кодирует те же аминокислоты, что и ортологичная последовательность ASGR1 человека, таким образом, что кодируемый домен идентичен этому домену в белке ASGR1 человека).[0087] The Asgr1 protein encoded by the humanized Asgr1 locus may contain one or more domains derived from the human ASGR1 protein. For example, the Asgr1 protein may comprise one or more domains including the human ASGR1 supercoil domain, the human ASGR1 C-type lectin domain, the human ASGR1 transmembrane domain, and the human ASGR1 cytoplasmic domain, or all of them. As one example, an Asgr1 protein may contain only the human ASGR1 supercoiled domain, only the human ASGR1 C-type lectin domain, or only the human ASGR1 extracellular domain (ie, the supercoiled domain and the C-type lectin domain). Optionally, the Asgr1 protein encoded by the humanized Asgr1 locus may also contain one or more domains derived from endogenous (ie, native) Asgr1 protein of a non-human animal. As one example, the Asgr1 protein encoded by the humanized Asgr1 locus may comprise a supercoiled domain from the human ASGR1 protein, a C-type lectin domain from the human ASGR1 protein, an N-terminal cytoplasmic domain from the endogenous (i.e., native) Asgr1 protein of an animal other than from a human, and a transmembrane domain from the endogenous (ie, native) Asgr1 protein of a non-human animal. Domains from the human ASGR1 protein may be encoded by a fully humanized sequence (i.e., the entire sequence encoding that domain is replaced by an orthologous human ASGR1 sequence), or may be encoded by a partially humanized sequence (i.e., some of the domain-coding sequences are replaced by an orthologous ASGR1 sequence). human, and the remaining endogenous (i.e., native) sequence encoding this domain encodes the same amino acids as the orthologous sequence of human ASGR1, such that the encoded domain is identical to this domain in the human ASGR1 protein).

[0088] В качестве одного примера белок Asgr1, кодируемый гуманизированным локусом Asgr1, может содержать суперспиральный домен ASGR1 человека. Необязательно суперспиральный домен ASGR1 человека содержит, состоит по сути из или состоит из последовательности, которая на по меньшей мере 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности под SEQ ID NO: 27, и при этом белок Asgr1 сохраняет активность нативного Asgr1 (т.е. сохраняет способность к избирательному связыванию и интернализации гликопротеинов с концевыми остатками галактозы или N-ацетилгалактозамина посредством рецептор-опосредованного эндоцитоза). В качестве другого примера белок Asgr1, кодируемый гуманизированным локусом Asgr1, может содержать лектиновый домен С-типа из ASGR1 человека. Необязательно лектиновый домен С-типа из ASGR1 человека содержит, состоит по сути из или состоит из последовательности, которая на по меньшей мере 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности под SEQ ID NO: 28, и при этом белок Asgr1 сохраняет активность нативного Asgr1. Например, участок белка Asgr1, который получен из ASGR1 человека, может содержать, состоять по сути из или состоять из последовательности, которая на по меньшей мере 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности под SEQ ID NO: 31, и при этом белок Asgr1 сохраняет активность нативного Asgr1. В качестве другого примера белок Asgr1, кодируемый гуманизированным локусом Asgr1, может содержать эндогенный цитоплазматический домен Asgr1 животного, отличного от человека (например, цитоплазматический домен Asgr1 мыши). Необязательно цитоплазматический домен Asgr1 животного, отличного от человека, содержит, состоит по сути из или состоит из последовательности, которая на по меньшей мере 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности под SEQ ID NO: 29, и при этом белок Asgr1 сохраняет активность нативного Asgr1. В качестве другого примера белок Asgr1, кодируемый гуманизированным локусом Asgr1, может содержать эндогенный трансмембранный домен Asgr1 животного, отличного от человека (например, трансмембранный домен Asgr1 мыши). Необязательно трансмембранный домен Asgr1 животного, отличного от человека, состоит по сути из или состоит из последовательности, которая на по меньшей мере 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности под SEQ ID NO: 30, и при этом белок Asgr1 сохраняет активность нативного Asgr1. Например, белок Asgr1, кодируемый гуманизированным локусом Asgr1, может содержать, состоять по сути из или состоять из последовательности, которая на по меньшей мере 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности под SEQ ID NO: 3, и при белок Asgr1 сохраняет активность нативного Asgr1.[0088] As one example, the Asgr1 protein encoded by the humanized Asgr1 locus may contain the human ASGR1 supercoil domain. Optionally, the human ASGR1 supercoil domain contains, consists essentially of, or consists of a sequence that is at least 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence under SEQ ID NO : 27, while the Asgr1 protein retains the activity of native Asgr1 (i.e. retains the ability to selectively bind and internalize glycoproteins to terminal galactose or N-acetylgalactosamine residues via receptor-mediated endocytosis). As another example, the Asgr1 protein encoded by the humanized Asgr1 locus may contain a C-type lectin domain from human ASGR1. Optionally, the C-type lectin domain of human ASGR1 contains, consists essentially of, or consists of a sequence that is at least 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence under SEQ ID NO: 28, while the Asgr1 protein retains the activity of native Asgr1. For example, a portion of the Asgr1 protein that is derived from human ASGR1 may contain, consist essentially of, or consist of a sequence that is at least 85%, 90%, 95%, 96%, 97%, 98%, 99% or 100% identical to the sequence under SEQ ID NO: 31, while the Asgr1 protein retains the activity of native Asgr1. As another example, the Asgr1 protein encoded by the humanized Asgr1 locus may contain the endogenous Asgr1 cytoplasmic domain of a non-human animal (eg, mouse Asgr1 cytoplasmic domain). Optionally, the non-human Asgr1 cytoplasmic domain contains, consists essentially of, or consists of a sequence that is at least 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical sequence under SEQ ID NO: 29, and while the Asgr1 protein retains the activity of native Asgr1. As another example, the Asgr1 protein encoded by the humanized Asgr1 locus may contain an endogenous Asgr1 transmembrane domain of a non-human animal (eg, a mouse Asgr1 transmembrane domain). Optionally, the non-human Asgr1 transmembrane domain consists essentially of or consists of a sequence that is at least 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence under SEQ ID NO: 30, while the Asgr1 protein retains the activity of native Asgr1. For example, the Asgr1 protein encoded by the humanized Asgr1 locus may contain, consist essentially of, or consist of a sequence that is at least 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% is identical to the sequence under SEQ ID NO: 3, and when the Asgr1 protein retains the activity of native Asgr1.

[0089] Необязательно гуманизированный локус Asgr1 может содержать другие элементы. Примеры таких элементов могут включать кассеты с селектируемым маркером, репортерные гены, сайты распознавания рекомбиназ или другие элементы. Альтернативно в гуманизированном локусе Asgr1 могут отсутствовать другие элементы (например, может отсутствовать селектируемый маркер или кассета с селектируемым маркером). Примеры подходящих репортерных генов и репортерных белков раскрыты в другом месте данного документа. Примеры подходящих селектируемых маркеров включают неомицин-фосфотрансферазу (neor), гигромицин-В-фосфотрансферазу (hygr), пуромицин-N-ацетилтрансферазу (puror), бластицидин-S-дезаминазу (bsrr), ксантин/гуанин-фосфорибозилтрансферазу (gpt) и тимидинкиназу вируса простого герпеса (HSV-k). Примеры рекомбиназ включают рекомбиназы Cre, Flp и Dre. Одним примером гена рекомбиназы Cre является Crei, в котором два экзона, кодирующие рекомбиназу Cre, разделены интроном, чтобы предотвратить его экспрессию в прокариотической клетке. Такие рекомбиназы могут дополнительно содержать сигнал внутриядерной локализации для обеспечения локализации в ядре (например, NLS-Crei). Сайты распознавания рекомбиназы включают нуклеотидные последовательности, которые распознаются сайт-специфической рекомбиназой и могут служить в качестве субстрата для события рекомбинации. Примеры сайтов распознавания рекомбиназ включают FRT, FRT11, FRT71, сайты attp, art, rox и lox, такие как loxP, lox511, lox2272, lox66, lox71, loxM2 и lox5171.[0089] Optionally, the humanized Asgr1 locus may contain other elements. Examples of such elements may include selectable marker cassettes, reporter genes, recombinase recognition sites, or other elements. Alternatively, other elements may be absent from the humanized Asgr1 locus (eg, a selectable marker or selectable marker cassette may be missing). Examples of suitable reporter genes and reporter proteins are disclosed elsewhere in this document. Examples of suitable selectable markers include neomycin phosphotransferase (neo r ), hygromycin B-phosphotransferase (hyg r ), puromycin N-acetyltransferase (puro r ), blasticidin S-deaminase (bsr r ), xanthine/guanine phosphoribosyltransferase (gpt ) and herpes simplex virus thymidine kinase (HSV-k). Examples of recombinases include Cre, Flp and Dre recombinases. One example of a Cre recombinase gene is Crei, in which two exons encoding Cre recombinase are separated by an intron to prevent its expression in a prokaryotic cell. Such recombinases may additionally contain an intranuclear localization signal to provide nuclear localization (eg, NLS-Crei). Recombinase recognition sites include nucleotide sequences that are recognized by a site-specific recombinase and can serve as a substrate for a recombination event. Examples of recombinase recognition sites include FRT, FRT11, FRT71, attp, art, rox and lox sites such as loxP, lox511, lox2272, lox66, lox71, loxM2 and lox5171.

[0090] Другие элементы, такие как репортерные гены или кассеты с селектируемым маркером, могут представлять собой самоудаляющиеся кассеты, фланкированные сайтами распознавания рекомбиназ. См., например, US 8697851 и US 2013/0312129, каждый из которых включен в данный документ посредством ссылки во всей своей полноте для всех целей. В качестве примера самоудаляющаяся кассета может содержать ген Crei (содержит два экзона, кодирующих рекомбиназу Cre, которые разделены интроном), функционально связанный с промотором Prm1 мыши, и ген устойчивости к неомицину, функционально связанный с промотором убиквитина человека. При использовании промотора Prm1, самоудаляющаяся кассета может быть специфически удалена в мужских половых клетках зародышевой линии животных F0. Полинуклеотид, кодирующий селектируемый маркер, может быть функционально связан с активным промотором в клетке-мишени. Примеры промоторов описаны в другом месте данного документа. В качестве другого конкретного примера самоудаляющаяся кассета с селектируемым маркером может содержать последовательность, кодирующую ген устойчивости к гигромицину, функционально связанную с одним или более промоторами (например, и с промотором убиквитина человека, и с промоторами ЕМ7), после которых следует сигнал полиаденилирования, после которого следует кодирующая Crei последовательность, функционально связанная с одним или более промоторами (например, с промотором mPrm1), после которого следует другой сигнал полиаденилирования, где вся кассета фланкирована сайтами loxP.[0090] Other elements, such as reporter genes or selectable marker cassettes, may be self-removing cassettes flanked by recombinase recognition sites. See, for example, US 8697851 and US 2013/0312129, each of which is incorporated herein by reference in its entirety for all purposes. As an example, a self-removing cassette may contain the Crei gene (contains two exons encoding Cre recombinase separated by an intron) operably linked to the mouse Prm1 promoter and a neomycin resistance gene operably linked to the human ubiquitin promoter. By using the Prm1 promoter, the self-removing cassette can be specifically removed in male germline F0 animal germline. A polynucleotide encoding a selectable marker may be operably linked to an active promoter in the target cell. Examples of promoters are described elsewhere in this document. As another specific example, a self-removing selectable marker cassette may contain a sequence encoding a hygromycin resistance gene operably linked to one or more promoters (e.g., both the human ubiquitin promoter and the EM7 promoters), followed by a polyadenylation signal, followed by followed by a Crei coding sequence operably linked to one or more promoters (eg, the mPrm1 promoter), followed by another polyadenylation signal where the entire cassette is flanked by loxP sites.

[0091] Гуманизированный локус Asgr1 также может представлять собой условный аллель. Например, условный аллель может представлять собой многофункциональный аллель, описанный в US 2011/0104799, включенном в данный документ посредством ссылки во всей своей полноте для всех целей. Например, условный аллель может содержать: (а) инициирующую последовательность в смысловой ориентации относительно транскрипции гена-мишени; (b) кассету с селектируемым геном устойчивости к лекарственному средству (DSC) в смысловой или антисмысловой ориентации; (с) представляющую интерес нуклеотидную последовательность (NSI) в антисмысловой ориентации; и (d) модуль обусловленный инверсией (COIN, который использует экзон-разделяющий интрон и инвертируемый подобный «генной ловушке» модуль) в обратной ориентации. См., например, US 2011/0104799. Условный аллель может дополнительно содержать рекомбинируемые единицы, которые рекомбинируют при воздействии первой рекомбиназы с образованием условного аллеля, который (i) не имеет инициирующей последовательности и DSC; и (ii) содержит NSI в смысловой ориентации и COIN в антисмысловой ориентации. См., например, US 2011/0104799.[0091] The humanized Asgr1 locus can also be a conditional allele. For example, the conditional allele may be the multifunctional allele described in US 2011/0104799, incorporated herein by reference in its entirety for all purposes. For example, a conditional allele may contain: (a) an initiator sequence in sense orientation relative to transcription of the target gene; (b) a selectable drug resistance (DSC) gene cassette in sense or antisense orientation; (c) the nucleotide sequence of interest (NSI) in antisense orientation; and (d) an inversion driven module (COIN, which uses an exon-separating intron and an inverted "gene trap"-like module) in reverse orientation. See, for example, US 2011/0104799. The conditional allele may further comprise recombinable units that recombine when exposed to the first recombinase to form a conditional allele that (i) lacks an initiator sequence and DSC; and (ii) contains NSI in sense orientation and COIN in antisense orientation. See, for example, US 2011/0104799.

[0092] Один иллюстративный гуманизированный локус Asgr1 (например, гуманизированный локус Asgr1 мыши) представляет собой локус, в котором кодирующие экзоны 3 8 заменены соответствующей последовательностью человека. Данные экзоны кодируют суперспиральный домен и лектиновый домен С-типа Asgr1. Необязательно гуманизированная последовательность может проходить через стоп-кодон и 3-'UTR и, необязательно, в последовательность, расположенную непосредственно ниже 3'-UTR. Необязательно часть интрона, расположенного выше кодирующего экзона 3, также гуманизирована. См. фигуры 2А и 2В и SEQ ID NO: 21 и 24.[0092] One exemplary humanized Asgr1 locus (eg, the mouse humanized Asgr1 locus) is a locus in which coding exons 3-8 have been replaced with the corresponding human sequence. These exons encode the supercoiled domain and the C-type lectin domain of Asgr1. Optionally, the humanized sequence may pass through the stop codon and the 3'UTR, and optionally into the sequence immediately below the 3'UTR. Optionally, the portion of the intron upstream of coding exon 3 is also humanized. See figures 2A and 2B and SEQ ID NOs: 21 and 24.

С. Клетки, отличные от человеческих, и животные, отличные от человека, содержащие гуманизированный локус Asgr1C. Non-human cells and non-human animals containing the humanized Asgr1 locus

[0093] Представлены клетки животных, отличных от человека, и животные, отличные от человека, содержащие гуманизированный локус Asgr1, описанный в другом месте данного документа. Клетки или животные, отличные от человека, могут быть гетерозиготными или гомозиготными по гуманизированному локусу Asgr1. Диплоидный организм имеет два аллеля в каждом генетическом локусе. Каждая пара аллелей представляет генотип определенного генетического локуса. Генотипы описаны как гомозиготные, если в конкретном локусе содержатся два идентичных аллеля, и как гетерозиготные, если эти два аллеля различаются.[0093] Non-human and non-human animal cells containing the humanized Asgr1 locus described elsewhere herein are provided. Non-human cells or animals may be heterozygous or homozygous for the humanized Asgr1 locus. A diploid organism has two alleles at each genetic locus. Each pair of alleles represents the genotype of a specific genetic locus. Genotypes are described as homozygous if a particular locus contains two identical alleles, and as heterozygous if the two alleles are different.

[0094] Клетки животных, отличных от человека, представленные в данном документе, могут представлять собой, например, любую клетку, отличную от человеческой, содержащую локус Asgr1 или геномный локус, гомологичный или ортологичный локусу ASGR1 человека. Клетки могут представлять собой эукариотические клетки, которые включают, например, клетки грибов (например, дрожжи), клетки растений, клетки животных, клетки млекопитающих, клетки млекопитающих, отличных от человека, и клетки человека. Термин «животное» включает млекопитающих, рыб и птиц. Клеткой млекопитающего представляет собой, например, клетку млекопитающего, отличного от человека, клетку грызуна, клетку крысы, клетку мыши или клетку хомяка. Другие млекопитающие, отличные от человека, включают, например, приматов, отличных от человека, нечеловекообразных обезьян, человекообразных обезьян, орангутанов, кошек, собак, кроликов, лошадей, быков, оленей, бизонов, домашний скот (например, виды крупного рогатого скота, такие как коровы, быки и т.д.; виды полорогих, такие как овцы, козы и т.д.; и виды свиней, такие как свиньи и кабаны). Птицы включают, например, кур, индеек, страусов, гусей, уток и т.д. Также включены домашние животные и сельскохозяйственные животные. Термин «отличный от человека» исключает людей.[0094] Non-human animal cells provided herein can be, for example, any non-human cell containing the Asgr1 locus or a genomic locus homologous or orthologous to the human ASGR1 locus. The cells may be eukaryotic cells, which include, for example, fungal (eg, yeast), plant cells, animal cells, mammalian cells, non-human mammalian cells, and human cells. The term "animal" includes mammals, fish and birds. The mammalian cell is, for example, a non-human mammalian cell, a rodent cell, a rat cell, a mouse cell, or a hamster cell. Other non-human mammals include, for example, non-human primates, non-human apes, great apes, orangutans, cats, dogs, rabbits, horses, bulls, deer, bison, livestock (e.g., bovine species such as such as cows, bulls, etc., bovid species such as sheep, goats, etc., and pig species such as pigs and wild boars). Birds include, for example, chickens, turkeys, ostriches, geese, ducks, and so on. Also included are pets and farm animals. The term "other than human" excludes humans.

[0095] Клетки также могут быть любого типа в недифференцированном или дифференцированном состоянии. Например, клетка может представлять собой тотипотентную клетку, плюрипотентную клетку (например, плюрипотентную клетку человека или плюрипотентную клетку, отличную от человеческой, такую как эмбрионального стволовую (ES) клетку мыши или ES-клетку крысы), или не являющуюся плюрипотентной клетку. Тотипотентные клетки включают недифференцированные клетки, которые могут давать начало клеткам любого типа, а плюрипотентные клетки включают недифференцированные клетки, которые обладают способностью развиваться в более чем один тип дифференцированных клеток. Такими плюрипотентными и/или тотипотентными клетками могут быть, например, ES-клетки или ES-подобные клетки, такие как индуцированные плюрипотентные стволовые (iPS) клетки. ES-клетки включают тотипотентные или плюрипотентные клетки эмбрионального происхождения, которые способны вносить вклад в любую ткань развивающегося эмбриона при введении в эмбрион. ES-клетки могут быть получены из внутренней клеточной массы бластоцисты и способны дифференцироваться в клетки любого из трех зародышевых листков позвоночных (энтодермы, эктодермы и мезодермы).[0095] Cells can also be of any type in an undifferentiated or differentiated state. For example, the cell may be a totipotent cell, a pluripotent cell (eg, a human pluripotent cell or a non-human pluripotent cell such as a mouse embryonic stem (ES) cell or a rat ES cell), or a non-pluripotent cell. Totipotent cells include undifferentiated cells that can give rise to any type of cell, and pluripotent cells include undifferentiated cells that have the ability to develop into more than one type of differentiated cell. Such pluripotent and/or totipotent cells may be, for example, ES cells or ES-like cells such as induced pluripotent stem (iPS) cells. ES cells include totipotent or pluripotent cells of embryonic origin that are capable of contributing to any tissue in the developing embryo when introduced into the embryo. ES cells can be derived from the inner cell mass of the blastocyst and are capable of differentiating into cells from any of the three vertebrate germ layers (endoderm, ectoderm, and mesoderm).

[0096] Клетки, представленные в данном документе, также могут представлять собой клетки зародышевой линии (например, сперматозоиды или ооциты). Клетки могут представлять собой митотически компетентные клетки или митотически неактивные клетки, мейотически компетентные клетки или мейотически неактивные клетки. Аналогично клетки также могут представлять собой первичные соматические клетки или клетки, которые не являются первичными соматическими клетками. Соматические клетки включают любую клетку, которая не является гаметой, клеткой зародышевой линии, гаметоцитом или недифференцированной стволовой клеткой. Например, клетки могут представлять собой клетки печени, такие как гепатобласты или гепатоциты.[0096] The cells provided herein can also be germline cells (eg, spermatozoa or oocytes). The cells may be mitotically competent cells or mitotically inactive cells, meiotically competent cells or meiotically inactive cells. Similarly, the cells may also be primary somatic cells or cells that are not primary somatic cells. Somatic cells include any cell that is not a gamete, germline cell, gametocyte, or undifferentiated stem cell. For example, the cells may be liver cells such as hepatoblasts or hepatocytes.

[0097] Подходящие клетки, представленные в данном документе, также включают первичные клетки. Первичные клетки включают клетки или культуры клеток, которые были выделены непосредственно из организма, органа или ткани. Первичные клетки включают клетки, которые не являются ни трансформированными, ни иммортализованными. Они включают любую клетку, полученную из организма, органа или ткани, которую ранее не подвергали пассированию в культуре ткани или ранее подвергали пассированию в культуре ткани, но не способна бесконечно пассироваться в культуре ткани. Такие клетки могут быть выделены с помощью общепринятых методик и включают, например, гепатоциты.[0097] Suitable cells provided herein also include primary cells. Primary cells include cells or cell cultures that have been isolated directly from an organism, organ, or tissue. Primary cells include cells that are neither transformed nor immortalized. They include any cell derived from an organism, organ, or tissue that has not previously been passaged in tissue culture, or has previously been passaged in tissue culture, but is not capable of being passaged indefinitely in tissue culture. Such cells can be isolated using conventional techniques and include, for example, hepatocytes.

[0098] Другие подходящие клетки, представленные в данном документе, включают иммортализованные клетки. К иммортализованным клеткам относятся клетки многоклеточного организма, которые в обычных условиях не размножались бы бесконечно, но из-за мутации или изменения избежали нормального клеточного старения и вместо этого могут продолжать дальнейшее деление. Такие мутации или изменения могут происходить естественным путем или могут быть инициированы преднамеренно. Конкретным примером иммортализованной клеточной линии является клеточная линия рака печени человека HepG2. Хорошо известно множество типов иммортализованных клеток. Иммортализованные или первичные клетки включают клетки, которые обычно используются для культивирования или для экспрессии рекомбинантных генов или белков.[0098] Other suitable cells provided herein include immortalized cells. Immortalized cells are cells of a multicellular organism that would not normally reproduce indefinitely, but due to a mutation or change have escaped normal cellular aging and can instead continue to divide further. Such mutations or changes may occur naturally or may be deliberately initiated. A specific example of an immortalized cell line is the HepG2 human liver cancer cell line. Many types of immortalized cells are well known. Immortalized or primary cells include cells that are commonly used for culture or for the expression of recombinant genes or proteins.

[0099] Клетки, представленные в данном документе, также включают эмбрионы на стадии одной клетки (т.е. оплодотворенные ооциты или зиготы). Такие эмбрионы на стадии одной клетки могут быть получены из любого генетического фона (например, BALB/c, C57BL/6, 129 или их комбинации для мышей), могут быть свежими или замороженными, и могут быть получены в результате естественного разведения или оплодотворения in vitro.[0099] The cells provided herein also include embryos at the single cell stage (ie, fertilized oocytes or zygotes). Such single cell stage embryos can be obtained from any genetic background (e.g. BALB/c, C57BL/6, 129, or combinations thereof in mice), can be fresh or frozen, and can be obtained from natural breeding or in vitro fertilization. .

[00100] Клетки, представленные в данном документе, могут представлять собой нормальные, здоровые клетки или могут представлять собой пораженные заболеванием или содержащие мутации клетки.[00100] The cells provided herein may be normal, healthy cells, or may be diseased or mutated cells.

[00101] Животные, отличные от человека, содержащие гуманизированный локус Asgr1, описанный в данном документе, могут быть получены с помощью способов, описанных в другом месте данного документа. Термин «животное» включает млекопитающих, рыб и птиц. Млекопитающие, отличные от человека, включают, например, приматов, отличных от человека, нечеловекообразных обезьян, человекообразных обезьян, орангутанов, кошек, собак, лошадей, быков, оленей, бизонов, овец, кроликов, грызунов (например, мыши, крысы, хомяки и морские свинки) и домашний скот (например, виды крупного рогатого скота, такие как коровы и быки; виды полорогих, такие как овцы и козы; и виды свиней, такие как свиньи и кабаны). Птицы включают, например, кур, индеек, страусов, гусей и уток. Также включены домашние животные и сельскохозяйственные животные. Термин «животное, отличное от человека» исключает людей. Предпочтительные животные, отличные от человека, включают, например, грызунов, таких как мыши и крысы.[00101] Non-human animals containing the humanized Asgr1 locus described herein can be obtained using the methods described elsewhere in this document. The term "animal" includes mammals, fish and birds. Non-human mammals include, for example, non-human primates, non-human apes, great apes, orangutans, cats, dogs, horses, bulls, deer, bison, sheep, rabbits, rodents (e.g., mice, rats, hamsters, and guinea pigs) and livestock (e.g. cattle species such as cows and bulls; bovid species such as sheep and goats; and pig species such as pigs and wild boars). Birds include, for example, chickens, turkeys, ostriches, geese and ducks. Also included are pets and farm animals. The term "animal other than man" excludes humans. Preferred non-human animals include, for example, rodents such as mice and rats.

[00102] Животные, отличные от человека, могут быть получены из любого генетического фона. Например, подходящие мыши могут быть получены от линии 129, линии C57BL/6, помеси 129 и C57BL/6, линии BALB/c или линии Swiss Webster. Примеры линий 129 включают 129Р1, 129Р2, 129Р3, 129X1, 129S1 (например, 129S1/SV, 129Sl/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129Т1 и 129Т2. См., например, Festing et al. (1999) Mammalian Genome 10:836, включенную в данный документ посредством ссылки во всей своей полноте для всех целей. Примеры линий C57BL включают C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr и C57BL/Ola. Подходящие мыши также могут быть получены от помеси вышеупомянутой линии 129 и вышеупомянутой линии C57BL/6 (например, 50% 129 и 50% C57BL/6). Аналогичным образом подходящие мыши могут быть получены от помеси вышеупомянутых линий 129 или помеси вышеупомянутых линий BL/6 (например, линия 129S6 (129/SvEvTac)).[00102] Non-human animals can be derived from any genetic background. For example, suitable mice can be obtained from the 129 line, the C57BL/6 line, the 129 and C57BL/6 cross, the BALB/c line, or the Swiss Webster line. Examples of lines 129 include 129P1, 129P2, 129P3, 129X1, 129S1 (e.g., 129S1/SV, 129Sl/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 12 9S7, 129S8, 129T1 and 129T2. See, for example, Festing et al. (1999) Mammalian Genome 10:836, incorporated herein by reference in its entirety for all purposes. Examples of C57BL lineages include C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr and C57BL/ Ola. Suitable mice can also be obtained from a cross between the aforementioned 129 line and the aforementioned C57BL/6 line (eg 50% 129 and 50% C57BL/6). Similarly, suitable mice can be obtained from a cross between the aforementioned 129 lines or a cross between the aforementioned BL/6 lines (eg, the 129S6 (129/SvEvTac) line).

[00103] Аналогичным образом крысы могут быть получены от любой линии крыс, в том числе от, например, крыс линии ACI, крыс линии Dark Agouti (DA), крыс линии Wistar, крыс линии LEA, крыс линии Sprague Dawley (SD) или крыс линии Fischer, как, например, Fisher F344 или Fisher F6. Крысы также могут получены из линии, происходящей из помеси двух или более линий, перечисленных выше. Например, подходящая крыса может быть получена из линии DA или линии ACI. Крысы линии ACI характеризуется наличием окраски «черный агути» с белыми брюхом и конечностями и гаплотипом RT1av1. Такие линии доступны из множества источников, в том числе в Harlan Laboratories. Линия крыс Dark Agouti (DA) характеризуется наличием окраски «агути» и гаплотипом RT1av1. Такие крысы доступны из множества источников, в том числе в Charles River и Harlan Laboratories. Некоторые подходящие крысы могут быть получены от инбредных линий крыс. См., например, US 2014/0235933, включенный в данный документ посредством ссылки во всей своей полноте для всех целей.[00103] Similarly, rats can be obtained from any strain of rats, including, for example, ACI rats, Dark Agouti (DA) rats, Wistar rats, LEA rats, Sprague Dawley (SD) rats, or Fischer lines such as the Fisher F344 or Fisher F6. Rats can also be obtained from a line that is a cross between two or more of the lines listed above. For example, a suitable rat can be obtained from the DA line or the ACI line. Rats of the ACI line are characterized by the presence of the color "black agouti" with a white belly and limbs and haplotype RT1 av1 . Such lines are available from a variety of sources, including Harlan Laboratories. The Dark Agouti (DA) rat line is characterized by the presence of agouti coloration and the RT1 av1 haplotype. Such rats are available from a variety of sources, including Charles River and Harlan Laboratories. Some suitable rats can be obtained from inbred lines of rats. See, for example, US 2014/0235933, incorporated herein by reference in its entirety for all purposes.

III. Способы использования животных, отличных от человека, содержащих гуманизированный локус Asgr1, для оценки in vivo эффективности опосредованной ASGR1 человека доставки терапевтических комплексов в печень и терапевтических молекул, действующих через механизмы, опосредованные ASGR1 человекаIII. Methods for using non-human animals containing a humanized Asgr1 locus to assess the in vivo efficacy of human ASGR1 mediated delivery of therapeutic complexes to the liver and therapeutic molecules acting through human ASGR1 mediated mechanisms

[00104] Представлены различные способы использования животных, отличных от человека, содержащих гуманизированный локус Asgr1, описанный в другом месте данного документа, для оценки in vivo эффективности опосредованной ASGR1 человека доставки терапевтических молекул или комплексов в печень или опосредованных ASGR1 человека терапевтических механизмов. Поскольку животные, отличные от человека, содержат гуманизированный локус Asgr1, то животные, отличные от человека, будут более точно воспроизводить доставку, опосредованную ASGR1 человека, или опосредованные ASGR1 человека терапевтические механизмы, чем животные, отличные от человека, с негуманизированным локусом Asgr1. В качестве одного примера с помощью данных способов можно оценивать доставку терапевтического комплекса в печень посредством опосредованной ASGR1 человека интернализации in vivo, предусматривающую введение терапевтического комплекса животному, отличному от человека, содержащему гуманизированный локус Asgr1, где терапевтический комплекс содержит терапевтическую молекулу и антигенсвязывающий белок или лиганд, который специфически связывает ASGR1 человека, и затем оценку доставки терапевтической молекулы в печень животного, отличного от человека. В качестве другого примера с помощью данных способов можно оценивать in vivo эффективность терапевтических молекул или комплексов, предназначенных для воздействия посредством опосредованной ASGR1 человека интернализации, таких как терапевтические комплексы, сконструированные для интернализации поверхностного белка-мишени клеток печени посредством ASGR1 человека.[00104] Various methods are provided for using non-human animals containing the humanized Asgr1 locus described elsewhere in this document to assess the in vivo efficacy of human ASGR1-mediated delivery of therapeutic molecules or complexes to the liver or human ASGR1-mediated therapeutic mechanisms. Because non-human animals contain a humanized Asgr1 locus, non-human animals will more accurately mimic human ASGR1-mediated delivery or human ASGR1-mediated therapeutic mechanisms than non-human animals with a non-humanized Asgr1 locus. As one example, these methods can evaluate delivery of a therapeutic complex to the liver via human ASGR1-mediated internalization in vivo, which involves administering the therapeutic complex to a non-human animal containing a humanized Asgr1 locus, wherein the therapeutic complex comprises the therapeutic molecule and an antigen-binding protein or ligand, that specifically binds human ASGR1, and then assessing delivery of the therapeutic molecule to the liver of a non-human animal. As another example, these methods can evaluate the in vivo efficacy of therapeutic molecules or complexes intended to be mediated by human ASGR1 internalization, such as therapeutic complexes designed to internalize a liver cell surface protein by human ASGR1.

А. Способы оценки in vivo эффективности доставки терапевтических молекул в печень посредством интернализации, опосредованной ASGR1 человекаA. Methods for evaluating in vivo efficiency in delivering therapeutic molecules to the liver via human ASGR1-mediated internalization

[00105] Представлены различные способы использования животных, отличных от человека, содержащих гуманизированный локус Asgr1, описанный в другом месте данного документа, для оценки in vivo эффективности доставки терапевтических молекул в печень посредством интернализации, опосредованной ASGR1 человека. Например, такие способы могут предусматривать: (а) введение терапевтического комплекса животному, отличному от человека, содержащему гуманизированный локус Asgr1, где терапевтический комплекс содержит терапевтическую молекулу и антигенсвязывающий белок или лиганд, который специфически связывает ASGR1 человека; и (b) оценку доставки терапевтической молекулы в печень животного, отличного от человека.[00105] Various methods are provided for using non-human animals containing the humanized Asgr1 locus described elsewhere in this document to evaluate the in vivo efficiency of delivering therapeutic molecules to the liver via human ASGR1 mediated internalization. For example, such methods may include: (a) administering a therapeutic complex to a non-human animal comprising a humanized Asgr1 locus, wherein the therapeutic complex comprises a therapeutic molecule and an antigen-binding protein or ligand that specifically binds human ASGR1; and (b) evaluating delivery of the therapeutic molecule to the liver of a non-human animal.

[00106] Терапевтическая молекула может представлять собой любое биологическое или химическое средство, используемое в лечении или профилактике любого заболевания или нарушения. Например, терапевтическая молекула может представлять собой терапевтические нуклеиновые кислоты (например, направляющие РНК системы CRISPR/Cas, короткие шпилечные РНК (shRNA) или малые интерферирующие РНК (siRNA)) или нуклеиновые кислоты, кодирующие терапевтические белки (например, белки Cas, как, например, белки Cas9, заместительные ферменты, секретируемые терапевтические белки и т.д.). Альтернативно терапевтическая молекула может представлять собой терапевтический белок, терапевтическое антитело, или антигенсвязывающий белок, или любую другую терапевтическую большую молекулу или малую молекулу.[00106] A therapeutic molecule can be any biological or chemical agent used in the treatment or prevention of any disease or disorder. For example, the therapeutic molecule may be therapeutic nucleic acids (eg, CRISPR/Cas guide RNAs, short hairpin RNAs (shRNA) or small interfering RNAs (siRNA)) or nucleic acids encoding therapeutic proteins (eg, Cas proteins, such as , Cas9 proteins, replacement enzymes, secreted therapeutic proteins, etc.). Alternatively, the therapeutic molecule can be a therapeutic protein, a therapeutic antibody or antigen binding protein, or any other therapeutic large molecule or small molecule.

[00107] Терапевтическая молекула и антигенсвязывающий белок или лиганд ASGR1 человека могут образовывать комплексы друг с другом посредством любых способов. Например, терапевтическая молекула и антигенсвязывающий белок или лиганд ASGR1 человека могут быть соединены посредством прямой ковалентной конъюгации или могут быть соединены посредством линкера, такого как пептидный линкер или химический линкер. Терапевтическая молекула и антигенсвязывающий белок или лиганд ASGR1 человека также могут образовывать комплексы друг с другом посредством образования связей между определенными функциональными группами или за счет определенного пространственного соответствия (например, взаимодействия по типу «замок и ключ»). В качестве конкретного примера антигенсвязывающий белок ASGR1 человека может представлять собой биспецифический антигенсвязывающий белок, который также специфически связывает терапевтическую молекулу.[00107] The therapeutic molecule and the human antigen-binding protein or ligand of ASGR1 may be complexed with each other by any means. For example, the therapeutic molecule and a human ASGR1 antigen-binding protein or ligand may be joined via direct covalent conjugation, or may be linked via a linker such as a peptide linker or a chemical linker. The therapeutic molecule and the human ASGR1 antigen-binding protein or ligand can also be complexed with each other through the formation of bonds between certain functional groups or through certain spatial correspondence (eg, lock and key interactions). As a specific example, a human ASGR1 antigen-binding protein can be a bispecific antigen-binding protein that also specifically binds a therapeutic molecule.

[00108] Введение терапевтического комплекса может осуществляться посредством любого способа, как это описано более подробно в другом месте данного документа, и с помощью любого пути введения. Средства для доставки терапевтических комплексов и молекул и пути введения более подробно раскрыты в другом месте данного документа.[00108] Administration of the therapeutic complex may be by any route, as described in more detail elsewhere in this document, and by any route of administration. Means for delivering therapeutic complexes and molecules and routes of administration are disclosed in more detail elsewhere in this document.

[00109] Можно использовать антигенсвязывающие белки ASGR1 человека или лиганды ASGR1 человека, которые специфически связывают ASGR1 человека. Поскольку белок ASGR1 человека является трансмембранным белком, который опосредует эндоцитоз определенных гликопротеинов в печени, молекулы, которые образуют комплекс с ASGR1 человека, могут быть интернализованы вместе с ASGR1 человека. Примеры подходящих антигенсвязывающих белков включают слитую с рецептором молекулу, молекулу-ловушку, слитую с рецептором Fc молекулу, антитело, Fab-фрагмент, F(ab')2-фрагмент, Fd-фрагмент, Fv-фрагмент, молекулу одноцепочечного Fv (scFv), dAb-фрагмент, выделенный определяющий комплементарность участок (CDR), пептид CDR3, конформационно ограниченный пептид FR3-CDR3-FR4, домен-специфическое антитело, однодоменное антитело, антитело с удаленным доменом, химерное антитело, антитело с привитым CDR, диатело, триатело, тетратело, минитело, нанотело, одновалентное нанотело, двухвалентное нанотело, иммунофармацевтическое средство на основе модульного белка малого размера (SMIP), верблюжье антитело (гомодимерное антитело на основе VHH тяжелой цепи), вариабельный домен IgNAR акулы и другие. В одном конкретном примере антигенсвязывающий белок представляет собой биспецифическое антитело, которое связывается ASGR1 человека и с терапевтической молекулой (например, с заместительным белком или ферментом или средством для доставки, таким как AAV). Альтернативно можно использовать лиганд или часть лиганда, который специфически взаимодействует с ASGR1 человека (например, асиалооросомукоид (ASOR) или бета-Ga1NAc или его рецептор-связывающая часть для ASGR1).[00109] Human ASGR1 antigen-binding proteins or human ASGR1 ligands that specifically bind human ASGR1 can be used. Because the human ASGR1 protein is a transmembrane protein that mediates endocytosis of certain glycoproteins in the liver, molecules that complex with human ASGR1 can be internalized along with human ASGR1. Examples of suitable antigen binding proteins include receptor fusion molecule, decoy molecule, Fc receptor fusion molecule, antibody, Fab fragment, F(ab')2 fragment, Fd fragment, Fv fragment, single chain Fv (scFv) molecule, dAb fragment, isolated complementarity determining region (CDR), CDR3 peptide, conformationally restricted FR3-CDR3-FR4 peptide, domain-specific antibody, single domain antibody, domain deleted antibody, chimeric antibody, CDR grafted antibody, diabody, triatelo, tetrabody , minibody, nanobody, monovalent nanobody, divalent nanobody, small size modular protein (SMIP) immunopharmaceutical, camel antibody (heavy chain VHH homodimeric antibody), shark IgNAR variable domain, and others. In one specific example, an antigen binding protein is a bispecific antibody that binds human ASGR1 and a therapeutic molecule (eg, a replacement protein or enzyme or delivery vehicle such as AAV). Alternatively, a ligand or portion of a ligand that specifically interacts with human ASGR1 (eg, asialorosomucoid (ASOR) or beta-Ga1NAc or its receptor-binding portion for ASGR1) can be used.

[00110] Оценку доставки терапевтической молекулы в печень животного, отличного от человека, можно провести при помощи любого известного способа. В качестве одного примера можно провести оценку присутствия терапевтической молекулы в печени. Например, если терапевтическая молекула представляет собой терапевтический белок, то оценку присутствия терапевтического белка в печени животного, отличного от человека, можно провести при помощи известных анализов для выявления белков. Аналогично, если терапевтическая молекула представляет собой нуклеиновую кислоту, кодирующую терапевтический белок, оценку экспрессии нуклеиновой кислоты (например, экспрессии мРНК или экспрессии белка) в печени животного, отличного от человека, можно провести при помощи известных анализов. Если кодируемый терапевтический белок представляет собой секретируемый белок, то с помощью известных анализов могут быть измерены уровни терапевтического белка в сыворотке крови или может быть оценена активность секретируемого терапевтического белка в отношении предусматриваемого типа клетки-мишени, типа ткани-мишени или органа-мишени. Оценку активности терапевтической молекулы в печени животного, отличного от человека, может провести с помощью известных анализов в зависимости от предполагаемой функции терапевтической молекулы. Например, если вводят средство для редактирования генома, такое как CRISPR/Cas, то можно использовать известные анализы для проведения оценки редактирования генома в конкретном целевом геномном локусе.[00110] Evaluation of delivery of a therapeutic molecule to the liver of a non-human animal can be performed using any known method. As one example, the presence of a therapeutic molecule in the liver can be assessed. For example, if the therapeutic molecule is a therapeutic protein, then the presence of the therapeutic protein in the liver of a non-human animal can be assessed using known protein detection assays. Similarly, if the therapeutic molecule is a nucleic acid encoding a therapeutic protein, evaluation of nucleic acid expression (eg, mRNA expression or protein expression) in the liver of a non-human animal can be performed using known assays. If the encoded therapeutic protein is a secreted protein, then serum levels of the therapeutic protein can be measured using known assays, or the activity of the secreted therapeutic protein can be assessed against the intended target cell type, target tissue type, or target organ type. Evaluation of the activity of a therapeutic molecule in the liver of a non-human animal can be performed using known assays, depending on the intended function of the therapeutic molecule. For example, if a genome editing tool such as CRISPR/Cas is administered, known assays can be used to evaluate genome editing at a particular target genomic locus.

[00111] В конкретном примере терапевтический комплекс может содержать композиции на основе вирусных векторов (например, композиции на специфических для печени вирусных векторов). Такие композиции на основе вирусных векторов могут характеризоваться пониженным или устраненным природным тропизмом, и они сконструированы так, чтобы быть направленными на ASGR1 человека для целенаправленного воздействия на печень. Например, такой модифицированный вирусный векторный комплекс может содержать: (i) модифицированный вирусный вектор, содержащий нуклеиновую кислоту, кодирующую терапевтическую нуклеиновую кислоту или терапевтический белок, где модифицированный вирусный вектор характеризуется устраненным или пониженным природным тропизмом и содержит гетерологичный эпитоп; и (ii) перенацеливающий фрагмент, содержащий: (1) паратоп антиген-связывающего белка (например, антитела), который специфически связывает гетерологичный эпитоп; и (2) нацеливающий лиганд, который специфически связывает ASGR1 человека.[00111] In a specific example, the therapeutic complex may contain compositions based on viral vectors (eg, compositions based on liver-specific viral vectors). Such viral vector compositions may have reduced or eliminated natural tropism and are designed to target human ASGR1 to target the liver. For example, such a modified viral vector complex may comprise: (i) a modified viral vector containing a nucleic acid encoding a therapeutic nucleic acid or therapeutic protein, wherein the modified viral vector has abolished or reduced natural tropism and contains a heterologous epitope; and (ii) a retargeting fragment comprising: (1) a paratope of an antigen-binding protein (eg, antibody) that specifically binds the heterologous epitope; and (2) a targeting ligand that specifically binds human ASGR1.

[00112] В качестве одного примера того, как этого добиться, можно использовать систему для мечения белков, такую как SpyCatcher-SpyTag, для ковалентного связывания антител с поверхностью вируса. Альтернативно могут быть использованы биспецифические антиген связывающие белки (например, биспецифические антитела, в которых одно плечо антитела связывается с вирусом, а другое плечо опосредует связывание с ASGR1 человека). В конкретном примере, перенацеливающий фрагмент представляет собой биспецифический антигенсвязывающий белок (например, биспецифическое антитело), содержащий первый и второй антигенсвязывающие домены, где первый антигенсвязывающий домен содержит паратоп, который специфически связывает гетерологичный эпитоп, встроенный в рекомбинантный человеческий вирусный капсидный белок/поверхностно экспрессируемый с его помощью, и второй антигенсвязывающий домен, который специфически связывает ASGR1 человека.[00112] As one example of how to achieve this, a protein labeling system such as SpyCatcher-SpyTag can be used to covalently bind antibodies to the surface of a virus. Alternatively, bispecific antigen binding proteins (eg, bispecific antibodies in which one arm of the antibody binds to the virus and the other arm mediates binding to human ASGR1) can be used. In a specific example, the retargeting fragment is a bispecific antigen-binding protein (e.g., a bispecific antibody) containing first and second antigen-binding domains, wherein the first antigen-binding domain contains a paratope that specifically binds a heterologous epitope incorporated into/surface-expressed from a recombinant human viral capsid protein. help, and a second antigen-binding domain that specifically binds human ASGR1.

[00113] Примером подходящего гетерологичного эпитопа является Мус-метка. Например, Мус-метка может быть вставлена после N587 в AAV2. Такая вставка устраняет природную лиганд-связывающую активность AAV2, а также позволяет антителу к Мус распознавать модифицированный AAV. Использование биспецифического антитела, которое специфически связывается как с Мус, так и с ASGR1 человека, может затем перенацеливать AAV (например, AAV2 N587 Мус) на клетки печени, экспрессирующие ASGR1 человека (или гуманизированный Asgr1).[00113] An example of a suitable heterologous epitope is a Myc tag. For example, a Myc tag may be inserted after N587 in AAV2. This insert abolishes the natural ligand-binding activity of AAV2 and also allows the anti-Myc antibody to recognize the modified AAV. The use of a bispecific antibody that specifically binds to both Myc and human ASGR1 can then retarget AAV (eg, AAV2 N587 Myc) to liver cells expressing human ASGR1 (or humanized Asgr1).

[00114] В другом примере терапевтический комплекс содержит лизосомальный заместительный фермент или белок или нуклеиновую кислоту, кодирующую лизосомальный заместительный фермент или белок. Лизосомальные болезни накопления представляют собой класс редких заболеваний, которые влияют на расщепление различных субстратов в лизосоме, включая сфинголипиды, мукополисахариды, гликопротеины, гликоген и олигосахариды, которые могут накапливаться в пораженных клетках, что приводит к гибели клеток. Органы, поражаемые лизосомальными болезнями накопления, включают печень. Патогенез этих заболеваний объясняется накоплением продуктов неполного расщепления в лизосоме, как правило, из-за потери функции белка. Лизосомальные болезни накопления обычно вызываются вариантами с потерей функции или аттенуированными вариантами в белках, нормальная функция которых заключается в расщеплении или координации расщепления содержимого лизосом. Примеры лизосомальных болезней накопления представлены в WO 2017/100467, включенной в данный документ посредством ссылки во всей своей полноте для всех целей. Например, одной из наиболее распространенных лизосомальных болезней накопления является болезнь Помпе. Болезнь Помпе вызывается дефектным лизосомальным ферментом альфа-глюкозидазой (GAA), что приводит к недостаточному процессированию гликогена в лизосомах. Накопление лизосомального гликогена происходит преимущественно в скелетной, сердечной и печеночной тканях.[00114] In another example, the therapeutic complex comprises a lysosomal replacement enzyme or protein, or a nucleic acid encoding a lysosomal replacement enzyme or protein. Lysosomal storage diseases are a class of rare diseases that affect the breakdown of various substrates in the lysosome, including sphingolipids, mucopolysaccharides, glycoproteins, glycogen, and oligosaccharides, which can accumulate in affected cells, leading to cell death. Organs affected by lysosomal storage diseases include the liver. The pathogenesis of these diseases is explained by the accumulation of incomplete cleavage products in the lysosome, usually due to loss of protein function. Lysosomal storage diseases are usually caused by loss-of-function or attenuated variants in proteins whose normal function is to cleave or coordinate the cleavage of lysosome contents. Examples of lysosomal storage diseases are presented in WO 2017/100467, incorporated herein by reference in its entirety for all purposes. For example, one of the most common lysosomal storage diseases is Pompe disease. Pompe disease is caused by a defective lysosomal enzyme, alpha-glucosidase (GAA), which results in inadequate processing of glycogen in lysosomes. The accumulation of lysosomal glycogen occurs mainly in skeletal, cardiac and hepatic tissues.

[00115] Одним из вариантов лечения лизосомальных болезней накопления является заместительная ферментная или белковая терапия. Заместительные ферменты или белки могут быть эффективно доставлены в лизосому специфической клетки-мишени, когда они связаны в терапевтическом комплексе с антиген связывающим белком или лигандом, который специфически связывает ASGR1 человека. См. WO 2017/100467, включенную в данный документ посредством ссылки во всей своей полноте для всех целей. Такой терапевтический комплекс может быть введен субъекту, при этом данный терапевтический комплекс может проникать в лизосому клетки-мишени у субъекта и обеспечивать ферментативную активность, которая замещает ферментативную активность, связанную с лизосомной болезнью накопления. Белок ASGR1 человека представляет собой трансмембранный белок, который опосредует эндоцитоз и лизосомальное расщепление гликопротеинов с доступными концевыми остатками галактозы или N-ацетилгалактозамина в печени. Следовательно, белки, которые связываются и интернализуются вместе с ASGR1 человека, будут нацелены на лизосому. Собственно способы доставки, которые направляют терапевтические молекулы или комплексы на ASGR1 человека, можно использовать для нацеливания терапевтических средств на лизосомы (например, лизосомы в печени).[00115] One treatment option for lysosomal storage diseases is enzyme or protein replacement therapy. Replacement enzymes or proteins can be efficiently delivered to the lysosome of a specific target cell when they are therapeutically complexed with an antigen binding protein or ligand that specifically binds human ASGR1. See WO 2017/100467, incorporated herein by reference in its entirety for all purposes. Such a therapeutic complex may be administered to a subject, wherein the therapeutic complex may enter the lysosome of a target cell in the subject and provide an enzymatic activity that replaces an enzymatic activity associated with lysosomal storage disease. The human ASGR1 protein is a transmembrane protein that mediates endocytosis and lysosomal cleavage of glycoproteins with accessible terminal galactose or N-acetylgalactosamine residues in the liver. Therefore, proteins that bind and internalize together with human ASGR1 will be targeted to the lysosome. Proper delivery methods that target therapeutic molecules or complexes to human ASGR1 can be used to target therapeutic agents to lysosomes (eg, lysosomes in the liver).

[00116] Соответственно, некоторые из представленных в данном документе способов представляют собой способы оценки доставки терапевтического комплекса, содержащего лизосомальный заместительный белок или фермент, в печень посредством ASGR1 человека in vivo. Например, такие способы могут предусматривать (а) введение терапевтической молекулы или терапевтического комплекса животным, отличным от человека, описанным в другом месте данного документа, где терапевтическая молекула или терапевтический комплекс содержит лизосомальный заместительный белок или фермент (или нуклеиновую кислоту, кодирующую лизосомальный заместительный белок или фермент) и антигенсвязывающий белок, который специфически связывает ASGR1 человека, где ASGR1 опосредует связывание с клеткой и поглощение лизосомным компартментом; и (b) оценку присутствия или активности лизосомального заместительного белка или фермента в печени животного, отличного от человека. Активность заместительного белка или фермента в печени животного, отличного от человека, можно оценить с помощью известных анализов для конкретного заместительного белка или фермента или путем измерения расщепления различных вовлеченных в заболевание субстратов в лизосоме с помощью известных анализов.[00116] Accordingly, some of the methods provided herein are methods for evaluating delivery of a therapeutic complex containing a lysosomal replacement protein or enzyme to the liver via human ASGR1 in vivo. For example, such methods may include (a) administering a therapeutic molecule or therapeutic complex to non-human animals described elsewhere herein, wherein the therapeutic molecule or therapeutic complex comprises a lysosomal replacement protein or enzyme (or a nucleic acid encoding a lysosomal replacement protein or an enzyme) and an antigen-binding protein that specifically binds human ASGR1, where ASGR1 mediates cell binding and uptake by the lysosomal compartment; and (b) assessing the presence or activity of a lysosomal replacement protein or enzyme in the liver of a non-human animal. The activity of a replacement protein or enzyme in the liver of a non-human animal can be assessed using known assays for a particular replacement protein or enzyme, or by measuring the degradation of various disease substrates in the lysosome using known assays.

[00117] В качестве другого примера терапевтическая молекула может представлять собой нуклеиновую кислоту, кодирующую терапевтический секретируемый белок. Печень играет важную роль в продуцировании белков, которые секретируются в кровь, включая основные белки плазмы крови, факторы гемостаза и фибринолиза, белки-транспортеры, гормоны, прогормоны и аполипопротеины. Белок ASGR1 человека представляет собой трансмембранный белок, который опосредует эндоцитоз определенных гликопротеинов в печени. Следовательно, молекулы, которые образуют комплекс с ASGR1 человека, могут быть интернализованы вместе с ASGR1 человека. Таким образом, нуклеиновая кислота, кодирующая секретируемый терапевтический белок, может быть нацелена на печень путем ее доставки в комплексе, который нацеливается на ASGR1 человека. Нуклеиновая кислота может быть интернализована посредством ASGR1, и печень может синтезировать и секретировать терапевтический белок.[00117] As another example, the therapeutic molecule may be a nucleic acid encoding a therapeutic secreted protein. The liver plays an important role in the production of proteins that are secreted into the blood, including major plasma proteins, hemostasis and fibrinolysis factors, transport proteins, hormones, prohormones, and apolipoproteins. The human ASGR1 protein is a transmembrane protein that mediates endocytosis of certain glycoproteins in the liver. Therefore, molecules that complex with human ASGR1 can be internalized together with human ASGR1. Thus, a nucleic acid encoding a secreted therapeutic protein can be targeted to the liver by delivering it in a complex that targets human ASGR1. The nucleic acid can be internalized by ASGR1 and the liver can synthesize and secrete the therapeutic protein.

[00118] Соответственно, некоторые из представленных в данном документе способов представляют собой способы оценки доставки нуклеиновой кислоты, кодирующей терапевтический секретируемый белок, в печень посредством ASGR1 человека in vivo. Например, такие способы могут предусматривать (а) введение нуклеиновой кислоты (например, ДНК), кодирующей терапевтический секретируемый белок, животному, отличному от человека, описанному в другом месте данного документа, где нуклеиновая кислота доставляется в терапевтическом комплексе, который специфически связывается с ASGR1 человека, и при этом ASGR1 опосредует интернализацию комплекса; и (b) оценку секретируемых уровней (например, уровней в сыворотке крови) или активности терапевтического секретируемого белка у животного, отличного от человека.[00118] Accordingly, some of the methods provided herein are methods for evaluating delivery of a nucleic acid encoding a therapeutic secreted protein to the liver by human ASGR1 in vivo. For example, such methods may include (a) administering a nucleic acid (e.g., DNA) encoding a therapeutic secreted protein to a non-human animal described elsewhere herein, wherein the nucleic acid is delivered in a therapeutic complex that specifically binds to human ASGR1 , while ASGR1 mediates the internalization of the complex; and (b) assessing secreted levels (eg, serum levels) or activity of the therapeutic secreted protein in the non-human animal.

[00119] Продуцирование и секрецию терапевтического белка можно оценивать при помощи любых известных способов. Например, экспрессия введенной нуклеиновой кислоты может быть оценена путем измерения уровней кодируемой мРНК в печени животного, отличного от человека, или уровней кодируемого терапевтического белка в печени животного, отличного от человека, с использованием известных анализов. Секрецию терапевтического белка можно оценивать путем измерения уровней кодируемого терапевтического белка в сыворотке крови у животного, отличного от человека, с использованием известных анализов. Кроме того, если секретируемый терапевтический белок действует на конкретные тип клеток, ткань или орган, то активность секретируемого терапевтического белка можно оценивать в целевых типе клеток, ткани или органе.[00119] The production and secretion of a therapeutic protein can be assessed using any known methods. For example, expression of the introduced nucleic acid can be assessed by measuring the levels of the encoded mRNA in the liver of a non-human animal or the levels of the encoded therapeutic protein in the liver of a non-human animal using known assays. Secretion of a therapeutic protein can be assessed by measuring serum levels of the encoded therapeutic protein in a non-human animal using known assays. In addition, if the secreted therapeutic protein acts on a specific cell type, tissue, or organ, then the activity of the secreted therapeutic protein can be assessed in the target cell type, tissue, or organ.

В. Способы оценки in vivo эффективности терапевтического комплекса в отношении интернализации поверхностного белка-мишени клеток печени или растворимого белка-мишени в печени посредством интернализации, опосредованной ASGR1 человекаB. Methods for evaluating the in vivo efficacy of a therapeutic complex in internalizing a liver cell surface target protein or a soluble target protein in the liver via human ASGR1-mediated internalization

[00120] Представлены разные способы использования животных, отличных от человека, содержащих гуманизированный локус Asgr1, описанный в другом месте данного документа, для оценки in vivo эффективности терапевтического комплекса, сконструированного для интернализации поверхностного белка-мишени клеток печени или растворимого белка-мишени в печени посредством ASGR1 человека. Способы терапии часто требуют инактивации или блокирования одной или более молекул-мишеней, которые действуют рядом с клеткой или на ее поверхности. Например, терапевтические средства на основе антител зачастую осуществляют свою функцию путем связывания с определенным антигеном, экспрессируемым на поверхности клетки, или с растворимым лигандом, препятствуя тем самым проявлению нормальной биологической активности антигена. Терапевтические средства данного типа обычно осуществляют свою функцию путем блокирования взаимодействия между цитокином и его рецептором для ослабления или подавления клеточной передачи сигнала. Однако в определенных случаях терапевтически преимущественным было бы инактивировать или подавлять активность молекулы-мишени таким образом, который необязательно включает блокирование ее физического взаимодействия с другим компонентом. Одним из способов достижения такого ослабления, не связанного с блокированием молекулы-мишени, может быть уменьшение внеклеточной концентрации молекулы-мишени или на клеточной поверхности. Например, молекула-мишень может быть ослаблена или инактивирована путем содействия или обеспечения физической связи между молекулой-мишенью и интернализующим эффекторным белком, таким как ASGR1. Это может быть достигнуто, например, путем использования полиспецифической (например, биспецифической) антигенсвязывающей молекулы, содержащей первый антигенсвязывающий домен и второй антигенсвязывающий домен. Каждый антигенсвязывающий домен связывает отдельную молекулу: первый специфически связывает молекулу-мишень, а второй специфически связывает ASGR1. Посредством этого типа физического межмолекулярного связывания молекула-мишень может быть принудительно интернализована в клетку вместе с ASGR1 и процессирована посредством внутриклеточного механизма расщепления или иным образом ослаблена, изолируя или инактивирована. См. WO 2013/138400 и US 2013/0243775, которые включены в данный документ посредством ссылки во всей своей полноте для всех целей.[00120] Various methods are provided for using non-human animals containing the humanized Asgr1 locus described elsewhere in this document to evaluate the in vivo efficacy of a therapeutic complex designed to internalize a liver cell surface target protein or a soluble target protein in the liver via human ASGR1. Therapies often require the inactivation or blocking of one or more target molecules that act near or on the cell's surface. For example, antibody-based therapeutics often perform their function by binding to a specific antigen expressed on the cell surface or to a soluble ligand, thereby preventing the normal biological activity of the antigen. Therapeutic agents of this type typically perform their function by blocking the interaction between a cytokine and its receptor to attenuate or suppress cellular signaling. However, in certain cases it would be therapeutically advantageous to inactivate or inhibit the activity of the target molecule in a manner that does not necessarily include blocking its physical interaction with another component. One way to achieve such attenuation, not associated with blocking the target molecule, may be to reduce the extracellular concentration of the target molecule or on the cell surface. For example, the target molecule can be weakened or inactivated by facilitating or providing a physical link between the target molecule and an internalizing effector protein such as ASGR1. This can be achieved, for example, by using a polyspecific (eg, bispecific) antigen-binding molecule containing a first antigen-binding domain and a second antigen-binding domain. Each antigen-binding domain binds a separate molecule: the first specifically binds the target molecule, and the second specifically binds ASGR1. Through this type of physical intermolecular binding, the target molecule can be forcibly internalized into the cell along with ASGR1 and processed through an intracellular cleavage mechanism or otherwise attenuated, isolated or inactivated. See WO 2013/138400 and US 2013/0243775, which are incorporated herein by reference in their entirety for all purposes.

[00121] Поскольку белок ASGR1 человека представляет собой трансмембранный белок, который опосредует эндоцитоз и лизосомальное расщепление гликопротеинов с доступными концевыми остатками галактозы или N-ацетилгалактозамина в печени, белки клеточной поверхности, которые образуют комплекс с ASGR1 человека, могут быть интернализованы вместе с ASGR1 человека, перенаправляя белок-мишень клеточной поверхности или растворимый белок-мишень в расщепляющий компартмент или изолируя белок-мишень клеточной поверхности или растворимый белок-мишень во внутренних компартментах или экзосомах.[00121] Because the human ASGR1 protein is a transmembrane protein that mediates endocytosis and lysosomal cleavage of glycoproteins with accessible terminal galactose or N-acetylgalactosamine residues in the liver, cell surface proteins that complex with human ASGR1 can be internalized along with human ASGR1, redirecting the cell surface target protein or soluble target protein to a cleavage compartment; or sequestering the cell surface target protein or soluble target protein in internal compartments or exosomes.

[00122] Соответственно, в данном документе представлены способы использования животных, отличных от человека, содержащих гуманизированный локус Asgr1, который описан в другом месте данного документа, для оценки in vivo эффективности терапевтического комплекса, сконструированного для интернализации поверхностного белка-мишени клеток печени или растворимого белка-мишени в печени посредством ASGR1 человека. Например, такие способы могут предусматривать (а) введение терапевтического комплекса животным, отличным от человека, описанным в другом месте данного документа, где терапевтический комплекс содержит биспецифический антигенсвязывающий белок, который специфически связывается с поверхностным белком-мишенью клеток или растворимым белком-мишенью и специфически связывается с ASGR1 человека, где ASGR1 опосредует интернализацию поверхностного белка-мишени клеток или растворимого белка-мишени; и (b) оценку уровней поверхностного белка клеток печени, или активности поверхностного белка-мишени клеток печени, или оценку уровней экспрессии или активности растворимого белка-мишени в печени животного, отличного от человека. Введение терапевтического комплекса может осуществляться с помощью любого подходящего способа, как это описано в другом месте данного документа.[00122] Accordingly, this document provides methods for using non-human animals containing a humanized Asgr1 locus, as described elsewhere in this document, to evaluate the in vivo efficacy of a therapeutic complex designed to internalize a liver cell surface target protein or soluble protein. -targets in the liver by human ASGR1. For example, such methods may include (a) administering a therapeutic complex to a non-human animal described elsewhere herein, wherein the therapeutic complex comprises a bispecific antigen-binding protein that specifically binds to a cell surface target protein or a soluble target protein and specifically binds with human ASGR1, where ASGR1 mediates the internalization of a cell surface target protein or a soluble target protein; and (b) assessing liver cell surface protein levels or activity of a liver cell surface target protein, or assessing expression levels or activity of a soluble target protein in the liver of a non-human animal. Administration of the therapeutic complex may be by any suitable method, as described elsewhere in this document.

[00123] Белки-мишени клеточной поверхности могут включать любой белок клеточной поверхности, экспрессируемый в печени. Растворимые белки-мишени могут включать любой растворимый белок, экспрессируемый в печени. Уровни поверхностного белка клеток или активность поверхностного белка-мишени клеток печени в печени животного, отличного от человека, могут быть оценены с помощью известных анализов для измерения уровней рецепторов на поверхности клеток и других белков. Аналогичным образом уровни растворимых белков могут быть оценены с помощью известных анализов.[00123] Target cell surface proteins can include any cell surface protein expressed in the liver. Soluble target proteins may include any soluble protein expressed in the liver. Cell surface protein levels or activity of a liver cell surface target protein in the liver of a non-human animal can be assessed using known assays to measure levels of cell surface receptors and other proteins. Likewise, soluble protein levels can be assessed using known assays.

С. Введение молекул животным, отличным от человекаC. Administration of molecules to non-human animals

[00124] Способы, раскрытые в данном документе, включают введение животному, отличному от человека, различных молекул (терапевтических молекул или комплексов), в том числе нуклеиновых кислот, белков или белковых комплексов. Введение может быть выполнено с помощью любого способа. Например, такие молекулы могут быть введены животному, отличному от человека, например, посредством доставки с помощью вектора, доставки, опосредованной частицами, доставки, опосредованной экзосомами, доставки, опосредованной липидными наночастицами, доставки, опосредованной проникающим в клетку пептидом, или доставки, опосредованной имплантируемым устройством. В качестве конкретных примеров, молекула может быть введена в клетку или животное, отличное от человека, в носителе, таком как микросфера на основе поли(молочной кислоты) (PLA), микросфера на основе сополимера D,L-молочной кислоты и гликолевой кислоты (PLGA), липосома, мицелла, обратная мицелла, липидный кохлеат или липидная микротрубочка. Некоторые конкретные примеры доставки животному, отличному от человека, включают гидродинамическую доставку, доставку, опосредованную вирусом (например, доставку, опосредованную аденоассоциированным вирусом (AAV)), и доставку, опосредованную липидными наночастицами.[00124] The methods disclosed herein include administering to a non-human animal various molecules (therapeutic molecules or complexes), including nucleic acids, proteins or protein complexes. The introduction may be by any method. For example, such molecules can be administered to a non-human animal, for example, via vector delivery, particle-mediated delivery, exosome-mediated delivery, lipid nanoparticle-mediated delivery, cell-penetrating peptide-mediated delivery, or implantable-mediated delivery. device. As specific examples, the molecule can be introduced into a non-human cell or animal in a carrier such as a poly(lactic acid) (PLA) microsphere, a D,L-lactic acid-glycolic acid (PLGA) microsphere ), liposome, micelle, reverse micelle, lipid cochleate, or lipid microtubule. Some specific examples of delivery to a non-human animal include hydrodynamic delivery, virus-mediated delivery (eg, adeno-associated virus (AAV)-mediated delivery), and lipid nanoparticle-mediated delivery.

[00125] Введение нуклеиновых кислот, белков или других компонентов животным, отличным от человека, может быть выполнено путем гидродинамической доставки (HDD). Гидродинамическая доставка оказалась идеальным способом внутриклеточной доставки ДНК in vivo. Для доставки гена в паренхиматозные клетки через выбранный кровеносный сосуд следует вводить только требуемые последовательности ДНК, что устраняет проблемы безопасности, связанные с современными вирусными и синтетическими векторами. При введении в кровоток ДНК способна достигать клеток в различных тканях, доступных крови. В гидродинамической доставке используется сила, создаваемая за счет быстрой инъекции большого объема раствора в несжимающуюся кровь в кровотоке, чтобы преодолеть физические барьеры эндотелия и клеточных мембран, которые препятствуют проникновению крупных и не проникающих через мембраны соединений в паренхиматозные клетки. В дополнение к доставке ДНК этот способ применим для эффективной внутриклеточной доставки РНК, белков и других небольших соединений in vivo. См., например, Bonamassa et al. (2011) Pharm. Res. 28(4):694-701, включенную в данный документ посредством ссылки во всей своей полноте для всех целей.[00125] Administration of nucleic acids, proteins, or other components to non-human animals can be accomplished by hydrodynamic delivery (HDD). Hydrodynamic delivery has proven to be an ideal method for intracellular DNA delivery in vivo. To deliver the gene to parenchymal cells through the chosen blood vessel, only the required DNA sequences should be introduced, eliminating the safety concerns associated with current viral and synthetic vectors. When injected into the bloodstream, DNA is able to reach cells in the various tissues available to the blood. Hydrodynamic delivery uses the force generated by rapidly injecting a large volume of solution into non-compressible blood in the circulation to overcome the physical barriers of the endothelium and cell membranes that prevent large, non-membrane-penetrating compounds from entering parenchymal cells. In addition to DNA delivery, this method is applicable for efficient intracellular delivery of RNA, proteins and other small compounds in vivo. See, for example, Bonamassa et al. (2011) Pharm. Res. 28(4):694-701, incorporated herein by reference in its entirety for all purposes.

[00126] Введение нуклеиновых кислот также может быть выполнено путем опосредованной вирусом доставки, например, AAV-опосредованной доставки или опосредованной лентивирусом доставки. Другие иллюстративные вирусы/вирусные векторы включают ретровирусы, аденовирусы, вирусы осповакцины, поксвирусы и вирусы простого герпеса. Вирусы могут инфицировать делящиеся клетки, неделящиеся клетки или и делящиеся, и неделящиеся клетки. Вирусы могут интегрироваться в геном хозяина или альтернативно не интегрироваться в геном хозяина. Такие вирусы также могут быть сконструированы с тем, чтобы ослаблять иммунитета. Вирусы могут быть репликационно-компетентными или могут быть репликационно-дефектными (например, дефектными по одному или более генам, необходимым для дополнительных циклов репликации и/или упаковки вириона). Вирусы могут инициировать временную экспрессию, длительную экспрессию (например, по меньшей мере 1 неделю, 2 недели, 1 месяц, 2 месяца или 3 месяца) или постоянную экспрессию (например, Cas9 и/или gRNA). Иллюстративные вирусные титры (например, титры AAV) включают 1012, 1013, 1014, 1015 и 1016 векторных геномов/мл.[00126] Administration of nucleic acids can also be accomplished by virus-mediated delivery, such as AAV-mediated delivery or lentivirus-mediated delivery. Other exemplary viruses/viral vectors include retroviruses, adenoviruses, vaccinia viruses, poxviruses, and herpes simplex viruses. Viruses can infect dividing cells, non-dividing cells, or both dividing and non-dividing cells. Viruses may integrate into the host genome or alternatively not integrate into the host genome. Such viruses can also be engineered to weaken the immune system. Viruses may be replication competent or may be replication defective (eg, defective in one or more genes required for additional rounds of replication and/or virion packaging). Viruses can initiate transient expression, long-term expression (eg, at least 1 week, 2 weeks, 1 month, 2 months, or 3 months), or persistent expression (eg, Cas9 and/or gRNA). Exemplary viral titers (eg, AAV titers) include 10 12 , 10 13 , 10 14 , 10 15 , and 10 16 vector genomes/ml.

[00127] ssDNA генома AAV состоит из двух открытых рамок считывания, Rep и Сар, и фланкирован двумя инвертированными концевыми повторами, которые обеспечивают возможность синтеза комплементарной нити ДНК. При конструировании плазмиды для переноса с помощью AAV трансген помещают между двумя ITR, a Rep и Сар могут обеспечиваться в транс-форме. В дополнение к Rep и Сар для AAV может потребоваться хелперная плазмида, содержащая гены аденовируса. Эти гены (Е4, Е2а и VA) опосредуют репликацию AAV. Например, плазмида для переноса, Rep/Cap и хелперная плазмида могут быть трансфицированы в клетки HEK293, содержащие ген Е1 + аденовируса, для получения инфекционных частиц AAV. Альтернативно Rep, Сар и хелперные гены аденовируса могут быть объединены в одну плазмиду. Аналогичные упаковывающие клетки и способы можно использовать для других вирусов, как, например, для ретровирусов.[00127] The ssDNA of the AAV genome consists of two open reading frames, Rep and Cap, and is flanked by two inverted terminal repeats that allow the synthesis of a complementary strand of DNA. When constructing a plasmid for transfer with AAV, the transgene is placed between two ITRs, and Rep and Cap can be provided in trans form. In addition to Rep and Cap, AAV may require a helper plasmid containing adenovirus genes. These genes (E4, E2a and VA) mediate AAV replication. For example, a transfer plasmid, Rep/Cap, and a helper plasmid can be transfected into HEK293 cells containing the adenovirus E1+ gene to generate infectious AAV particles. Alternatively, Rep, Cap, and adenovirus helper genes can be combined into a single plasmid. Similar packaging cells and methods can be used for other viruses such as retroviruses.

[00128] Было идентифицировано множество серотипов AAV. Эти серотипы отличаются по типам клеток, которые они инфицируют (т.е. тропизмом), что обеспечивает возможность преимущественной трансдукции определенных типов клеток. Серотипы для ткани печени включают AAV7, AAV8 и AAV9 и, в частности, AAV8.[00128] Many AAV serotypes have been identified. These serotypes differ in the cell types they infect (ie, tropism), which allows certain cell types to be preferentially transduced. Serotypes for liver tissue include AAV7, AAV8 and AAV9, and in particular AAV8.

[00129] Тропизм можно дополнительно уточнить с помощью псевдотипирования, представляющего собой смешивание капсида и генома различных вирусных серотипов. Использование псевдотипированных вирусов может улучшить эффективность трансдукции, а также изменить тропизм. Гибридные капсиды, полученные от разных серотипов, также могут быть использованы для изменения вирусного тропизма. Например, AAV-DJ содержит гибридный капсид из восьми серотипов и демонстрирует высокую инфицирующую способность в широком спектре типов клеток in vivo. Серотипы AAV также могут быть изменены с помощью мутаций. Другие псевдотипированные/модифицированные варианты AAV включают AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5, AAV8.2 и AAV/SASTG.[00129] Tropism can be further refined using pseudotyping, which is the mixing of the capsid and genome of different viral serotypes. The use of pseudotyped viruses can improve transduction efficiency as well as alter tropism. Hybrid capsids derived from different serotypes can also be used to modify viral tropism. For example, AAV-DJ contains a hybrid capsid of eight serotypes and shows high infectivity in a wide range of cell types in vivo. AAV serotypes can also be changed through mutations. Other pseudotyped/modified AAV variants include AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5, AAV8.2 and AAV/SASTG.

[00130] Для ускорения экспрессии трансгена могут использоваться самокомплементарные варианты AAV (scAAV). Так как AAV зависит от механизма репликации ДНК клетки, то для синтеза комплементарной нити одноценитевой ДНК генома AAV, экспрессия трансгена может быть замедлена. Для устранения этой задержки можно использовать scAAV, содержащие комплементарные последовательности, которые способны к самопроизвольному отжигу при заражении, что устраняет необходимость синтеза ДНК клетки-хозяина.[00130] Self-complementary AAV variants (scAAV) can be used to accelerate transgene expression. Since AAV is dependent on the cell's DNA replication mechanism, for the synthesis of the complementary strand of single-stranded DNA of the AAV genome, transgene expression can be slowed down. To eliminate this delay, scAAVs containing complementary sequences that are capable of spontaneous annealing upon infection can be used, eliminating the need for host cell DNA synthesis.

[00131] Чтобы увеличить пакующую емкость, более длинные трансгены могут быть разделены между двумя плазмидами для переноса AAV, первая с 3'-донором сплайсинга, а вторая с 5'-акцептором сплайсинга. При совместной инфекции клетки данные вирусы образуют конкатемеры, подвергаются сплайсингу, и может экспрессироваться полноразмерный трансген. Хотя это обеспечивает возможность экспрессии трансгена большей длины, такая экспрессия является менее эффективной. В аналогичных способах увеличения емкости используется гомологичная рекомбинация. Например, трансген может быть разделен между двумя плазмидами для переноса, но с существенным перекрыванием последовательностей с тем, чтобы совместная экспрессия индуцировала гомологичную рекомбинацию и экспрессию полноразмерного трансгена.[00131] To increase packaging capacity, longer transgenes can be split between two AAV transfer plasmids, the first with a 3' splicing donor and the second with a 5' splicing acceptor. When the cells are co-infected, these viruses form concatemers, undergo splicing, and a full-length transgene can be expressed. While this allows longer transgene expression, such expression is less efficient. Similar methods for increasing capacity use homologous recombination. For example, a transgene can be split between two transfer plasmids, but with significant sequence overlap, so that co-expression induces homologous recombination and expression of the full-length transgene.

[00132] Введение нуклеиновых кислот и белков также может быть выполнено путем доставки, опосредованной липидными наночастицами (LNP). Например, LNP-опосредованная доставка может использоваться для доставки направляющей РНК в форме РНК. Результатом доставки с помощью таких способов является временное присутствие направляющей РНК, а биоразлагаемые липиды улучшают клиренс, улучшают переносимость и снижают иммуногенность. Липидные составы могут защищать биологические молекулы от расщепления при одновременном улучшении их поглощения клетками. Липидные наночастицы представляют собой частицы, содержащие множество молекул липидов, физически связанных друг с другом межмолекулярными силами. Они включают микросферы (в том числе однослойные и многослойные везикулы, например, липосомы), дисперсную фазу в эмульсии, мицеллы или внутреннюю фазу в суспензии. Такие липидные наночастицы могут быть использованы для инкапсуляции одной или более нуклеиновых кислот или белков, предназначенных для доставки. Составы, которые содержат катионные липиды, являются применимыми для доставки полианионов, таких как нуклеиновые кислоты. Другие липиды, которые могут быть включены, представляют собой нейтральные липиды (т.е. незаряженные или цвиттерионные липиды), анионные липиды, хелперные липиды, которые улучшают трансфекцию, и липиды-невидимки, которые увеличивают время существования наночастиц in vivo. Примеры подходящих катионных липидов, нейтральных липидов, анионных липидов, хелперных липидов и липидов-невидимок можно найти в WO 2016/010840 А1, включенной в данный документ посредством ссылки во всей своей полноте для всех целей. Иллюстративная липидная наночастица может содержать катионный липид и один или более других компонентов. В одном примере другой компонент может предусматривать хелперный липид, такой как холестерин. В другом примере другие компоненты могут предусматривать хелперный липид, такой как холестерин, и нейтральный липид, такой как DSPC. В другом примере другие компоненты могут предусматривать хелперный липид, такой как холестерин, необязательный нейтральный липид, такой как DSPC, и липид-невидимку, такой как S010, S024, S027, S031 или S033.[00132] Administration of nucleic acids and proteins can also be accomplished by lipid nanoparticle (LNP) mediated delivery. For example, LNP-mediated delivery can be used to deliver guide RNA in the form of RNA. Delivery by such methods results in transient presence of guide RNA and biodegradable lipids improve clearance, improve tolerability and reduce immunogenicity. Lipid formulations can protect biological molecules from degradation while improving their uptake by cells. Lipid nanoparticles are particles containing many lipid molecules physically connected to each other by intermolecular forces. These include microspheres (including monolayer and multilayer vesicles, eg liposomes), dispersed phase in emulsion, micelles or internal phase in suspension. Such lipid nanoparticles can be used to encapsulate one or more nucleic acids or proteins to be delivered. Compositions that contain cationic lipids are useful for delivering polyanions such as nucleic acids. Other lipids that may be included are neutral lipids (ie, uncharged or zwitterionic lipids), anionic lipids, helper lipids that improve transfection, and stealth lipids that increase the lifetime of the nanoparticles in vivo. Examples of suitable cationic lipids, neutral lipids, anionic lipids, helper lipids and invisible lipids can be found in WO 2016/010840 A1, incorporated herein by reference in its entirety for all purposes. An exemplary lipid nanoparticle may contain a cationic lipid and one or more other components. In one example, the other component may include a helper lipid such as cholesterol. In another example, other components may include a helper lipid such as cholesterol and a neutral lipid such as DSPC. In another example, other components may include a helper lipid such as cholesterol, an optional neutral lipid such as DSPC, and a stealth lipid such as S010, S024, S027, S031, or S033.

[00133] Способ доставки может быть выбран для снижения иммуногенности. Разные способы могут придавать разные фармакодинамические или фармакокинетические свойства молекуле, доставляемой субъекту. Например, разные способы могут обусловливать разное распределение в тканях, разный период полураспада или разное распределение по времени. Некоторые режимы доставки (например, доставка вектора, представляющего собой нуклеиновую кислоту, который персистирует в клетке за счет автономной репликации или геномной интеграции) приводят к более устойчивой экспрессии и присутствию молекулы, тогда как другие способы режимы являются временными и менее устойчивыми (например, доставка РНК или белка). Доставка компонентов посредством более неустойчивого механизма, например, в виде РНК или белка, может гарантировать, что компоненты присутствуют и будут активными лишь в течение короткого периода времени, и могут снижать иммуногенность.[00133] The delivery method may be selected to reduce immunogenicity. Different methods can impart different pharmacodynamic or pharmacokinetic properties to the molecule delivered to the subject. For example, different methods may result in different tissue distributions, different half-lives, or different time distributions. Some delivery modes (for example, delivery of a vector that is a nucleic acid that persists in the cell through autonomous replication or genomic integration) result in more stable expression and presence of the molecule, while other modes are transient and less stable (for example, delivery of RNA or protein). Delivery of components via a more erratic mechanism, such as RNA or protein, can ensure that the components are present and only active for a short period of time, and can reduce immunogenicity.

[00134] Введение in vivo может осуществляться любым подходящим путем, включая, например, парентеральный, внутривенный, подкожный, внутриартериальный или внутрибрюшинный. Системные способы введения включают, например, парентеральные пути, такие как внутривенный, внутриартериальный, подкожный и внутрибрюшинный пути. Конкретным примером является внутривенная инфузия. Также могут быть использованы местные способы введения.[00134] In vivo administration may be by any suitable route, including, for example, parenteral, intravenous, subcutaneous, intra-arterial, or intraperitoneal. Systemic routes of administration include, for example, parenteral routes such as intravenous, intra-arterial, subcutaneous and intraperitoneal routes. A specific example is intravenous infusion. Topical routes of administration may also be used.

[00135] Композиции, содержащие нуклеиновые кислоты или белки, могут быть составлены с использованием одного или более физиологически и фармацевтически приемлемых носителей, разбавителей, наполнителей или вспомогательных веществ. Состав может зависеть от выбранного пути введения. Термин «фармацевтически приемлемый» означает, что носитель, разбавитель, наполнитель или вспомогательное вещество являются совместимыми с другими ингредиентами состава и, по сути, не вредны для принимающего их пациента.[00135] Compositions containing nucleic acids or proteins can be formulated using one or more physiologically and pharmaceutically acceptable carriers, diluents, excipients, or excipients. The composition may depend on the chosen route of administration. The term "pharmaceutically acceptable" means that the carrier, diluent, excipient or excipient is compatible with the other ingredients of the formulation and is not substantially harmful to the patient receiving it.

[00136] Частота введения и количество доз, помимо прочих факторов, могут зависеть от периода полувыведения введенных компонентов и пути введения. Введение нуклеиновых кислот или белков животному, отличному от человека, можно осуществлять один или более раз за определенный период времени. Например, введение можно выполнять по меньшей мере два раза в течение определенного периода времени, по меньшей мере три раза в течение определенного периода времени, по меньшей мере четыре раза в течение определенного периода времени, по меньшей мере пять раз в течение определенного периода времени, по меньшей мере шесть раз в течение определенного периода времени, по меньшей мере семь раз в течение определенного периода времени, по меньшей мере восемь раз в течение определенного периода времени, по меньшей мере девять раз в течение определенного периода времени, по меньшей мере десять раз в течение определенного периода времени, по меньшей мере одиннадцать раз, по меньшей мере двенадцать раз в течение определенного периода времени, по меньшей мере тринадцать раз в течение определенного периода времени, по меньшей мере четырнадцать раз в течение определенного периода времени, по меньшей мере пятнадцать раз в течение определенного периода времени, по меньшей мере шестнадцать раз в течение определенного периода времени, по меньшей мере семнадцать раз в течение определенного периода времени, по меньшей мере восемнадцать раз в течение определенного периода времени, по меньшей мере девятнадцать раз в течение определенного периода времени или по меньшей мере двадцать раз в течение определенного периода времени.[00136] The frequency of administration and the number of doses, among other factors, may depend on the half-life of the administered components and the route of administration. Administration of nucleic acids or proteins to a non-human animal may be performed one or more times over a given period of time. For example, the administration can be performed at least twice within a certain period of time, at least three times within a certain period of time, at least four times within a certain period of time, at least five times within a certain period of time, according to at least six times within a specified period of time, at least seven times within a specified period of time, at least eight times within a specified period of time, at least nine times within a specified period of time, at least ten times within a specified period of time a certain period of time, at least eleven times, at least twelve times within a certain period of time, at least thirteen times within a certain period of time, at least fourteen times within a certain period of time, at least fifteen times within a certain period of time a specified period of time, at least sixteen times during a specified period of time, at least seventeen times during a specified period of time, at least eighteen times during a specified period of time, at least nineteen times during a specified period of time, or at least at least twenty times in a given period of time.

IV. Способы получения животных, отличных от человека, содержащих гуманизированный локус Asgr1IV. Methods for obtaining non-human animals containing a humanized Asgr1 locus

[00137] Представлены различные способы получения животного, отличного от человека, содержащего гуманизированный локус Asgr1, раскрытый в другом месте данного документа. Любой общепринятый способ или протокол, предназначенный для получения генетически модифицированного организма, являются подходящими для получения такого генетически модифицированного животного, отличного от человека. См., например, Cho et al. (2009) Current Protocols in Cell Biology 42:19.11:19.11.1-19.11.22 и Gama Sosa et al. (2010) Brain Struct. Funct. 214(2-3):91-109, каждая из которых включена в данный документ посредством ссылки во всей своей полноте для всех целей. Такие генетически модифицированные животные, отличные от человека, могут быть получены, например, посредством нокина гена в целевом локусе Asgr1.[00137] Various methods are provided for obtaining a non-human animal containing the humanized Asgr1 locus disclosed elsewhere in this document. Any conventional method or protocol for producing a genetically modified organism is suitable for producing such a genetically modified non-human animal. See, for example, Cho et al. (2009) Current Protocols in Cell Biology 42:19.11:19.11.1-19.11.22 and Gama Sosa et al. (2010) Brain Struct. Funct. 214(2-3):91-109, each of which is incorporated herein by reference in its entirety for all purposes. Such genetically modified non-human animals can be obtained, for example, by knocking a gene at the target Asgr1 locus.

[00138] Например, способ получения животного, отличного от человека, содержащего гуманизированный локус Asgr1, может предусматривать: (1) модификацию генома плюрипотентной клетки со встраиванием гуманизированного локуса Asgr1; (2) идентификацию или отбор генетически модифицированной плюрипотентной клетки, содержащей гуманизированный локус Asgr1; (3) введение генетически модифицированной плюрипотентной клетки в эмбрион животного-хозяина, отличного от человека; и (4) имплантацию и вынашивание эмбриона-хозяина суррогатной матерью. Необязательно эмбрион-хозяин, содержащий модифицированную плюрипотентную клетку (например, ES-клетку, отличную от человеческой), можно инкубировать до стадии бластоцисты перед имплантацией и вынашиванием суррогатной матерью для получения животного F0, отличного от человека. Затем суррогатная мать может произвести животное, отличное от человека, поколения F0, содержащее гуманизированный локус Asgr1.[00138] For example, a method for obtaining a non-human animal containing a humanized Asgr1 locus may include: (1) modifying the genome of a pluripotent cell to insert a humanized Asgr1 locus; (2) identifying or selecting a genetically modified pluripotent cell containing a humanized Asgr1 locus; (3) introducing the genetically modified pluripotent cell into a non-human host animal embryo; and (4) implantation and gestation of a host embryo by a surrogate mother. Optionally, a host embryo containing a modified pluripotent cell (eg, a non-human ES cell) may be incubated to the blastocyst stage prior to implantation and gestation in a surrogate mother to produce a non-human F0 animal. The surrogate mother can then produce an F0 generation non-human animal containing the humanized Asgr1 locus.

[00139] Способы могут дополнительно предусматривать идентификацию клетки или животного, имеющих модифицированный целевой геномный локус. Различные способы могут быть использованы для идентификации клеток и животных, имеющих целевую генетическую модификацию.[00139] The methods may further comprise identifying a cell or animal having a modified target genomic locus. Various methods can be used to identify cells and animals having the targeted genetic modification.

[00140] Стадия скрининга может предусматривать, например, количественный анализ для оценки модификации аллеля (МОА) в родительской хромосоме. Например, количественный анализ может быть осуществлен с помощью количественной ПЦР, такой как ПЦР в режиме реального времени (qPCR). В ПЦР в режиме реального времени может использоваться первый набор праймеров, который распознает целевой локус, и второй набор праймеров, который распознает нецелевой эталонный локус. Набор праймеров может содержать флуоресцентный зонд, который распознает амплифицированную последовательность.[00140] The screening step may include, for example, a quantitative analysis to assess the modification of the allele (MOA) in the parent chromosome. For example, quantitative analysis can be performed using quantitative PCR, such as real-time PCR (qPCR). Real-time PCR may use a first primer set that recognizes a target locus and a second primer set that recognizes a non-target reference locus. The primer set may contain a fluorescent probe that recognizes the amplified sequence.

[00141] Другие примеры подходящих количественных анализов включают флуоресцентно-опосредованную гибридизацию in situ (FISH), сравнительную геномную гибридизацию, изотермическую амплификацию ДНК, количественную гибридизацию с иммобилизованным зондом (иммобилизованными зондами), зонды INVADER®, зонды TAQMAN® от Molecular Beacon или технологию зондов ECLIPSE™ (см., например, US 2005/0144655, включенный в данный документ посредством ссылки во всей своей полноте для всех целей).[00141] Other examples of suitable quantitative assays include fluorescence-mediated in situ hybridization (FISH), comparative genomic hybridization, isothermal DNA amplification, quantitative hybridization with immobilized probe(s), INVADER® probes, TAQMAN® probes from Molecular Beacon, or probe technology ECLIPSE™ (see, for example, US 2005/0144655, incorporated herein by reference in its entirety for all purposes).

[00142] Примером подходящей плюрипотентной клетки является эмбриональная стволовая (ES) клетка (например, ES-клетка мыши или ES-клетка крысы). Модифицированная плюрипотентная клетка может быть получена, например, путем рекомбинации с помощью (а) введения в клетку одного или более нацеливающихся векторов, содержащих вставочную нуклеиновую кислоту, фланкированную 5'- и 3'-плечами гомологии, соответствующими 5'- и 3'-целевым сайтам, где вставочная нуклеиновая кислота содержит гуманизированный локус Asgr1; и (b) идентификации по меньшей мере одной клетки, содержащей в своем геноме вставочную нуклеиновую кислоту, интегрированную в целевой геномный локус. Альтернативно модифицированная плюрипотентная клетка может быть получена путем (а) введения в клетку: (i) средства на основе нуклеаз, где средство на основе нуклеаз индуцирует однонитевый или двухнитевый разрыв в сайте распознавания в пределах целевого геномного локуса; и (ii) одного или более нацеливающихся векторов, содержащих вставочную нуклеиновую кислоту, фланкированную 5'- и 3'-плечами гомологии, соответствующими 5'- и 3'-целевым сайтам, расположенным достаточно близко к сайту распознавания, где вставочная нуклеиновая кислота содержит гуманизированный локус Asgr1; и (с) идентификации по меньшей мере одной клетки, содержащей модификацию (например, интегрированную вставочную нуклеиновую кислоту) в целевом геномном локусе. Можно использовать любое средство на основе нуклеаз, которое индуцирует однонитевый или двухнитевый разрыв в требуемом сайте распознавания. Примеры подходящих нуклеаз включают эффекторную нуклеазу, подобную активаторам транскрипции (TALEN), нуклеазу с «цинковыми пальцами» (ZFN), мегануклеазу и короткие палиндромные повторы, регулярно расположенные группами (CRISPR)/CRISPR-ассоциированные (Cas) системы или компоненты таких системы (например, CRISPR/Cas9). См., например, US 2013/0309670 и US 2015/0159175, каждый из которых включен в данный документ посредством ссылки во всей своей полноте для всех целей.[00142] An example of a suitable pluripotent cell is an embryonic stem (ES) cell (eg, mouse ES cell or rat ES cell). A modified pluripotent cell can be obtained, for example, by recombination by (a) introducing into the cell one or more targeting vectors containing an intercalated nucleic acid flanked by 5' and 3' homology arms corresponding to the 5' and 3' target sites where the insertion nucleic acid contains the humanized Asgr1 locus; and (b) identifying at least one cell containing in its genome an intercalated nucleic acid integrated into a target genomic locus. Alternatively, a modified pluripotent cell can be obtained by (a) introducing into the cell: (i) a nuclease-based agent, wherein the nuclease-based agent induces a single or double strand break at a recognition site within the target genomic locus; and (ii) one or more targeting vectors comprising an intercalary nucleic acid flanked by 5' and 3' homology arms corresponding to 5' and 3' target sites sufficiently close to the recognition site where the intercalation nucleic acid contains a humanized locus Asgr1; and (c) identifying at least one cell containing the modification (eg, an integrated insertion nucleic acid) at the target genomic locus. Any nuclease-based agent that induces a single or double strand break at the desired recognition site can be used. Examples of suitable nucleases include transcription activator-like effector nuclease (TALEN), zinc finger nuclease (ZFN), meganuclease, and regularly spaced short palindromic repeats (CRISPR)/CRISPR-associated (Cas) systems or components of such systems (e.g. , CRISPR/Cas9). See, for example, US 2013/0309670 and US 2015/0159175, each of which is incorporated herein by reference in its entirety for all purposes.

[00143] Донорную клетку можно вводить в эмбрион-хозяин на любой стадии, как, например, на стадии бластоцисты или стадии ранней морулы (то есть стадии 4 клеток или стадии 8 клеток). Получают потомство, способное передавать генетическую модификацию через зародышевую линию. См., например, патент США №7294754, который включен в данный документ посредством ссылки во всей своей полноте для всех целей.[00143] The donor cell can be introduced into the host embryo at any stage, such as the blastocyst stage or early morula stage (ie, 4 cell stage or 8 cell stage). Get offspring capable of transmitting the genetic modification through the germ line. See, for example, US Pat. No. 7,294,754, which is incorporated herein by reference in its entirety for all purposes.

[00144] Альтернативно способ получения животных, отличных от человека, описанный в другом месте данного документа, может предусматривать: (1) модификацию генома эмбриона на стадии одной клетки со встраиванием гуманизированного локуса Asgr1 с использованием описанных выше способов для модификации плюрипотентных клеток; (2) отбор генетически модифицированных эмбрионов; и (3) имплантацию и вынашивание генетически модифицированного эмбриона суррогатной матерью. Получают потомство, способное передавать генетическую модификацию через зародышевую линию.[00144] Alternatively, the method for producing non-human animals described elsewhere herein may include: (1) modifying the single cell stage embryonic genome to insert a humanized Asgr1 locus using the methods described above to modify pluripotent cells; (2) selection of genetically modified embryos; and (3) implantation and gestation of a genetically modified embryo by a surrogate mother. Get offspring capable of transmitting the genetic modification through the germ line.

[00145] Методики переноса ядер можно также использовать для получения животных-млекопитающих, отличных от человека. Вкратце, способы переноса ядер могут предусматривает стадии: (1) энуклеирования ооцита или обеспечения энуклеированного ооцита; (2) выделения или обеспечения донорных клетки или ядра, подлежащих объединению с энуклеированным ооцитом; (3) вставки клетки или ядра в энуклеированный ооцит с получением реконструированной клетки; (4) имплантирования реконструированной клетки в матку животного, отличного от человека, с получением эмбриона и (5) обеспечения возможности развития эмбриона. В таких способах ооциты обычно получают из умерщвленных животных, несмотря на то, что их также можно выделять из маточных труб и/или яичников живых животных. Перед энуклеированием ооциты можно инкубировать в различных хорошо известных средах с целью их созревания. Энуклеирование ооцита можно осуществлять с помощью ряда хорошо известных способов. Вставка донорной клетки или ядра в энуклеированный ооцит с получением реконструированной клетки может быть достигнута с помощью микроинъекции донорной клетки под блестящую оболочку перед слиянием. Слияние можно индуцировать путем применения импульса электрического постоянного тока по отношению к поверхности контакта/слияния (электрослияние), путем воздействия на клетки химических веществ, способствующих слиянию, таких как полиэтиленгликоль, или путем использования инактивированного вируса, такого как вирус Сендай. Реконструированную клетку можно активировать с помощью способов с использованием электричества и/или без использования электричества до, в ходе и/или после слияния ядерного донора и реципиентного ооцита. Способы активации предусматривают электрические импульсы, химически индуцированный шок, внедрение сперматозоида, повышение уровней двухвалентных катионов в ооците и снижение фосфорилирования клеточных белков (например, с помощью ингибиторов киназ) в ооците. Активированные реконструированные клетки или эмбрионы можно культивировать в хорошо известных средах, а затем переносить в матку животного. См., например, US 2008/0092249, WO 1999/005266, US 2004/0177390 и WO 2008/017234 и патент США №7612250, каждый из которых включен посредством ссылки во всей своей полноте для всех целей.[00145] Nuclear transfer techniques can also be used to produce non-human mammalian animals. Briefly, nuclear transfer methods may include the steps of: (1) enucleating an oocyte or providing an enucleated oocyte; (2) isolating or providing donor cells or nuclei to be combined with the enucleated oocyte; (3) inserting a cell or nucleus into an enucleated oocyte to obtain a reconstructed cell; (4) implanting the reshaped cell into the uterus of a non-human animal to produce an embryo; and (5) allowing the embryo to develop. In such methods, oocytes are usually obtained from euthanized animals, although they can also be isolated from the fallopian tubes and/or ovaries of living animals. Prior to enucleation, oocytes can be incubated in a variety of well known media in order to mature them. Enucleation of the oocyte can be accomplished by a number of well known methods. Insertion of a donor cell or nucleus into an enucleated oocyte to obtain a remodeled cell can be achieved by microinjection of the donor cell under the zona pellucida prior to fusion. Fusion can be induced by applying a DC electrical pulse to the contact/fusion surface (electrofusion), by exposing cells to fusion-promoting chemicals such as polyethylene glycol, or by using an inactivated virus such as Sendai virus. The reconstructed cell can be activated by electrical and/or non-electrical methods before, during and/or after the fusion of the nuclear donor and the recipient oocyte. Activation methods include electrical impulses, chemically induced shock, sperm insertion, increased levels of divalent cations in the oocyte, and decreased cellular protein phosphorylation (eg, with kinase inhibitors) in the oocyte. Activated remodeled cells or embryos can be cultured in well known media and then transferred into the uterus of an animal. See, for example, US 2008/0092249, WO 1999/005266, US 2004/0177390 and WO 2008/017234 and US Pat. No. 7,612,250, each of which is incorporated by reference in its entirety for all purposes.

[00146] Различные способы, представленные в данном документе, позволяют получать генетически модифицированное животное F0, отличное от человека, где клетки генетически модифицированного животного F0 содержат гуманизированный локус Asgr1. Необходимо отметить, что в зависимости от способа, используемого для получения животного F0, количество клеток в животном F0, которые имеют гуманизированный локус Asgr1, будет варьироваться. Введение донорных ES-клеток в эмбрион на стадии ранней морулы из соответствующего организма (например, мышиного эмбриона на стадии 8 клеток), например, с помощью способа VELOCIMOUSE® позволяет получать больший процент клеточной популяции животных F0, содержащих клетки, имеющие представляющую интерес нуклеотидную последовательность, содержащую целевую генетическую модификацию. Например, по меньшей мере 50%, 60%), 65%), 70%, 75%), 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% клеточного вклада животного F0, отличного от человека, могут содержать клеточную популяцию, имеющую целевую модификацию.[00146] The various methods provided herein produce a non-human genetically modified F0 animal, wherein the cells of the genetically modified F0 animal contain the humanized Asgr1 locus. It should be noted that depending on the method used to obtain the F0 animal, the number of cells in the F0 animal that have the humanized Asgr1 locus will vary. The introduction of donor ES cells into an early morula embryo from an appropriate organism (e.g., a mouse embryo at the 8 cell stage), for example, using the VELOCIMOUSE® method, allows to obtain a larger percentage of the cell population of F0 animals containing cells having a nucleotide sequence of interest, containing the targeted genetic modification. For example, at least 50%, 60%), 65%), 70%, 75%), 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% of the cellular contribution of the non-human F0 animal may contain a cell population having the target modification.

[00147] Клетки генетически модифицированного животного F0 могут быть гетерозиготными по гуманизированному локусу Asgr1 или могут быть гомозиготными по гуманизированному локусу Asgr1.[00147] The cells of the genetically modified F0 animal may be heterozygous for the humanized Asgr1 locus or may be homozygous for the humanized Asgr1 locus.

[00148] Все патентные заявки, веб-сайты, другие публикации, регистрационные номера и им подобные, упомянутые ранее или ниже, включены посредством ссылки во всей их полноте для всех целей в той же степени, как если бы каждый отдельный элемент был специально и индивидуально указан для включения посредством ссылки. Если разные варианты последовательности связаны с номером доступа в разное время, то подразумевается вариант, связанный с номером доступа на действительную дату подачи настоящей заявки. Действительная дата подачи означает наиболее раннюю действительную дату подачи или дату подачи приоритетной заявки со ссылкой на номер доступа, если это необходимо. Аналогичным образом, если разные варианты публикации, веб-сайта и им подобных опубликованы в разное время, то подразумевается вариант, опубликованный раньше всех на действительную дату подачи, если не указано иное. Любые признак, стадия, элемент, вариант осуществления или аспект настоящего изобретения можно использовать в сочетании с любым другим, если специально не указано иное. Несмотря на то, что с целью ясности понимания настоящее изобретение было описано довольно подробно посредством иллюстраций и примеров, будет очевидно, что определенные изменения и модификации можно осуществлять на практике в пределах объема прилагаемой формулы изобретения.[00148] All patent applications, websites, other publications, serial numbers and the like mentioned above or below are incorporated by reference in their entirety for all purposes to the same extent as if each individual item were specifically and individually indicated for inclusion by reference. If different sequence variants are associated with an access number at different times, then the variant associated with the access number at the actual filing date of this application is implied. Valid filing date means the earliest valid filing date or priority application filing date, with reference to an access number, if applicable. Similarly, if different versions of a publication, website, and the like are published at different times, the earliest published version on the actual filing date is assumed, unless otherwise indicated. Any feature, step, element, embodiment, or aspect of the present invention may be used in conjunction with any other, unless specifically noted otherwise. Although for the purpose of clarity of understanding the present invention has been described in some detail by means of illustrations and examples, it will be obvious that certain changes and modifications can be made in practice within the scope of the appended claims.

КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙBRIEF DESCRIPTION OF SEQUENCES

[00149] Нуклеотидная и аминокислотная последовательности, перечисленные в прилагаемом перечне последовательностей, показаны с использованием стандартных буквенных сокращений для нуклеотидных оснований и трехбуквенного кода для аминокислот. Нуклеотидные последовательности приведены согласно стандартным правилам, начиная с 5'-конца последовательности и продвигаясь вперед (т.е. слева направо в каждой строке) до 3'-конца. Показана только одна нить каждой нуклеотидной последовательности, но считается, что комплементарная цепь включена посредством любой ссылки в представленную последовательность. Аминокислотные последовательности приведены согласно стандартным правилам, начиная с амино-конца последовательности и продвигаясь вперед (то есть слева направо в каждой строке) к карбокси-концу.[00149] The nucleotide and amino acid sequences listed in the accompanying sequence listing are shown using standard letter abbreviations for nucleotide bases and a three-letter code for amino acids. Nucleotide sequences are given according to standard rules, starting at the 5' end of the sequence and moving forward (ie, from left to right on each line) to the 3' end. Only one strand of each nucleotide sequence is shown, but the complementary strand is considered to be included by any reference in the sequence shown. Amino acid sequences are given according to the standard rules, starting from the amino end of the sequence and moving forward (ie from left to right in each line) to the carboxy end.

[00150] Таблица 1. Описание последовательностей[00150] Table 1. Description of sequences

Figure 00000002
Figure 00000002

Figure 00000003
Figure 00000003

ПРИМЕРЫEXAMPLES

Пример 1. Получение мышей, содержащих гуманизированный локус Asgr1Example 1 Generation of mice containing the humanized Asgr1 locus

[00151] Асиалогликопротеиновый рецептор (рецептор Эшвелла, ASGR) представляет собой преимущественно связанный с печеночной мембраной связывающий углеводы белковый рецептор (~33 кДа), относящийся к классу лектиновых рецепторов С-типа. ASGR связывается с гликопротеинами с концевыми галактозными или N-ацетилгалактозаминовыми (GalNac) мотивами. Он может удалять десиалилированные гликопротеины из кровотока с помощью рецептор-опосредованного эндоцитоза. Лиганд подвергается лизосомальному расщеплению, в то время как ASGR возвращается на поверхность клетки. Рецептор представляет собой гетероолигомер из двух субъединиц, ASGR1 и ASGR2 (H1 и Н2). В качестве высокоэффективного специфического для печени рецептора эндоцитоза ASGR1 может быть использован для специфической для печени доставки терапевтических средств, таких как антитела, малые молекулы (в качестве части конъюгатов антитело-лекарственное средство) и ДНК. Однако полученные авторами антитела и биспецифические антитела к внеклеточному домену ASGR1 человека не связываются с ортологом Asgr1 мыши (данные Biacore не показаны). Таким образом, получили гуманизированных по Asgr1 мышей для использования с целью валидации специфической для печени доставки различных терапевтических средств с использованием ряда различных подходов.[00151] The asialoglycoprotein receptor (Ashwell receptor, ASGR) is a predominantly hepatic membrane-bound carbohydrate-binding protein receptor (~33 kDa) belonging to the class of C-type lectin receptors. ASGR binds to glycoproteins with terminal galactose or N-acetylgalactosamine (GalNac) motifs. It can remove desialylated glycoproteins from the bloodstream via receptor-mediated endocytosis. The ligand undergoes lysosomal cleavage while the ASGR returns to the cell surface. The receptor is a heterooligomer of two subunits, ASGR1 and ASGR2 (H1 and H2). As a highly efficient liver-specific endocytosis receptor, ASGR1 can be used for liver-specific delivery of therapeutic agents such as antibodies, small molecules (as part of antibody-drug conjugates), and DNA. However, the antibodies and bispecific antibodies to the extracellular domain of human ASGR1 that we have obtained do not bind to the mouse Asgr1 orthologue (Biacore data not shown). Asgr1 humanized mice were thus prepared for use in validating liver-specific delivery of various therapeutic agents using a number of different approaches.

[00152] Получили крупный нацеливающийся вектор, содержащий 5'-плечо гомологии, содержащее 24 т.о. из bMQ-69B11, и 3'-плечо гомологии, содержащее 67 т.о. из bMQ-69B11, для замены кодирующих экзонов 3-8 (через стоп-кодон и 3'-UTR в последовательность, расположенную непосредственно после 3'-UTR) Asgr1 мыши соответствующей последовательностью ASGR1 человека. Кодируемый белок Asgr1 будет содержать трансмембранный домен Asgr1 мыши, после которого расположен суперспиральный домен и лектиновый домен С-типа человека. См. фигуры 2А и 3. Для получения мутантного аллеля компоненты системы CRISPR/Cas9 вводили в эмбриональные стволовые клетки мыши F1H4 вместе с крупным нацеливающимся вектором. Для выявления потери эндогенного аллеля мыши проводили анализы потери аллеля с использованием праймеров и зондов, приведенных в таблице 2, а для выявления приобретения гуманизированного аллеля проводили анализы приобретения аллеля с использованием праймеров и зондов, приведенных в таблице 3 Анализы потери аллеля и анализы приобретения аллеля описаны, например, в US 2014/0178879; US 2016/0145646; WO 2016/081923 и Frendewey et al. (2010) Methods Enzymol. 476:295-307, которые включены в данный документ посредством ссылки во всей своей полноте для всех целей.[00152] Received a large targeting vector containing a 5'-arm homology containing 24 T. O. from bMQ-69B11, and a 3' homology arm containing 67 kb. from bMQ-69B11, to replace coding exons 3-8 (through the stop codon and 3'-UTR to the sequence immediately following the 3'-UTR) of mouse Asgr1 with the corresponding sequence of human ASGR1. The encoded Asgr1 protein will contain a mouse Asgr1 transmembrane domain followed by a supercoiled domain and a human C-type lectin domain. See Figures 2A and 3. To generate the mutant allele, components of the CRISPR/Cas9 system were introduced into F1H4 mouse embryonic stem cells along with a large targeting vector. To detect endogenous mouse allele loss, allele loss assays were performed using the primers and probes shown in Table 2, and to detect humanized allele acquisition, allele acquisition assays were performed using the primers and probes shown in Table 3. Allele loss assays and allele acquisition assays are described, for example, in US 2014/0178879; US 2016/0145646; WO 2016/081923 and Frendewey et al. (2010) Methods Enzymol. 476:295-307, which are incorporated herein by reference in their entirety for all purposes.

[00153] Таблица 2. Анализы потери мышиного аллеля TAQMAN®[00153] Table 2. Mouse TAQMAN® allele loss assays

Figure 00000004
Figure 00000004

[00154] Таблица 3. Анализы приобретения аллеля человека TAQMAN®[00154] Table 3. Human TAQMAN® Allele Acquisition Assays

Figure 00000005
Figure 00000005

[00155] Затем получали мышей F0 с использованием способа VELOCIMOUSE®. См., например, US 7576259; US 7659442; US 7294754; US 2008/007800 и Poueymirou et al. (2007) Nature Biotech. 25(1):91-99, которые включены в данный документ посредством ссылки во всей своей полноте для всех целей. Часть интрона, расположенного выше кодирующего экзона 3, была также гуманизирована. Всего 1863 п.о. последовательности Asgr1 мыши было заменено на 3907 п.о. последовательности ASGR1 человека. Кассету loxP-hUb1-em7-ген резистентности к гигромицину-сигнал полиаденилирования-mPrm 1-Crei-сигнал полиаденилирования-1охР (5218 п.о.) также вставили ниже 3'-UTR человека с промежуточной последовательностью размером в примерно 190 п.о. Из 3'-последовательности человека 3'-UTR непосредственно перед кассетой. Полученный частично гуманизированный аллель Asgr1 мыши с самоудаляющейся кассетой резистентности к гигромицину изложен под SEQ ID NO: 21 (обозначен как аллель 7302). Граничные участки последовательности А, В и С на фигуре 2А изложены под SEQ ID NO: 18, 19 и 20 соответственно. Сравнение белка ASGR1 человека (SEQ ID NO: 1), белка Asgr1 мыши (SEQ ID NO: 2) и частично гуманизированного белка Asgr1 мыши (SEQ ID NO: 3) показано на фигуре 3.[00155] F0 mice were then generated using the VELOCIMOUSE® method. See, for example, US 7576259; US 7659442; US 7294754; US 2008/007800 and Poueymirou et al. (2007) Nature Biotech. 25(1):91-99, which are incorporated herein by reference in their entirety for all purposes. The portion of the intron upstream of coding exon 3 was also humanized. Total 1863 b.p. the mouse Asgr1 sequence was changed to 3907 bp. human ASGR1 sequences. The cassette loxP-hUb1-em7-hygromycin resistance gene-polyadenylation signal-mPrm 1-Crei-polyadenylation signal-1oxP (5218 bp) was also inserted downstream of the human 3'-UTR with an intermediate sequence of about 190 bp. From the human 3' sequence, the 3' UTR just before the cassette. The resulting partially humanized mouse Asgr1 allele with a self-removing hygromycin resistance cassette is set forth in SEQ ID NO: 21 (designated as allele 7302). The boundary portions of the sequence A, B and C in figure 2A set out under SEQ ID NO: 18, 19 and 20, respectively. Comparison of human ASGR1 protein (SEQ ID NO: 1), mouse Asgr1 protein (SEQ ID NO: 2) and partially humanized mouse Asgr1 protein (SEQ ID NO: 3) is shown in Figure 3.

[00156] После удаления самоудаляющейся кассеты с рекомбиназой Cre, loxP и сайты клонирования (77 п.о.) остаются ниже 3'-UTR человека с промежуточной последовательностью размером в приблизительно 190 п.о. из 3'-последовательности человека после 3'-UTR непосредственно перед оставшимся loxP. См. фигуру 2В. Полученный частично гуманизированный аллель Asgr1 мыши с удаленной кассетой изложен под SEQ ID NO: 24 (обозначен как аллель 7303). Граничные участки последовательности А и С на фигуре 2В изложены под SEQ ID NO: 22 и 23 соответственно.[00156] After removal of the self-removing Cre recombinase cassette, loxP and cloning sites (77 bp) remain below the human 3'-UTR with an intermediate sequence of approximately 190 bp. from the human 3' sequence after the 3'UTR just before the remaining loxP. See Figure 2B. The resulting partially humanized cassette-deleted mouse Asgr1 allele is set forth in SEQ ID NO: 24 (designated allele 7303). Boundary sections of the sequence A and C in figure 2B set out under SEQ ID NO: 22 and 23, respectively.

Пример 2. Валидация мышей, содержащих гуманизированный локус Asgr1Example 2 Validation of mice containing the humanized Asgr1 locus

[00157] Для валидации гуманизированных по Asgr1 мышей (Asgr1hu/hu) в качестве достоверной модели мышей Asgr1hu/hu подвергали фенотипированию, и их фенотип сравнивали с фенотипом однопометников дикого типа. У мышей Asgr1hu/hu не выявляли отличий в уровнях липидов в плазме крови (общий холестерин, триглицериды, HDL-C, LDL-C) по сравнению с однопометниками дикого типа. См. фигуру 4. Аналогичным образом мыши Asgr1hu/hu не демонстрировали отличий в массе тела или уровне глюкозы в крови по сравнению с однопометниками дикого типа. См. фигуру 5. Белок ASGR1 человека был совместно локализован на мембранах клеток печени, аналогично Asgr1 мыши. См. фигуру 6. И в заключение, мыши Asgr1hu/hu экспрессируют белок ASGR1 человека на мембранах клеток печени и характеризуются нормальным липидным профилем в плазме крови.[00157] To validate Asgr1 humanized mice (Asgr1 hu/hu ) as a valid model, Asgr1 hu/hu mice were phenotyped and their phenotype compared to that of wild-type littermates. Asgr1 hu/hu mice showed no difference in plasma lipid levels (total cholesterol, triglycerides, HDL-C, LDL-C) compared to wild-type littermates. See Figure 4. Similarly, Asgr1 hu/hu mice showed no difference in body weight or blood glucose levels compared to wild-type littermates. See Figure 5. The human ASGR1 protein was co-localized to liver cell membranes, similar to mouse Asgr1. See Figure 6. Finally, Asgr1 hu/hu mice express human ASGR1 protein on liver cell membranes and have a normal plasma lipid profile.

СпособыWays

[00158] Оценка уровня циркулирующих в крови липидов у гуманизированных по Asgr1 мышей. Плазму крови от самцов гуманизированных по Asgr1 мышей (Asgr1hu/hu) и их однопометников дикого типа (Asgr1+/+) отбирали натощак и анализировали на содержание липидов в сыворотке крови (триглицериды (TG)), общий холестерин, холестерин липопротеинов низкой плотности (LDL)-C)), холестерин липопротеинов высокой плотности (HDL-C)) с использованием биохимического анализатора сыворотки крови ADVIA® Chemistry ХРТ System (Siemens). N=8/группа, возраст 11 недель. Данные, выраженные в виде среднего значения ± SEM для каждого.[00158] Evaluation of circulating lipid levels in Asgr1 humanized mice. Plasma from male Asgr1 humanized mice (Asgr1 hu/hu ) and their wild-type littermates (Asgr1 +/+ ) was collected on an empty stomach and analyzed for serum lipids (triglycerides (TG)), total cholesterol, low-density lipoprotein cholesterol ( LDL)-C)), high-density lipoprotein cholesterol (HDL-C)) using an ADVIA® Chemistry XPT System (Siemens) serum biochemical analyzer. N=8/group, age 11 weeks. Data expressed as mean ± SEM for each.

[00159] Оценка уровня глюкозы в крови. Глюкозу крови измеряли в крови, отобранной из кончика хвоста, используя глюкометр Accu-Chek (Roche) натощак (16-часовое голодание) и после еды (не натощак).[00159] Blood glucose assessment. Blood glucose was measured in blood collected from the tip of the tail using an Accu-Chek (Roche) glucometer on an empty stomach (16-hour fast) and after a meal (not on an empty stomach).

[00160] Оценка Asgr1 с помощью вестерн-блоттинга. Цельную печень отбирали у гуманизированных по Asgr1 мышей и мышей WT (n=8/генотип) и хранили замороженной при 80°С до обработки. Для каждого образца из цельной печени вырезали кусочек замороженной печени весом ~40 мг, и каждый кусочек помещали в гомогенизатор Даунса и гомогенизировали до получения однородной суспензии. Цитозольные фракции и мембранные фракции каждого образца печени разделяли с использованием коммерческого набора на основе детергента (Thermo #89842) в соответствии с протоколом для «мягких тканей» производителя. После того, как выделили цитозольную фракцию и мембранную фракцию каждого образца, проводили анализ количественного определения белка ВСА (Thermo #23225) для двух фракций из каждого образца в соответствии с протоколом набора для процедуры с микропланшетом. Образцы для вестерн-блоттинга готовили для каждой цитозольной фракции и мембранной фракции каждого образца, используя 5Х восстанавливающий краситель. Все образцы готовили при 0,8 мкг/мкл, и 20 мкг общего белка из каждого образца загружали в гели для вестерн-блоттинга. hASGR1 выявляли с использованием кроличьего поликлонального антитела к hASGR1 (Abgent #АР16133а, в разведении 1:1000 в 2,5% блокирующем молоке в TBS-T). Поскольку антитело проявляло перекрестную реактивность с белком мыши, Asgr1 мыши у однопометных мышей был выявлен с использованием того же самого антитела. Вторичное антитело для выявления hASGR1 представляло собой ослиное антитело к кроличьему IgG-HRP (Jackson #711-035-152, в концентрации 0,1 мкг/мл в 2,5% блокирующем молоке в TBS-T). В качестве загрузочного контроля для цитозольных фракций GAPDH обнаружили во всех образцах с использованием кроличьего моноклонального антитела к GAPDH (Cell Signaling #2118S, в разведении 1:10000 в 2,5% блокирующем молоке в TBS-T). Вторичное антитело для выявления GAPDH представляло собой ослиное антитело к кроличьему IgG-HRP (Jackson #711-035-152, в концентрации 0,1 мкг/мл в 2,5% блокирующем молоке в TBS-T). В качестве загрузочного контроля для мембранных фракций рецептор трансферрина выявляли во всех образцах, используя кроличье поликлональное антитело к рецептору трансферрина (R&D #AF2472, в концентрации 0,25 мкг/мл в 2,5% блокирующем молоке в TBS-T). Вторичное антитело для определения рецептора трансферрина представляло собой ослиное антитело к козьему IgG-HRP (Jackson #705-035-147, в концентрации 0,2 мкг/мл в 2,5%) блокирующем молоке в TBS-T).[00160] Western blotting of Asgr1. Whole livers were harvested from Asgr1 humanized and WT mice (n=8/genotype) and stored frozen at 80° C. until processing. For each whole liver sample, a piece of frozen liver weighing ~40 mg was cut out and each piece was placed in a Dounce homogenizer and homogenized until a homogeneous suspension was obtained. The cytosolic and membrane fractions of each liver sample were separated using a commercial detergent kit (Thermo #89842) according to the manufacturer's soft tissue protocol. After the cytosolic fraction and the membrane fraction of each sample were isolated, BCA protein quantitation (Thermo #23225) was analyzed for two fractions from each sample according to the microplate procedure kit protocol. Western blot samples were prepared for each cytosolic fraction and membrane fraction of each sample using 5X reduction dye. All samples were prepared at 0.8 μg/μl and 20 μg total protein from each sample was loaded onto western blot gels. hASGR1 was detected using an anti-hASGR1 rabbit polyclonal antibody (Abgent #AP16133a, diluted 1:1000 in 2.5% blocking milk in TBS-T). Because the antibody was cross-reactive with mouse protein, mouse Asgr1 in litter mice was detected using the same antibody. The secondary antibody for hASGR1 detection was donkey anti-rabbit IgG-HRP (Jackson #711-035-152, at 0.1 μg/ml in 2.5% blocking milk in TBS-T). As a loading control for cytosolic fractions, GAPDH was detected in all samples using a rabbit anti-GAPDH monoclonal antibody (Cell Signaling #2118S, diluted 1:10,000 in 2.5% blocking milk in TBS-T). The secondary antibody for GAPDH detection was donkey anti-rabbit IgG-HRP (Jackson #711-035-152, at 0.1 μg/ml in 2.5% blocking milk in TBS-T). As a loading control for membrane fractions, transferrin receptor was detected in all samples using a rabbit polyclonal anti-transferrin receptor antibody (R&D #AF2472, at a concentration of 0.25 μg/ml in 2.5% blocking milk in TBS-T). The secondary antibody for transferrin receptor detection was donkey anti-goat IgG-HRP (Jackson #705-035-147, at 0.2 μg/mL in 2.5%) blocking milk in TBS-T).

Пример 3. Получение векторов на основе аденоассоциированного вируса с гетерологичным эпитопомExample 3. Obtaining vectors based on adeno-associated virus with a heterologous epitope

[00161] Затем проводили эксперимент с целью определения того, может ли биспецифическое антитело к myc-ASGR1 перенацеливать вирусные частицы scAAV-N587myc на клетки печени, экспрессирующие гуманизированный ASGR1, in vivo у мышей, полученных в примере 1. Чтобы это проверить, сначала получили вирусные частицы.[00161] An experiment was then performed to determine if the myc-ASGR1 bispecific antibody could retarget scAAV-N587myc viral particles to liver cells expressing humanized ASGR1 in vivo in mice obtained in Example 1. To test this, viral particles.

[00162] Капсидные белки AAV модифицировали таким образом, чтобы они содержали один из нескольких гетерологичных эпитопов: FLAG, c-myc, гексагистидин и т.д., с помощью ПЦР с получением плазмиды, кодирующей рекомбинантный капсидный белок. Вкратце, осуществляли вставку последовательности, кодирующей FLAG, c-myc или гексагистидин, в рамку после кодона, кодирующего N587 AAV2 или Q585 капсидного белка VP1 AAV6.[00162] AAV capsid proteins were modified to contain one of several heterologous epitopes: FLAG, c-myc, hexahistidine, etc. by PCR to obtain a plasmid encoding the recombinant capsid protein. Briefly, the sequence encoding FLAG, c-myc or hexahistidine was inserted in-frame after the codon encoding AAV2 N587 or Q585 of the AAV6 VP1 capsid protein.

[00163] Продуцирование аденоассоциированных вирусов осуществляли с использованием способа тройной трансфекции клеток HEK293 (см., например, Erik Arden and Joseph M. Metzger, J Biol Methods. 2016; 3(2)). Клетки высевали за один день до PEFpro-опосредованной (Polyplus transfection, Нью-Йорк, штат Нью-Йорк) трансфекции соответствующими векторами:[00163] Production of adeno-associated viruses was performed using the HEK293 cell triple transfection method (see, for example, Erik Arden and Joseph M. Metzger, J Biol Methods. 2016; 3(2)). Cells were seeded one day prior to PEFpro-mediated (Polyplus transfection, New York, NY) transfection with the appropriate vectors:

- хелперной плазмидой, pHelper (Agilent, кат. №240074);- helper plasmid, pHelper (Agilent, Cat. No. 240074);

- плазмидой, кодирующей ген rep/cap AAV дикого типа или модифицированный (pAAV RC2 (Cell biolabs, кат. № VPK-422)), например, pAAV RC2/6 (Cell Biolabs, кат. № VPK-426), pAAV RC2-N587myc, pAAV RC2/6-Q585myc и т.д.; и- a plasmid encoding the wild-type or modified AAV rep/cap gene (pAAV RC2 (Cell biolabs, Cat. No. VPK-422)), for example, pAAV RC2/6 (Cell Biolabs, Cat. No. VPK-426), pAAV RC2- N587myc, pAAV RC2/6-Q585myc, etc.; And

- плазмидой, кодирующей представляющую интерес нуклеотидную последовательность и последовательности ITR AAV, например, pscAAV-CMV-eGFP, pAAV-CMVGFP (Agilent, кат. №240074), pAAV-EF 1a-eGFP или pAAV-CAGG-eGFP и т.д.- a plasmid encoding the AAV nucleotide sequence and ITR sequences of interest, e.g. pscAAV-CMV-eGFP, pAAV-CMVGFP (Agilent cat. no. 240074), pAAV-EF 1a-eGFP or pAAV-CAGG-eGFP, etc.

[00164] Через семьдесят два часа после трансфекции среду собирали и клетки лизировали в буфере [50 мМ Tris-HCl, 150 мМ NaCl и 0,5% дезоксихолата натрия (Sigma, кат. № D6750-100G)]. Затем перед инкубацией при 37°С в течение 60 минут бензоназу (Sigma, Сент-Луис, штат Миссури) добавляли как к среде, так и к клеточному лизату до конечной концентрации 0,5 ед./мкл. Клеточный лизат центрифугировали при 4000 об/мин в течение 30 мин. Клеточный лизат и среду объединяли и осаждали с помощью PEG 8000 (Teknova, кат. № Р4340) в конечной концентрации 8%. Осадок ресуспендировали в 400 мМ NaCl и центрифугировали при 10000 g в течение 10 минут. Вирусы в надосадочной жидкости осаждали ультрацентрифугированием при 149000 g в течение 3 часов и титровали с использованием qPCR.[00164] Seventy-two hours after transfection, medium was harvested and cells were lysed in buffer [50 mM Tris-HCl, 150 mM NaCl, and 0.5% sodium deoxycholate (Sigma, cat. no. D6750-100G)]. Then, prior to incubation at 37° C. for 60 minutes, benzonase (Sigma, St. Louis, MO) was added to both the medium and the cell lysate to a final concentration of 0.5 U/μl. The cell lysate was centrifuged at 4000 rpm for 30 min. Cell lysate and medium were combined and precipitated with PEG 8000 (Teknova, cat. no. P4340) at a final concentration of 8%. The pellet was resuspended in 400 mM NaCl and centrifuged at 10,000 g for 10 minutes. Viruses in the supernatant were pelleted by ultracentrifugation at 149,000 g for 3 hours and titrated using qPCR.

[00165] При qPCR для титрования геномов AAV образцы AAV обрабатывали ДНКазой I (Thermofisher Scientific, кат. № EN0525) при 37°С в течение одного часа и лизировали с использованием набора DNA extract All Reagents (Thermofisher Scientific, кат. №4403319). Капсидированные вирусные геномы определяли количественно, используя систему для ПЦР в режиме реального времени QuantStudio 3 Real-Time PCR System (Thermofisher Scientific) с применением праймеров для ITR AAV2. Последовательности праймеров для ITR AAV2 представляют собой 5'-GGAACCCCTAGTGATGGAGTT-3' (прямой праймер для ITR; SEQ ID NO: 36) и 5'-CGGCCTCAGTGAGCGA-3' (обратный праймер для ITR; SEQ ID NO: 37) (Aurnhammer et al., 2012), полученные на основе последовательности левого внутреннего инвертированного повтора (ITR) из AAV и последовательности правого внутреннего инвертированного повтора (ITR) из AAV соответственно. Последовательность зонда для ITR AAV2 представляет собой 5'-6-FAM-CACTCCCTCTCTGCGCGCTCG-TAMRA-3' (SEQ ID NO: 38) (Aurnhammer et al. (2012) Hum. Gene Ther. Methods 23:18 28). После стадии активации при 95°С в течение 10 минут проводили двухстадийный цикл ПЦР при 95°С в течение 15 секунд и 60°С в течение 30 секунд в течение 40 циклов. Универсальный мастер-микс для ПЦР TaqMan (Thermofisher Scientific, кат. №4304437) использовали для qPCR. ДНК-плазмиду (Agilent, кат.№240074) использовали в качестве стандарта для определения абсолютных титров.[00165] In a qPCR titration of AAV genomes, AAV samples were treated with DNase I (Thermofisher Scientific, cat. no. EN0525) at 37° C. for one hour and lysed using the DNA extract All Reagents kit (Thermofisher Scientific, cat. no. 4403319). Encapsulated viral genomes were quantified using the QuantStudio 3 Real-Time PCR System (Thermofisher Scientific) using AAV2 ITR primers. The AAV2 ITR primer sequences are 5'-GGAACCCCTAGTGATGGAGTT-3' (forward primer for ITR; SEQ ID NO: 36) and 5'-CGGCCTCAGTGAGCGA-3' (reverse primer for ITR; SEQ ID NO: 37) (Aurnhammer et al ., 2012) derived from the left internal inverted repeat (ITR) sequence from AAV and the right internal inverted repeat (ITR) sequence from AAV, respectively. The probe sequence for AAV2 ITR is 5'-6-FAM-CACTCCCTCTCTGCGCGCTCG-TAMRA-3' (SEQ ID NO: 38) (Aurnhammer et al. (2012) Hum. Gene Ther. Methods 23:18 28). After the activation step at 95°C for 10 minutes, a two-stage PCR cycle was performed at 95°C for 15 seconds and 60°C for 30 seconds for 40 cycles. TaqMan Universal PCR Master Mix (Thermofisher Scientific, cat. no. 4304437) was used for qPCR. Plasmid DNA (Agilent, Cat. No. 240074) was used as a standard for determining absolute titers.

[00166] Получали векторы на основе аденоассоциированного вируса, содержащие капсид со вставленным эпитопом c-myc. В данном примере эпитоп c-myc (EQKLISEEDL; SEQ ID NO: 25) вставляли между аминокислотами N587 и R588 капсидного белка VP1 AAV2, т.е. нуклеотидную последовательность, кодирующую эпитоп c-myc (GAA CAA AAA CTC АТС TCA GAA GAG GAT CTG; SEQ ID NO: 26), вставляли в плазмиду pAAV RC2 (Cell Biolabs, Inc., Сан-Диего, Калифорния, США), и модифицированную плазмиду pAAV RC2-N587Myc использовали для кодирования модифицированного капсидного белка для вирусных векторов на основе AAV с нейтрализованным тропизмом.[00166] Received vectors based on adeno-associated virus containing a capsid with an inserted c-myc epitope. In this example, a c-myc epitope (EQKLISEEDL; SEQ ID NO: 25) was inserted between amino acids N587 and R588 of the VP1 AAV2 capsid protein, i. the nucleotide sequence encoding the c-myc epitope (GAA CAA AAA CTC ATC TCA GAA GAG GAT CTG; SEQ ID NO: 26) was inserted into the pAAV RC2 plasmid (Cell Biolabs, Inc., San Diego, CA, USA), and modified pAAV RC2-N587Myc plasmid was used to encode a modified capsid protein for tropism neutralized AAV viral vectors.

[00167] В частности, первый продукт полимеразной цепной реакции (ПЦР), содержащий (от 5' к 3') сайт рестрикции BsiWl, нуклеотидную последовательность между положениями 3050 и 3773 pAAV RC2 и нуклеотидную последовательность эпитопа c-myc с «липкими» концами, и второй продукт ПЦР, содержащий (от 5' к 3') нуклеотидную последовательность эпитопа c-myc с «липкими» концами, нуклеотидную последовательность между положениями 3774 и 4370 pAAV RC2 и сайт рестрикции Pme1, получали с использованием праймеров, изложенных в таблице 4. Плазмиду pAAV RC2-N587Myc (т.е. плазмиду pAAV RC2, модифицированную для кодирования эпитопа c-myc между аминокислотами N587 и R588 капсидного белка VP1) создавали путем расщепления pAAV RC2 с помощью BsiW1 (New England Biolabs, R0553L) и Pmel (New England Biolabs, R0560L) и вставки двух продуктов ПЦР посредством клонирования, независимого от лигирования, описанного в Li et al. (2012) Methods Mol. Biol. 852:51-59.[00167] Specifically, a first polymerase chain reaction (PCR) product containing (5' to 3') a BsiWl restriction site, a nucleotide sequence between positions 3050 and 3773 of pAAV RC2, and a nucleotide sequence of a c-myc epitope with sticky ends, and a second PCR product containing (from 5' to 3') the nucleotide sequence of the c-myc epitope with sticky ends, the nucleotide sequence between positions 3774 and 4370 of pAAV RC2, and the Pme1 restriction site was generated using the primers set forth in Table 4. Plasmid pAAV RC2-N587Myc (i.e., pAAV RC2 plasmid modified to encode the c-myc epitope between amino acids N587 and R588 of the VP1 capsid protein) was generated by digesting pAAV RC2 with BsiW1 (New England Biolabs, R0553L) and Pmel (New England Biolabs, R0560L) and inserting two PCR products by ligation-independent cloning as described in Li et al. (2012) Methods Mol. Biol. 852:51-59.

[00168] Таблица 4[00168] Table 4

Figure 00000006
Figure 00000006

[00169] В частности, фрагмент ДНК gblock, содержащий положения 3700 и 3940 из pAAV RC2/6 с последовательностью эпитопа c-myc, вставленной между 3757 и 3758, заказали в Integrated DNA Technologies (Коралвилль, Айова). Плазмиду pAAV RC2/6-Q585Myc создавали путем вставки фрагмента gblock в pAAV RC2/6, расщепленную с помощью MscI (New England Biolabs, кат. № R0534L) и AflII (New England Biolabs, кат. № R0520L) посредством клонирования, независимого от лигирования, описанного в Li et al. (2012) Methods Mol. Biol. 852:51-59.[00169] Specifically, a gblock DNA fragment containing positions 3700 and 3940 from pAAV RC2/6 with a c-myc epitope sequence inserted between 3757 and 3758 was ordered from Integrated DNA Technologies (Coralville, Iowa). Plasmid pAAV RC2/6-Q585Myc was generated by inserting a gblock fragment into pAAV RC2/6 digested with MscI (New England Biolabs cat. no. R0534L) and AflII (New England Biolabs cat. no. R0520L) by ligation-independent cloning described in Li et al. (2012) Methods Mol. Biol. 852:51-59.

[00170] В частности, pscAAV-CMV-eGFP получали путем введения фрагмента GFP в вектор pscAAV MCS (Cell Biolabs, кат. № VPK-430) с использованием сайта рестрикции для BamHI и NotI. Плазмиду pAAV-EF1a-eGFP и pAAV-CAGG-eGFP синтезировали de novo в Thermofisher Scientific (Уолтем, Массачусетс).[00170] In particular, pscAAV-CMV-eGFP was generated by introducing a GFP fragment into the pscAAV MCS vector (Cell Biolabs, cat. no. VPK-430) using a restriction site for BamHI and NotI. Plasmid pAAV-EF1a-eGFP and pAAV-CAGG-eGFP were synthesized de novo at Thermofisher Scientific (Waltham, MA).

Пример 4. Опосредованная биспецифическими антителами интернализация частиц scAAV-N587Myc у мышей с гуманизированным локусом ASGR1 in vivoExample 4 Bispecific Antibody Mediated Internalization of scAAV-N587Myc Particles in Mice with a Humanized ASGR1 Loci in Vivo

[00171] Чтобы определить, может ли биспецифическое антитело к myc-ASGR1 перенацеливать вирусные векторы scAAV2-N587myc-CMV-eGFP на экспрессирующие hASGR1 клетки печени in vivo, мышам, генетически модифицированным таким образом, что их клетки печени экспрессируют hASGR1 на фоне C57BL/6, и контрольным мышам C57BL/6 дикого типа внутрисосудисто вводили 1×1011 (титрованных с помощью qPCR) только scAAV2-CMV-eGFP дикого типа или вирусных векторов scAAV2-N587myc-CMV-eGFP в комбинации с биспецифическим антителом к myc-ASGR1 при соотношении 1:8 вирусного генома и молекул антитела. Контроль включал мышей с введением им физиологического раствора [250 мМ NaCl] или только вирусного вектора scAAV2-N587myc-CMV-eGFP. Через десять дней после инъекции мышей умерщвляли и проводили транскардиальную перфузию с использованием 4% PFA. Отбирали такие органы, как печень, почки и сердце, и их дегидратировали в 15% сахарозе, а затем в 30% сахарозе. Затем из органов получали криосрезы на предметных стеклах, и их окрашивали с использованием куриного антитела к EGFP (Jackson ImmunoResearch Labs, Inc., Уэст Гроув, Пенсильвания, США) и вторичного антитела к куриному антителу, конъюгированного с Alexa-488 (Jackson ImmunoResearch Labs, Inc., Уэст Гроув, Пенсильвания), (фигуры 8А - 8С). GFP-положительные клетки выявили в печени трансгенных животных, модифицированных для экспрессии ASGR1 в печени и получивших инъекцию scAAV2-CMV-eGFP дикого типа или scAAV2-N587myc-CMV-eGFP в комбинации с биспецифическим антителом к myc-ASGR1 (фигуры 8A(i) и 8A(iv)), и в печени мышей C57BL/6 дикого типа, получивших инъекцию scAAV2-CMV-eGFP дикого типа (фигура 8A(v)). GFP не выявили ни в образцах селезенки или почек (фигуры 8 В и 8С), ни в образцах печени, селезенки или почек, отобранных у любого животного, которым инъецировали физиологический раствор или только вирусные векторы scAAV2-N587myc-CMV-eGFP (фигуры 8A(ii, iii, vi, vii)), ни в образцах печени, отобранных у животных C57BL/6 дикого типа, которым инъецировали scAAV2-N587myc-CMV-eGFP в комбинации с биспецифическим антителом к myc-ASGR1 (фигура 8A(viii)). Таким образом, комбинация вирусных векторов scAAV2-N587myc-CMV-eGFP и биспецифического антитела к myc-ASGR1 инфицировала только те клетки (печени), которые экспрессируют hASGR1, убедительно свидетельствуя о том, что вирусный вектор scAAV2-CMV-eGFP инактивировался модификацией капсидного белка, например, природный тропизм вирусного вектора на основе scAAV может быть нейтрализован, например, с помощью эпитопа c-myc, при этом такие вирусные векторы могут быть специфически повторно активированы, например, специфически перенацелены, например, на клетки печени in vivo, например, с помощью биспецифических антител к myc-ASGR1.[00171] To determine if an anti-myc-ASGR1 bispecific antibody can retarget scAAV2-N587myc-CMV-eGFP viral vectors to hASGR1-expressing liver cells in vivo in mice genetically engineered such that their liver cells express hASGR1 in the presence of C57BL/6 , and wild-type C57BL/6 control mice were intravascularly injected with 1×10 11 (titrated with qPCR) wild-type scAAV2-CMV-eGFP alone or scAAV2-N587myc-CMV-eGFP viral vectors in combination with myc-ASGR1 bispecific antibody at a ratio of 1:8 viral genome and antibody molecules. Controls included mice treated with saline [250 mM NaCl] or scAAV2-N587myc-CMV-eGFP viral vector alone. Ten days after injection, mice were sacrificed and transcardially perfused using 4% PFA. Organs such as liver, kidney and heart were harvested and dehydrated in 15% sucrose and then in 30% sucrose. Organs were then cryosectioned on glass slides and stained with chicken anti-EGFP antibody (Jackson ImmunoResearch Labs, Inc., West Grove, PA, USA) and secondary antibody to chicken antibody conjugated to Alexa-488 (Jackson ImmunoResearch Labs, Inc., West Grove, Pennsylvania) (Figures 8A-8C). GFP-positive cells were detected in the liver of transgenic animals modified to express ASGR1 in the liver and injected with wild-type scAAV2-CMV-eGFP or scAAV2-N587myc-CMV-eGFP in combination with an anti-myc-ASGR1 bispecific antibody (Figures 8A(i) and 8A(iv)), and in the liver of wild-type C57BL/6 mice injected with wild-type scAAV2-CMV-eGFP (Figure 8A(v)). GFP was not detected in either spleen or kidney samples (Figures 8B and 8C), nor in liver, spleen or kidney samples taken from any animal injected with saline or the scAAV2-N587myc-CMV-eGFP viral vectors alone (Figures 8A( ii, iii, vi, vii)), nor in liver samples taken from wild-type C57BL/6 animals injected with scAAV2-N587myc-CMV-eGFP in combination with an anti-myc-ASGR1 bispecific antibody (Figure 8A(viii)). Thus, the combination of the scAAV2-N587myc-CMV-eGFP viral vectors and the myc-ASGR1 bispecific antibody only infected those (liver) cells expressing hASGR1, strongly suggesting that the scAAV2-CMV-eGFP viral vector was inactivated by capsid protein modification, for example, the natural tropism of a scAAV-based viral vector can be neutralized, for example, with a c-myc epitope, and such viral vectors can be specifically reactivated, for example, specifically retargeted, for example, to liver cells in vivo, for example, with bispecific antibodies to myc-ASGR1.

[00172] Аналогично, чтобы определить, могут ли биспецифические антитела к myc-ASGR1 перенацеливать вирусные векторы ssAAV2-N587myc-CAGG-eGFP на экспрессирующие hASGR1 клетки печени in vivo, мышам, генетически модифицированным таким образом, что их клетки печени экспрессируют hASGR1 на фоне C57BL/6, и контрольным мышам C57BL/6 дикого типа внутрисосудисто вводили 2,18×1011 (титрованных с помощью qPCR) только ssAAV2-CAGG-eGFP дикого типа или вирусных векторов ssAAV2-N587myc-CAGG-eGFP в комбинации с биспецифическим антителом к myc-ASGR1 при соотношении 1:4 вирусного генома и молекул антитела. Контроли включали мышей с введением им PBS или только вирусного вектора ssAAV2-N587myc-CAGG-eGFP. Через четыре недели после инъекции мышей умерщвляли и проводили транскардиальную перфузию с использованием 4% PFA. Отбирали такие органы, как печень, почки и сердце, и их дегидратировали в 15% сахарозе, а затем в 30% сахарозе. Затем из органов получали криосрезы на предметных стеклах, и их окрашивали с использованием куриного антитела к EGFP (Jackson ImmunoResearch Labs, Inc., Уэст Гроув, Пенсильвания, США) и вторичного антитела к куриному антителу, конъюгированного с Alexa-488 (Jackson ImmunoResearch Labs, Inc., Уэст Гроув, Пенсильвания), (фигуры 9А - 90). GFP-положительные клетки выявили в печени трансгенных животных, модифицированных для экспрессии ASGR1 в печени и получивших инъекцию ssAAV2-CAGG-eGFP дикого типа или ssAAV2-N587myc-CAGG-eGFP в комбинации с биспецифическим антителом к myc-ASGR1 (фигуры 9Е - 9F, 9Р - 9R), и в печени мышей C57BL/6 дикого типа, получивших инъекцию ssAAV2-CAGG-eGFP дикого типа (фигура 9В - 9С). Неожиданно, но эффективность инфицирования ssAAV2-N587myc-CAGG-eGFP в комбинации с биспецифическим антителом к myc-ASGR1 намного выше, чем у WT ssAAV2-CAGG-GFP (фигуры 9Е - 9F, 9P - 9R). GFP не выявляли или практически не выявляли ни в образцах печени от любого животного, которым инъецировали физиологический раствор или только вирусный вектор ssAAV2-N587myc-CAGG-eGFP (фигуры 9А, 9D, 9G-9L)), ни в образцах печени, отобранных у животных C57BL/6 дикого типа, которым инъецировали ssAAV2-N587myc-CAGG-eGFP в комбинации с биспецифическим антителом к myc-ASGR1 (фигура 9М - 90). Таким образом, комбинация вирусных векторов scAAV2-N587myc-CAGG-eGFP и биспецифического антитела к myc-ASGR1 инфицировала только те клетки (печени), которые экспрессируют hASGR1, убедительно свидетельствуя о том, что вирусный вектор ssAAV2-N587myc-CAGG-eGFP инактивировался модификацией капсидного белка, например, природный тропизм вирусного вектора на основе scAAV может быть нейтрализован, например, с помощью эпитопа c-myc, при этом такие вирусные векторы могут быть специфически повторно активированы, например, специфически перенацелены, например, на клетки печени in vivo, например, с помощью биспецифических антител к myc-ASGR1.[00172] Similarly, to determine whether anti-myc-ASGR1 bispecific antibodies can retarget ssAAV2-N587myc-CAGG-eGFP viral vectors to hASGR1-expressing liver cells in vivo, mice genetically modified such that their liver cells express hASGR1 in the presence of C57BL /6, and wild-type C57BL/6 control mice were intravascularly injected with 2.18×10 11 (titrated by qPCR) wild-type ssAAV2-CAGG-eGFP alone or ssAAV2-N587myc-CAGG-eGFP viral vectors in combination with a bispecific antibody to myc -ASGR1 at a ratio of 1:4 of the viral genome and antibody molecules. Controls included mice treated with PBS or the ssAAV2-N587myc-CAGG-eGFP viral vector alone. Four weeks after injection, mice were sacrificed and transcardially perfused using 4% PFA. Organs such as liver, kidney and heart were harvested and dehydrated in 15% sucrose and then in 30% sucrose. Organs were then cryosectioned on glass slides and stained with chicken anti-EGFP antibody (Jackson ImmunoResearch Labs, Inc., West Grove, PA, USA) and secondary antibody to chicken antibody conjugated to Alexa-488 (Jackson ImmunoResearch Labs, Inc., West Grove, PA) (Figures 9A-90). GFP-positive cells were detected in the liver of transgenic animals modified to express ASGR1 in the liver and injected with wild-type ssAAV2-CAGG-eGFP or ssAAV2-N587myc-CAGG-eGFP in combination with an anti-myc-ASGR1 bispecific antibody (Figures 9E-9F, 9P - 9R), and in the liver of wild-type C57BL/6 mice injected with wild-type ssAAV2-CAGG-eGFP (Figure 9B - 9C). Surprisingly, the efficiency of infection with ssAAV2-N587myc-CAGG-eGFP in combination with an anti-myc-ASGR1 bispecific antibody is much higher than with WT ssAAV2-CAGG-GFP (Figures 9E-9F, 9P-9R). GFP was not detected or practically not detected either in liver samples from any animal injected with saline or only with the ssAAV2-N587myc-CAGG-eGFP viral vector (Figures 9A, 9D, 9G-9L)), nor in liver samples taken from animals C57BL/6 wild-type, which were injected with ssAAV2-N587myc-CAGG-eGFP in combination with bispecific antibody to myc-ASGR1 (figure 9M - 90). Thus, the combination of the scAAV2-N587myc-CAGG-eGFP viral vectors and the myc-ASGR1 bispecific antibody infected only those cells (liver) expressing hASGR1, strongly suggesting that the ssAAV2-N587myc-CAGG-eGFP viral vector was inactivated by modification of the capsid protein, e.g., the natural tropism of a scAAV-based viral vector can be neutralized, e.g., by a c-myc epitope, and such viral vectors can be specifically reactivated, e.g. using bispecific antibodies to myc-ASGR1.

[00173] Данный пример демонстрирует, что гуманизированные по ASGR1 мыши могут использоваться для тестирования потенциальных терапевтических средств, которые специфически связываются с ASGR1 человека для целевой доставки в клетки печени.[00173] This example demonstrates that ASGR1 humanized mice can be used to test potential therapeutics that specifically bind to human ASGR1 for targeted delivery to liver cells.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ SEQUENCE LIST

110 Регенерон Фармасьютикалс, Инк.110 Regeneron Pharmaceuticals, Inc.

Муджика, Алехо Mujika, Alejo

Гусаров, Виктория Gusarov, Victoria

Ванг, Ченг Wang, Cheng

Киратсус, Христос Kyratsus, Christ

Потоки, Терра Streams, Terra

Сигнар, Кэтрин Signar, Katherine

Мартин, Джоел Martin, Joel

120 ЖИВОТНЫЕ, ОТЛИЧНЫЕ ОТ ЧЕЛОВЕКА, СОДЕРЖАЩИЕ ГУМАНИЗИРОВАННЫЙ ЛОКУС ASGR1120 NON-HUMAN ANIMALS CONTAINING THE HUMANIZED ASGR1 LOCUS

130 009108.362WO1130 009108.362WO1

150 62525,524150 62525.524

151 2017-06-27151 2017-06-27

160 42 160 42

170 Patent In версии 3.5170 Patent In version 3.5

210 1210 1

211 291211 291

212 БЕЛОК212 PROTEIN

213 Homosapiens213

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (1)..(40)222 (1)..(40)

223 Цитоплазматический домен223 Cytoplasmic domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (41)..(61)222 (41)..(61)

223 Трансмембранный домен223 Transmembrane domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (61)..(123)222 (61)..(123)

223 Суперспиральный домен223 Supercoiled domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (161)..(278)222 (161)..(278)

223 Лектиновый домен С-типа223 C-type lectin domain

400 1400 1

Met Thr Lys Glu Tyr Gln Asp Leu Gln His Leu Asp Asn Glu Glu SerMet Thr Lys Glu Tyr Gln Asp Leu Gln His Leu Asp Asn Glu Glu Ser

1 5 10 15 1 5 10 15

Asp His His Gln Leu Arg Lys Gly Pro Pro Pro Pro Gln Pro Leu Leu Asp His His Gln Leu Arg Lys Gly Pro Pro Pro Pro Gln Pro Leu Leu

20 25 30 20 25 30

Gln Arg Leu Cys Ser Gly Pro Arg Leu Leu Leu Leu Ser Leu Gly Leu Gln Arg Leu Cys Ser Gly Pro Arg Leu Leu Leu Leu Ser Leu Gly Leu

35 40 45 35 40 45

Ser Leu Leu Leu Leu Val Val Val Cys Val Ile Gly Ser Gln Asn Ser Ser Leu Leu Leu Leu Val Val Val Cys Val Ile Gly Ser Gln Asn Ser

50 55 60 50 55 60

Gln Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Phe Ser Asn Phe Gln Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Phe Ser Asn Phe

65 70 75 80 65 70 75 80

Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Gly Gly Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Gly Gly

85 90 95 85 90 95

Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Lys Gln Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Lys Gln

100 105 110 100 105 110

Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Val Lys Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Val Lys

115 120 125 115 120 125

Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Ala Leu Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Ala Leu

130 135 140 130 135 140

Gln Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Val Asn Trp Val Glu Gln Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Val Asn Trp Val Glu

145 150 155 160 145 150 155 160

His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala

165 170 175 165 170 175

Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val

180 185 190 180 185 190

Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val

195 200 205 195 200 205

Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val

210 215 220 210 215 220

Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln

225 230 235 240 225 230 235 240

Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala

245 250 255 245 250 255

His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro

260 265 270 260 265 270

Tyr Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Glu Pro Tyr Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Glu Pro

275 280 285 275 280 285

Pro Leu Leu Pro Leu Leu

290 290

210 2210 2

211 284211 284

212 PRT212 PRT

213 Mus musculus213 Mus muscle

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (1)..(39)222(1)..(39)

223 Цитоплазматический домен223 Cytoplasmic domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (40)..(60)222 (40)..(60)

223 Трансмембранный домен223 Transmembrane domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (60)..(122)222 (60)..(122)

223 Суперспиральный домен223 Supercoiled domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (160)..(277)222 (160)..(277)

223 Лектиновый домен С-типа223 C-type lectin domain

400 2400 2

Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Asp Asn Asp Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Asp Asn Asp

1 5 10 15 1 5 10 15

His His Gln Leu Arg Arg Gly Pro Pro Pro Thr Pro Arg Leu Leu Gln His His Gln Leu Arg Arg Gly Pro Pro Thr Pro Arg Leu Leu Gln

20 25 30 20 25 30

Arg Leu Cys Ser Gly Ser Arg Leu Leu Leu Leu Ser Ser Ser Leu Ser Arg Leu Cys Ser Gly Ser Arg Leu Leu Leu Leu Ser Ser Ser Ser Leu Ser

35 40 45 35 40 45

Ile Leu Leu Leu Val Val Val Cys Val Ile Thr Ser Gln Asn Ser Gln Ile Leu Leu Leu Val Val Val Cys Val Ile Thr Ser Gln Asn Ser Gln

50 55 60 50 55 60

Leu Arg Glu Asp Leu Leu Ala Leu Arg Gln Asn Phe Ser Asn Leu Thr Leu Arg Glu Asp Leu Leu Ala Leu Arg Gln Asn Phe Ser Asn Leu Thr

65 70 75 80 65 70 75 80

Val Ser Thr Glu Asp Gln Val Lys Ala Leu Ser Thr Gln Gly Ser Ser Val Ser Thr Glu Asp Gln Val Lys Ala Leu Ser Thr Gln Gly Ser Ser

85 90 95 85 90 95

Val Gly Arg Lys Met Lys Leu Val Glu Ser Lys Leu Glu Lys Gln Gln Val Gly Arg Lys Met Lys Leu Val Glu Ser Lys Leu Glu Lys Gln Gln

100 105 110 100 105 110

Lys Asp Leu Thr Glu Asp His Ser Ser Leu Leu Leu His Val Lys Gln Lys Asp Leu Thr Glu Asp His Ser Ser Leu Leu Leu His Val Lys Gln

115 120 125 115 120 125

Leu Val Ser Asp Val Arg Ser Leu Ser Cys Gln Met Ala Ala Phe Arg Leu Val Ser Asp Val Arg Ser Leu Ser Cys Gln Met Ala Ala Phe Arg

130 135 140 130 135 140

Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Ile Asn Trp Val Glu Tyr Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Ile Asn Trp Val Glu Tyr

145 150 155 160 145 150 155 160

Glu Gly Ser Cys Tyr Trp Phe Ser Ser Ser Val Arg Pro Trp Thr Glu Glu Gly Ser Cys Tyr Trp Phe Ser Ser Val Arg Pro Trp Thr Glu

165 170 175 165 170 175

Ala Asp Lys Tyr Cys Gln Leu Glu Asn Ala His Leu Val Val Val Thr Ala Asp Lys Tyr Cys Gln Leu Glu Asn Ala His Leu Val Val Val Thr

180 185 190 180 185 190

Ser Arg Asp Glu Gln Asn Phe Leu Gln Arg His Met Gly Pro Leu Asn Ser Arg Asp Glu Gln Asn Phe Leu Gln Arg His Met Gly Pro Leu Asn

195 200 205 195 200 205

Thr Trp Ile Gly Leu Thr Asp Gln Asn Gly Pro Trp Lys Trp Val Asp Thr Trp Ile Gly Leu Thr Asp Gln Asn Gly Pro Trp Lys Trp Val Asp

210 215 220 210 215 220

Gly Thr Asp Tyr Glu Thr Gly Phe Gln Asn Trp Arg Pro Glu Gln Pro Gly Thr Asp Tyr Glu Thr Gly Phe Gln Asn Trp Arg Pro Glu Gln Pro

225 230 235 240 225 230 235 240

Asp Asn Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala His Asp Asn Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala His

245 250 255 245 250 255

Phe Thr Thr Asp Gly Arg Trp Asn Asp Asp Val Cys Arg Arg Pro Tyr Phe Thr Thr Asp Gly Arg Trp Asn Asp Asp Val Cys Arg Arg Pro Tyr

260 265 270 260 265 270

Arg Trp Val Cys Glu Thr Lys Leu Asp Lys Ala Asn Arg Trp Val Cys Glu Thr Lys Leu Asp Lys Ala Asn

275 280 275 280

210 3210 3

211 290211 290

212 БЕЛОК212 PROTEIN

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (1)..(39)222(1)..(39)

223 Цитоплазматический домен223 Cytoplasmic domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (40)..(60)222 (40)..(60)

223 Трансмембранный домен223 Transmembrane domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (60)..(122)222 (60)..(122)

223 Суперспиральный домен223 Supercoiled domain

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (62)..(290)222 (62)..(290)

223 Остатки, кодируемые введенным экзоном человека223 Residues encoded by the introduced human exon

220220

221 ДРУГАЯ_ХАРАКТЕРИСТИКА221 OTHER_CHARACTERISTICS

222 (160)..(277)222 (160)..(277)

223 Лектиновый домен С-типа223 C-type lectin domain

400 3400 3

Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Asp Asn Asp Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Asp Asn Asp

1 5 10 15 1 5 10 15

His His Gln Leu Arg Arg Gly Pro Pro Pro Thr Pro Arg Leu Leu Gln His His Gln Leu Arg Arg Gly Pro Pro Thr Pro Arg Leu Leu Gln

20 25 30 20 25 30

Arg Leu Cys Ser Gly Ser Arg Leu Leu Leu Leu Ser Ser Ser Leu Ser Arg Leu Cys Ser Gly Ser Arg Leu Leu Leu Leu Ser Ser Ser Ser Leu Ser

35 40 45 35 40 45

Ile Leu Leu Leu Val Val Val Cys Val Ile Thr Ser Gln Asn Ser Gln Ile Leu Leu Leu Val Val Val Cys Val Ile Thr Ser Gln Asn Ser Gln

50 55 60 50 55 60

Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Phe Ser Asn Phe Thr Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Phe Ser Asn Phe Thr

65 70 75 80 65 70 75 80

Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Gly Gly Asn Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Gly Gly Asn

85 90 95 85 90 95

Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Lys Gln Gln Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Lys Gln Gln

100 105 110 100 105 110

Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Val Lys Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Val Lys Gln

115 120 125 115 120 125

Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Ala Leu Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Ala Leu Gln

130 135 140 130 135 140

Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Val Asn Trp Val Glu His Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Val Asn Trp Val Glu His

145 150 155 160 145 150 155 160

Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala Asp Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala Asp

165 170 175 165 170 175

Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val Thr Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val Thr

180 185 190 180 185 190

Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val Asn Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val Asn

195 200 205 195 200 205

Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val Asp Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val Asp

210 215 220 210 215 220

Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln Pro Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln Pro

225 230 235 240 225 230 235 240

Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala His Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala His

245 250 255 245 250 255

Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro Tyr Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro Tyr

260 265 270 260 265 270

Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Glu Pro Pro Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Glu Pro Pro

275 280 285 275 280 285

Leu Leu Leu Leu

290 290

210 4210 4

211 855211 855

212 ДНК212 DNA

213 Mus musculus213 Mus muscle

400 4400 4

atgacaaagg attatcaaga tttccagcac ctggacaatg ataatgacca tcatcaactc 60atgacaaagg attatcaaga tttccagcac ctggacaatg ataatgacca tcatcaactc 60

cggagagggc cgcctcccac tccacggctc ttgcagcgac tctgctctgg atcccgcctc 120cggagagggc cgcctcccac tccacggctc ttgcagcgac tctgctctgg atcccgcctc 120

ctcctgctct cctcgagcct cagcattctg ttgctggtgg ttgtctgtgt gatcacatcc 180ctcctgctct cctcgagcct cagcattctg ttgctggtgg ttgtctgtgt gatcacatcc 180

caaaattccc aactccggga agatctgctg gctctaaggc agaatttcag caacctcact 240caaaattccc aactccggga agatctgctg gctctaaggc agaatttcag caacctcact 240

gtgagcactg aggaccaggt caaggccctg agcacccagg gaagtagtgt gggaagaaag 300gtgagcactg aggaccaggt caaggccctg agcacccagg gaagtagtgt gggaagaaag 300

atgaagttag tggagtcgaa gctggaaaaa cagcagaagg atctgactga agatcactcc 360atgaagttag tggagtcgaa gctggaaaaa cagcagaagg atctgactga agatcactcc 360

agtttgctac tgcacgtgaa gcagttagtg tctgacgtgc gaagcttgag ctgccagatg 420agtttgctac tgcacgtgaa gcagttagtg tctgacgtgc gaagcttgag ctgccagatg 420

gctgcatttc ggggcaatgg ctctgaaagg acctgctgcc ccatcaactg ggtggagtat 480gctgcatttc ggggcaatgg ctctgaaagg acctgctgcc ccatcaactg ggtggagtat 480

gaaggcagct gctactggtt ctccagctct gtgaggcctt ggactgaagc tgacaagtac 540gaaggcagct gctactggtt ctccagctct gtgaggcctt ggactgaagc tgacaagtac 540

tgccagctgg aaaatgccca tctggtggtg gtgacctcca gggatgagca gaacttcctc 600tgccagctgg aaaatgccca tctggtggtg gtgacctcca gggatgagca gaacttcctc 600

cagcgccaca tgggcccctt aaacacttgg attggcctaa ctgaccagaa cgggccctgg 660cagcgccaca tgggcccctt aaacacttgg attggcctaa ctgaccagaa cgggccctgg 660

aaatgggtgg atggaacaga ctacgagaca ggcttccaga attggagacc agagcagcca 720aaatgggtgg atggaacaga ctacgagaca ggcttccaga attggagacc agagcagcca 720

gataactggt acggacatgg gcttggagga ggcgaggact gtgcccactt cacgacggat 780gataactggt acggacatgg gcttggagga ggcgaggact gtgcccactt cacgacggat 780

ggccgctgga atgacgacgt ctgcaggagg ccctaccgct gggtctgtga gacaaagttg 840ggccgctgga atgacgacgt ctgcaggagg ccctaccgct gggtctgtga gacaaagttg 840

gataaggcta attag 855gataaggcta attag 855

210 5210 5

211 876211 876

212 ДНК212 DNA

213 Homo sapiens213 Homo sapiens

400 5400 5

atgaccaagg agtatcaaga ccttcagcat ctggacaatg aggagagtga ccaccatcag 60atgaccaagg agtatcaaga ccttcagcat ctggacaatg aggagagtga ccaccatcag 60

ctcagaaaag ggccacctcc tccccagccc ctcctgcagc gtctctgctc cggacctcgc 120ctcagaaaag ggccacctcc tccccagccc ctcctgcagc gtctctgctc cggacctcgc 120

ctcctcctgc tctccctggg cctcagcctc ctgctgcttg tggttgtctg tgtgatcgga 180ctcctcctgc tctccctggg cctcagcctc ctgctgcttg tggttgtctg tgtgatcgga 180

tcccaaaact cccagctgca ggaggagctg cggggcctga gagagacgtt cagcaacttc 240tcccaaaact cccagctgca ggaggagctg cggggcctga gagagacgtt cagcaacttc 240

acagcgagca cggaggccca ggtcaagggc ttgagcaccc agggaggcaa tgtgggaaga 300acagcgagca cggaggccca ggtcaagggc ttgagcaccc agggaggcaa tgtgggaaga 300

aagatgaagt cgctagagtc ccagctggag aaacagcaga aggacctgag tgaagatcac 360aagatgaagt cgctagagtc ccagctggag aaacagcaga aggacctgag tgaagatcac 360

tccagcctgc tgctccacgt gaagcagttc gtgtctgacc tgcggagcct gagctgtcag 420tccagcctgc tgctccacgt gaagcagttc gtgtctgacc tgcggagcct gagctgtcag 420

atggcggcgc tccagggcaa tggctcagaa aggacctgct gcccggtcaa ctgggtggag 480atggcggcgc tccagggcaa tggctcagaa aggacctgct gcccggtcaa ctgggtggag 480

cacgagcgca gctgctactg gttctctcgc tccgggaagg cctgggctga cgccgacaac 540cacgagcgca gctgctactg gttctctcgc tccgggaagg cctgggctga cgccgacaac 540

tactgccggc tggaggacgc gcacctggtg gtggtcacgt cctgggagga gcagaaattt 600tactgccggc tggaggacgc gcacctggtg gtggtcacgt cctgggagga gcagaaattt 600

gtccagcacc acataggccc tgtgaacacc tggatgggcc tccacgacca aaacgggccc 660gtccagcacc acataggccc tgtgaacacc tggatgggcc tccacgacca aaacgggccc 660

tggaagtggg tggacgggac ggactacgag acgggcttca agaactggag gccggagcag 720tggaagtggg tggacgggac ggactacgag acgggcttca agaactggag gccggagcag 720

ccggacgact ggtacggcca cgggctcgga ggaggcgagg actgtgccca cttcaccgac 780ccggacgact ggtacggcca cgggctcgga ggaggcgagg actgtgccca cttcaccgac 780

gacggccgct ggaacgacga cgtctgccag aggccctacc gctgggtctg cgagacagag 840gacggccgct ggaacgacga cgtctgccag aggccctacc gctgggtctg cgagacagag 840

ctggacaagg ccagccagga gccacctctc ctttaa 876ctggacaagg ccagccagga gccacctctc ctttaa 876

210 6210 6

211 19211 19

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 6400 6

tcccaactccgggaagatc 19tcccaactccgggaagatc 19

210 7210 7

211 24211 24

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 7400 7

tgctggctctaaggcagaatttca 24tgctggctctaaggcagaatttca 24

210 8210 8

211 20211 20

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 8400 8

tcagtgctcacagtgaggtt 20tcagtgctcacagtgaggtt 20

210 9210 9

211 22211 22

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 9400 9

gggttggctcatgttaggaagg 22gggttggctcatgttaggaagg 22

210 10210 10

211 20211 20

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 10400 10

tcagcagccgagctgtgaaa 20tcagcagccgagctgtgaaa 20

210 11210 11

211 22211 22

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 11400 11

caggctgtgctacccaaagttc 22caggctgtgctacccaaagttc 22

210 12210 12

211 21211 21

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 12400 12

ggaggcaatgtgggaagaaag 21ggaggcaatgtgggaagaaag 21

210 13210 13

211 24211 24

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 13400 13

tgaagtcgctagagtcccagctgg 24tgaagtcgctagagtcccagctgg 24

210 14210 14

211 20211 20

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 14400 14

tcaggtccttctgctgtttc 20tcaggtccttctgctgtttc 20

210 15210 15

211 20211 20

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 15400 15

gattgggaatccgcccatct 20gattgggaatccgcccatct 20

210 16210 16

211 29211 29

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 16400 16

cctcttctgctttctcgggaattttcatc 29cctcttctgctttctcgggaattttcatc 29

210 17210 17

211 20211 20

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 17400 17

aaagcgccacgggtttcaag 20aaagcgccacgggtttcaag 20

210 18210 18

211 120211 120

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 другая_характеристика221 other_characteristics

222 (1)..(60)222 (1)..(60)

223 Последовательность мыши223 Mouse sequence

220220

221 другая_характеристика221 other_characteristics

222 (61)..(120)222 (61)..(120)

223 Последовательность человека223 Human Sequence

400 18400 18

catcccaaagtgggtggccagggctgggcagagaaagggggcaacttcgggtgtgtgtga 60catcccaaagtgggtggccagggctgggcagagaaagggggcaacttcgggtgtgtgtga 60

caagggagtggtgggtgcagtggtggcggacacagcgatcccgttttcttctctctgcac 120120

210 19210 19

211 160211 160

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 другая_характеристика221 other_characteristics

222 (1)..(60)222 (1)..(60)

223 Последовательность человека223 Human Sequence

220220

221 другая_характеристика221 other_characteristics

222 (61)..(66)222 (61)..(66)

223 XhoI223 XhoI

220220

221 другая_характеристика221 other_characteristics

222 (67)..(100)222 (67)..(100)

223 loxP223 loxP

220220

221 другая_характеристика221 other_characteristics

222 (101)..(160)222 (101)..(160)

223 Кассета223 Cassette

400 19400 19

tgttatttacagatacgtgagtttgggcaaattattgttctctgtgtcccagctgtaaac 60tgttatttcagatacgtgagtttgggcaaattattgttctctgtgtcccagctgtaaac 60

ctcgagataacttcgtataatgtatgctatacgaagttatatgcatggcctccgcgccgg 120ctcgagataacttcgtataatgtatgctatacgaagttatatgcatggcctccgcgccgg 120

gttttggcgcctcccgcgggcgcccccctcctcacggcga 160160

210 20210 20

211 191211 191

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 другая_характеристика221 other_characteristics

222 (1)..(60)222 (1)..(60)

223 Кассета223 Cassette

220220

221 другая_характеристика221 other_characteristics

222 (61)..(94)222 (61)..(94)

223 loxP223 loxP

220220

221 другая_характеристика221 other_characteristics

222 (100)..(125)222 (100)..(125)

223 I-CeuI223 I-CeuI

220220

221 другая_характеристика221 other_characteristics

222 (126)..(131)222 (126)..(131)

223 NheI223 NheI

220220

221 другая_характеристика221 other_characteristics

222 (132)..(191)222 (132)..(191)

223 Последовательность мыши223 Mouse sequence

400 20400 20

tttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatcatgtctgga 60tttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatcatgtctgga 60

ataacttcgtataatgtatgctatacgaagttatgctagtaactataacggtcctaaggt 120ataacttcgtataatgtatgctatacgaagttatgctagtaactataacggtcctaaggt 120

agcgagctagccgtggacagatacagcaacgtgagctagttattctgtcctaaagtctca 180180

gttggaagatg 191gtggaagatg 191

210 21210 21

211 9692211 9692

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 другая_характеристика221 other_characteristics

222 (1)..(69)222 (1)..(69)

223 Последовательность мыши223 Mouse sequence

220220

221 другая_характеристика221 other_characteristics

222 (70)..(3976)222 (70)..(3976)

223 Последовательность человека223 Human Sequence

220220

221 другая_характеристика221 other_characteristics

222 (3977)..(3982)222 (3977)..(3982)

223 XhoI223 XhoI

220220

221 другая_характеристика221 other_characteristics

222 (3983)..(4016)222 (3983)..(4016)

223 loxP223 loxP

220220

221 другая_характеристика221 other_characteristics

222 (4023)..(5235)222 (4023)..(5235)

223 Промотор убиквитина человека223 Human ubiquitin promoter

220220

221 другая_характеристика221 other_characteristics

222 (5236)..(5302)222 (5236)..(5302)

223 Промотор EM7223 EM7 promoter

220220

221 другая_характеристика221 other_characteristics

222 (5303)..(6328)222 (5303)..(6328)

223 Ген устойчивости к гигромицину223 Hygromycin resistance gene

220220

221 другая_характеристика221 other_characteristics

222 (6329)..(6813)222 (6329)..(6813)

223 PGK полиA223 PGK polyA

220220

221 другая_характеристика221 other_characteristics

222 (6825)..(7506)222 (6825)..(7506)

223 Промотор Prm223 Promoter Prm

220220

221 другая_характеристика221 other_characteristics

222 (7507)..(8646)222 (7507)..(8646)

223 Crei223 Crei

220220

221 другая_характеристика221 other_characteristics

222 (8909)..(9119)222 (8909)..(9119)

223 SV40 полиA223 SV40 polyA

220220

221 другая_характеристика221 other_characteristics

222 (9124)..(9157)222 (9124)..(9157)

223 loxP223 loxP

220220

221 другая_характеристика221 other_characteristics

222 (9163)..(9188)222 (9163)..(9188)

223 I-CeuI223 I-CeuI

220220

221 другая_характеристика221 other_characteristics

222 (9189)..(9194)222 (9189)..(9194)

223 NheI223 NheI

220220

221 другая_характеристика221 other_characteristics

222 (9195)..(9692)222 (9195)..(9692)

223 Последовательность мыши223 Mouse sequence

400 21400 21

gtgtgatcacatcccaaagtgggtggccagggctgggcagagaaagggggcaacttcggg 60gtgtgatcacatcccaaagtgggtggccagggctgggcagagaaagggggcaacttcggg 60

tgtgtgtgacaagggagtggtgggtgcagtggtggcggacacagcgatcccgttttcttc 120120

tctctgcacgctgtcctggccagactcccagctgcaggaggagctgcggggcctgagaga 180180

gacgttcagcaacttcacagcgagcacggaggcccaggtcaagggcttgagcacccaggg 240240

tgagggcgct ggggcggggc tggggctggg gctggggctg gggggctgtc gggaacgctg 300tgagggcgct ggggcggggc tggggctggg gctggggctg gggggctgtc gggaacgctg 300

agcgagcctc tcccgcagga ggcaatgtgg gaagaaagat gaagtcgcta gagtcccagc 360agcgagcctc tcccgcagga ggcaatgtgg gaagaaagat gaagtcgcta gagtcccagc 360

tggagaaaca gcagaaggac ctgagtgaag gtcagagagg gagtgtgtgt gtgtgtgtgt 420tggagaaaca gcagaaggac ctgagtgaag gtcagagagg gagtgtgtgt gtgtgtgtgt 420

gtgtgtgaaa gagagtgaga atgtgtggat gtgtgtgaga aagtgtgagt gtgtgtggat 480gtgtgtgaaa gagagtgaga atgtgtggat gtgtgtgaga aagtgtgagt gtgtgtggat 480

gtgtgtgaga atgagaggga gtgtgtgtgt gtgtgagtct gtgtgtgaga atgaggggga 540gtgtgtgaga atgagaggga gtgtgtgtgt gtgtgagtct gtgtgtgaga atgaggggga 540

gtgtgttttg ggtgtgtgta tgagagcctt gtgtggatgt gagaatgaga gggagtgtgt 600600

atgtctgtga gtgtgagaat gagatggagt gtgtgtgagt ctgtgtgtga gaatgaggtg 660atgtctgtga gtgtgagaat gagatggagt gtgtgtgagt ctgtgtgtga gaatgaggtg 660

tgtgtgtgtg agaatgagat ggtgtgtgtg tgggaatgag agggggtgtg tgtctgagtg 720tgtgtgtgtg agaatgagat ggtgtgtgtg tgggaatgag agggggtgtg tgtctgagtg 720

tgagaatgag atagagtgtg tgtgagacag tctgtgggaa tgagagggag tgtgtgtgag 780tgagaatgag

agtgtgagaa tgacggagtg tgtctgtgag tgtgataatg aggtgtgtgt gagtctgagt 840agtgtgagaa tgacggagtg tgtctgtgag tgtgataatg aggtgtgtgt gagtctgagt 840

gtaagaatga gatggggtgt gtgtgtctgt gagtgtgaga gtgtgagaat gaggggtgtt 900gtaagaatga gatggggtgt gtgtgtctgt gagtgtgaga gtgtgagaat gaggggtgtt 900

tgtgtctgag tgtgagtctg tgagtgtgag aatgagatgg ggtgtgtgag tgagtgtgag 960tgtgtctgag tgtgagtctg tgagtgtgag aatgagatgg ggtgtgtgag tgagtgtgag 960

aatgagatgg ggtgtgtgtg tctgtgagtg tgtgtgtgtt tgtgagtgtg agaatgagat 10201020

ggggtgtgtg tgagtgtgag aatgagatgg ggtgtgtgtc tgtgtgtgag aatgagatgg 1080ggggtgtgtg tgagtgtgag aatgagatgg ggtgtgtgtc tgtgtgtgag aatgagatgg 1080

gtgtgtgtgt gacagagtct gagtgtgaga atgagaggga gtgtgtgtga gtgtgagaat 1140gtgtgtgtgt gacagagtct gagtgtgaga atgagaggga gtgtgtgtga gtgtgagaat 1140

gagaaggagt ggatgggtgt gtgagtctgt gtgaatgagg gagtgggtgt gtgtacgagt 12001200

gtgagtctgt gtttatgtgt gagaatgtgt cagtgtatgt gtgtgagaac gtgtgtatgt 12601260

gtgttagtgt gtgttgcgtg tgtgggggaa tgagagggat tgtgtctgtg agtgtgagaa 13201320

tgagatggag tgtctgtgag actgtgtgtg aggagtggga gtgtgtgtga gaatgagatg 1380tgagatggag tgtctgtgag actgtgtgtg aggagtggga gaatgagatg 1380

ggtgtgtgtg tctgagtgtg tgtctgtgag aatgagaggg agtgtgtgtg tgtgtgagag 1440ggtgtgtgtg tctgagtgtg tgtctgtgag aatgagaggg agtgtgtgtg tgtgtgagag 1440

cctgtgtgaa aatgagaagg agtgtggatg ggtgtttgtg agtgggagag tctgtgtgtt 1500cctgtgtgaa aatgagaagg agtgtggatg ggtgtttgtg agtgggagag tctgtgtgtt 1500

tatgtgtgtg agaatgaggg agtgtgggtg tgtgtgcgaa tgtgagtctg tgtttatgtg 15601560

tgtgagaatg tgtcagtgta tgtgagaacg tgtgtgttag tgtgttgcgt gtgtgagaat 16201620

gtaagtatat gtgtaagtgc atgtgagtgt gtgtatgtgc gtgttgtgtg aatgtgcatt 1680gtaagtatat gtgtaagtgc atgtgagtgt gtgtatgtgc gtgttgtgtg aatgtgcatt 1680

gtgtgtgcat gtgtgaaaga gtatatgtgt gttgtgggtg agtgtgtgtg gtgtgtgtag 1740gtgtgtgcat gtgtgaaaga gtatatgtgt gttgtgggtg agtgtgtgtg gtgtgtgtag 1740

tgggtgaggg tgtgttgtat gtgtgggtgt gcgttgtgtg aatgtgtgta tgtgggtgag 18001800

ggtgtgtgtg cctgtgtgag ggtgtgttgt ggtttttgtg tgtgtttggg tgagggtgtg 18601860

ttgtgtgtgt gtgtgggtga aggtgtgttg tgtgtgtcgt gggtgaaggt gtgttgtgtg 1920ttgtgtgtgt gtgtgggtga aggtgtgttg tgtgtgtcgt gggtgaaggt gtgttgtgtg 1920

tgtagtgact gtagattagg gtgtgttccg tgtgtgtgtg tgagggtgta tgttgtgggt 19801980 tgtagtgact gtagattagg gtgtgttccg tgtgtgtgtg

gttttgtgtg tgagtgggtg tgtaagggtg tgttgtgtgt atgtgggtta aggtgtgtta 2040gttttgtgtg tgagtgggtg tgtaagggtg tgttgtgtgt atgtgggtta aggtgtgtta 2040

tgcgtgaggg tgtattgtgt gtgtgttttg tgtgtgttgt gtgtatgtgg gttagggtgt 2100tgcgtgaggg tgtattgtgt gtgtgttttg tgtgtgttgt gtgtatgtgg gttagggtgt 2100

gttgtgtgtt tgtgtgtttt gtgtgttgtc tgtgtatgtg ggttacggtg tgttgtgcgt 21602160

gtgagggtgt gttgtgtatg gtgtgttgtg tgtgttgtgt gagtgtgtat gtgagttagg 22202220

gtgtgttgtg tctatgtatg tgtgtgtaag ggtgtgttgt gtgtctgtgg gtgtgttttg 2280gtgtgttgtg tctatgtatg tgtgtgtaag ggtgtgttgt gtgtctgtgg gtgtgttttg 2280

tgtatgtggg ttagggtgtg ttgtgtgttc tgtattgtgt gttttatgtg ttgtctgtat 23402340

gtgggttatg tgtgttgtgt gtgttgtgga tgtatgtggg ttagggtgtg ttgtgtgtct 2400gtgggttatg tgtgttgtgt gtgttgtgga tgtatgtggg ttagggtgtg ttgtgtgtct 2400

ctgtgtgttg tctgcgtttg tgtctgtggg ttagggtgtg ttgtatgtgt tgtgttttgt 24602460

gtgttgtccg tgtgtgtgta tgtgggttag gttgtgtgtg tgtgtgttgt atattgtctg 2520gtgttgtccg tgtgtgtgta tgtgggttag gttgtgtgtg tgtgtgttgt atattgtctg 2520

tgtgtgtgtg ttaggatgtg ttgtgtgtct gtgtgagtgt gtgtgtaagg gtgtgttgtg 25802580

tgtgtaggag tgtgtgtgtg tgtgtgtatg ggggtctctc aggccaactc cgctgctgtt 2640tgtgtaggag tgtgtgtgtg tgtgtgtatg ggggtctctc aggccaactc cgctgctgtt 2640

tgtggcaatg cgacgggtgt tcgggtccca gcaggaggat gtagggctga cctcgtttcc 2700tgtggcaatg cgacgggtgt tcgggtccca gcaggaggat gtagggctga cctcgtttcc 2700

cgtttccctc cccgtggttt ccgcatctcc tcccgctccc ctccgcccgg tctccccaga 2760cgtttccctc cccgtggttt ccgcatctcc tcccgctccc ctccgcccgg tctccccaga 2760

tcactccagc ctgctgctcc acgtgaagca gttcgtgtct gacctgcgga gcctgagctg 2820tcactccagc ctgctgctcc acgtgaagca gttcgtgtct gacctgcgga gcctgagctg 2820

tcagatggcg gcgctccagg gcaatggtaa ggaggccagc ccggcccgct ctctgcctcc 2880tcagatggcg gcgctccagg gcaatggtaa ggaggccagc ccggcccgct ctctgcctcc 2880

ccccttctct gggcagcgct tagcccctgc gccccgtttc tcccgctcag gctcagaaag 2940ccccttctct gggcagcgct tagcccctgc gccccgtttc tcccgctcag gctcagaaag 2940

gacctgctgc ccggtcaact gggtggagca cgagcgcagc tgctactggt tctctcgctc 3000gacctgctgc ccggtcaact gggtggagca cgagcgcagc tgctactggt tctctcgctc 3000

cgggaaggcc tgggctgacg ccgacaacta ctgccggctg gaggacgcgc acctggtggt 3060cgggaaggcc tgggctgacg ccgacaacta ctgccggctg gaggacgcgc acctggtggt 3060

ggtcacgtcc tgggaggagc aggtgaggac ccggagggtc tgggaggctg gctggcctcg 3120ggtcacgtcc tgggaggagc aggtgaggac ccggagggtc tgggaggctg gctggcctcg 3120

gagagatcac cacccgcctt ctctctcctc agaaatttgt ccagcaccac ataggccctg 31803180

tgaacacctg gatgggcctc cacgaccaaa acgggccctg gaagtgggtg gacgggacgg 3240tgaacacctg gatgggcctc cacgaccaaa acgggccctg gaagtgggtg gacgggacgg 3240

actacgagac gggcttcaag tgagtgcgcg ccctccctcg gcctgggtcc ggccgccttc 3300actacgagac gggcttcaag tgagtgcgcg ccctccctcg gcctgggtcc ggccgccttc 3300

gcgccctggg gccctgggct gaggagtctg gagcgacccg cctgcggatc cgacctcctg 3360gcgccctggg gccctgggct gaggagtctg gagcgacccg cctgcggatc cgacctcctg 3360

gggcccacag ctggctctgt ccccaggaac tggaggccgg agcagccgga cgactggtac 3420gggccccacag ctggctctgt ccccaggaac tggaggccgg agcagccgga cgactggtac 3420

ggccacgggc tcggaggagg cgaggactgt gcccacttca ccgacgacgg ccgctggaac 3480ggccacgggc tcggaggagg cgaggactgt gcccacttca ccgacgacgg ccgctggaac 3480

gacgacgtct gccagaggcc ctaccgctgg gtctgcgaga cagagctgga caaggccagc 3540gacgacgtct gccagaggcc ctaccgctgg gtctgcgaga cagagctgga caaggccagc 3540

caggagccac ctctccttta atttatttct tcaatgcctc gacctgccgc aggggtccgg 3600caggagccac ctctccttta atttatttct tcaatgcctc gacctgccgc aggggtccgg 3600

gattgggaat ccgcccatct gggggcctct tctgctttct cgggaatttt catctaggat 36603660

tttaagggaa ggggaaggat agggtgatgt tccgaaggtg aggagcttga aacccgtggc 3720tttaagggaa ggggaaggat agggtgatgt tccgaaggtg aggagcttga aacccgtggc 3720

gctttctgca gtttgcaggt tatcattgtg aacttttttt ttttaagagt aaaaagaaat 3780gctttctgca gtttgcaggt tatcattgtg aacttttttt ttttaagagt aaaaagaaat 3780

atacctaaac cttctgttag ttgtctggtt attggggatt cggaagcagg agtgggctgg 3840atacctaaac cttctgttag ttgtctggtt attggggatt cggaagcagg agtgggctgg 3840

ttggcattac gaagccttag cgggtgctgt ggcatcatga gaactgtgtg ggctttgggc 3900ttggcattac gaagccttag cgggtgctgt ggcatcatga gaactgtgtg ggctttgggc 3900

cagaatggcc agactttgtt atttacagat acgtgagttt gggcaaatta ttgttctctg 39603960

tgtcccagct gtaaacctcg agataacttc gtataatgta tgctatacga agttatatgc 4020tgtcccagct gtaaacctcg agataacttc gtataatgta tgctatacga agttatatgc 4020

atggcctccg cgccgggttt tggcgcctcc cgcgggcgcc cccctcctca cggcgagcgc 4080atggcctccg cgccgggttt tggcgcctcc cgcgggcgcc cccctcctca cggcgagcgc 4080

tgccacgtca gacgaagggc gcagcgagcg tcctgatcct tccgcccgga cgctcaggac 4140tgccacgtca gacgaagggc gcagcgagcg tcctgatcct tccgcccggga cgctcaggac 4140

agcggcccgc tgctcataag actcggcctt agaaccccag tatcagcaga aggacatttt 4200agcggcccgc tgctcataag actcggcctt agaaccccag tatcagcaga aggacatttt 4200

aggacgggac ttgggtgact ctagggcact ggttttcttt ccagagagcg gaacaggcga 4260aggacgggac ttgggtgact ctagggcact ggttttcttt ccagagagcg gaacaggcga 4260

ggaaaagtag tcccttctcg gcgattctgc ggagggatct ccgtggggcg gtgaacgccg 4320ggaaaagtag tcccttctcg gcgattctgc ggagggatct ccgtggggcg gtgaacgccg 4320

atgattatat aaggacgcgc cgggtgtggc acagctagtt ccgtcgcagc cgggatttgg 4380atgattatat aaggacgcgc cgggtgtggc acagctagtt ccgtcgcagc cgggatttgg 4380

gtcgcggttc ttgtttgtgg atcgctgtga tcgtcacttg gtgagtagcg ggctgctggg 4440gtcgcggttc ttgtttgtgg atcgctgtga tcgtcacttg gtgagtagcg ggctgctggg 4440

ctggccgggg ctttcgtggc cgccgggccg ctcggtggga cggaagcgtg tggagagacc 4500ctggccgggg ctttcgtggc cgccgggccg ctcggtggga cggaagcgtg tggagagacc 4500

gccaagggct gtagtctggg tccgcgagca aggttgccct gaactggggg ttggggggag 4560gccaagggct gtagtctgggg tccgcgagca aggttgccct gaactggggg ttggggggag 4560

cgcagcaaaa tggcggctgt tcccgagtct tgaatggaag acgcttgtga ggcgggctgt 46204620

gaggtcgttg aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc 4680gaggtcgttg aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc 4680

ttcgctaatg cgggaaagct cttattcggg tgagatgggc tggggcacca tctggggacc 4740ttcgctaatg cgggaaagct cttattcggg tgagatgggc tggggcacca tctggggacc 4740

ctgacgtgaa gtttgtcact gactggagaa ctcggtttgt cgtctgttgc gggggcggca 4800ctgacgtgaa gtttgtcact gactggagaa ctcggtttgt cgtctgttgc gggggcggca 4800

gttatggcgg tgccgttggg cagtgcaccc gtacctttgg gagcgcgcgc cctcgtcgtg 48604860

tcgtgacgtc acccgttctg ttggcttata atgcagggtg gggccacctg ccggtaggtg 4920tcgtgacgtc acccgttctg ttggcttata atgcagggtg gggccacctg ccggtaggtg 4920

tgcggtaggc ttttctccgt cgcaggacgc agggttcggg cctagggtag gctctcctga 4980tgcggtaggc ttttctccgt cgcaggacgc agggttcggg cctagggtag gctctcctga 4980

atcgacaggc gccggacctc tggtgagggg agggataagt gaggcgtcag tttctttggt 5040atcgacaggc gccggacctc tggtgagggg agggataagt gaggcgtcag tttctttggt 5040

cggttttatg tacctatctt cttaagtagc tgaagctccg gttttgaact atgcgctcgg 5100cggttttatg tacctatctt cttaagtagc tgaagctccg gttttgaact atgcgctcgg 5100

ggttggcgag tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt 5160ggttggcgag tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt 5160

caatatgtaa ttttcagtgt tagactagta aattgtccgc taaattctgg ccgtttttgg 52205220

cttttttgtt agacgtgttg acaattaatc atcggcatag tatatcggca tagtataata 52805280

cgacaaggtg aggaactaaa ccatgaaaaa gcctgaactc accgcgacgt ctgtcgagaa 5340cgacaaggtg aggaactaaa ccatgaaaaa gcctgaactc accgcgacgt ctgtcgagaa 5340

gtttctgatc gaaaagttcg acagcgtgtc cgacctgatg cagctctcgg agggcgaaga 5400gtttctgatc gaaaagttcg acagcgtgtc cgacctgatg cagctctcgg agggcgaaga 5400

atctcgtgct ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg taaatagctg 5460atctcgtgct ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg taaatagctg 5460

cgccgatggt ttctacaaag atcgttatgt ttatcggcac tttgcatcgg ccgcgctccc 5520cgccgatggt ttctacaaag atcgttatgt ttatcggcac tttgcatcgg ccgcgctccc 5520

gattccggaa gtgcttgaca ttggggaatt cagcgagagc ctgacctatt gcatctcccg 5580gattccggaa gtgcttgaca ttggggaatt cagcgagagc ctgacctatt gcatctcccg 5580

ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg ctgttctgca 5640ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg ctgttctgca 5640

gccggtcgcg gaggccatgg atgcgattgc tgcggccgat cttagccaga cgagcgggtt 5700gccggtcgcg gaggccatgg atgcgattgc tgcggccgat cttagccaga cgagcgggtt 5700

cggcccattc ggaccgcaag gaatcggtca atacactaca tggcgtgatt tcatatgcgc 5760cggcccattc ggaccgcaag gaatcggtca atacactaca tggcgtgatt tcatatgcgc 5760

gattgctgat ccccatgtgt atcactggca aactgtgatg gacgacaccg tcagtgcgtc 5820gattgctgat ccccatgtgt atcactggca aactgtgatg gacgacaccg tcagtgcgtc 5820

cgtcgcgcag gctctcgatg agctgatgct ttgggccgag gactgccccg aagtccggca 5880cgtcgcgcag gctctcgatg agctgatgct ttgggccgag gactgccccg aagtccggca 5880

cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg gacaatggcc gcataacagc 5940cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg gacaatggcc gcataacagc 5940

ggtcattgac tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg ccaacatctt 6000ggtcattgac tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg ccaacatctt 6000

cttctggagg ccgtggttgg cttgtatgga gcagcagacg cgctacttcg agcggaggca 60606060

tccggagctt gcaggatcgc cgcggctccg ggcgtatatg ctccgcattg gtcttgacca 6120tccggagctt gcaggatcgc cgcggctccg ggcgtatatg ctccgcattg gtcttgacca 6120

actctatcag agcttggttg acggcaattt cgatgatgca gcttgggcgc agggtcgatg 6180actctatcag agcttggttg acggcaattt cgatgatgca gcttgggcgc agggtcgatg 6180

cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt acacaaatcg cccgcagaag 6240cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt acacaaatcg cccgcagaag 6240

cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc gatagtggaa accgacgccc 6300cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc gatagtggaa accgacgccc 6300

cagcactcgt ccgagggcaa aggaataggg ggatccgctg taagtctgca gaaattgatg 63606360

atctattaaa caataaagat gtccactaaa atggaagttt ttcctgtcat actttgttaa 64206420

gaagggtgag aacagagtac ctacattttg aatggaagga ttggagctac gggggtgggg 6480gaagggtgag aacagagtac ctacattttg aatggaagga ttggagctac gggggtgggg 6480

gtggggtggg attagataaa tgcctgctct ttactgaagg ctctttacta ttgctttatg 6540gtggggtggg attagataaa tgcctgctct ttactgaagg ctctttacta ttgctttatg 6540

ataatgtttc atagttggat atcataattt aaacaagcaa aaccaaatta agggccagct 6600ataatgtttc atagttggat atcataattt aaacaagcaa aaccaaatta agggccagct 6600

cattcctccc actcatgatc tatagatcta tagatctctc gtgggatcat tgtttttctc 6660cattcctccc actcatgatc tatagatcta tagatctctc gtgggatcat tgtttttctc 6660

ttgattccca ctttgtggtt ctaagtactg tggtttccaa atgtgtcagt ttcatagcct 6720ttgattccca ctttgtggtt ctaagtactg tggtttccaa atgtgtcagt ttcatagcct 6720

gaagaacgag atcagcagcc tctgttccac atacacttca ttctcagtat tgttttgcca 6780gaagaacgag atcagcagcc tctgttccac atacacttca ttctcagtat tgttttgcca 6780

agttctaatt ccatcagacc tcgacctgca gcccctagcc cgggcgccag tagcagcacc 6840agttctaatt ccatcagacc tcgacctgca gcccctagcc cgggcgccag tagcagcacc 6840

cacgtccacc ttctgtctag taatgtccaa cacctccctc agtccaaaca ctgctctgca 6900cacgtccacc ttctgtctag taatgtccaa cacctccctc agtccaaaca ctgctctgca 6900

tccatgtggc tcccatttat acctgaagca cttgatgggg cctcaatgtt ttactagagc 6960tccatgtggc tcccatttat acctgaagca cttgatgggg cctcaatgtt ttactagagc 6960

ccacccccct gcaactctga gaccctctgg atttgtctgt cagtgcctca ctggggcgtt 7020ccacccccct gcaactctga gaccctctgg atttgtctgt cagtgcctca ctggggcgtt 7020

ggataatttc ttaaaaggtc aagttccctc agcagcattc tctgagcagt ctgaagatgt 7080ggataatttc ttaaaaggtc aagttccctc agcagcattc tctgagcagt ctgaagatgt 7080

gtgcttttca cagttcaaat ccatgtggct gtttcaccca cctgcctggc cttgggttat 7140gtgcttttca cagttcaaat ccatgtggct gtttcaccca cctgcctggc cttgggttat 7140

ctatcaggac ctagcctaga agcaggtgtg tggcacttaa cacctaagct gagtgactaa 7200ctatcaggac ctagcctaga agcaggtgtg tggcacttaa cacctaagct gagtgactaa 7200

ctgaacactc aagtggatgc catctttgtc acttcttgac tgtgacacaa gcaactcctg 7260ctgaacactc aagtggatgc catctttgtc acttcttgac tgtgacacaa gcaactcctg 7260

atgccaaagc cctgcccacc cctctcatgc ccatatttgg acatggtaca ggtcctcact 7320atgccaaagc cctgcccacc cctctcatgc ccatatttgg acatggtaca ggtcctcact 7320

ggccatggtc tgtgaggtcc tggtcctctt tgacttcata attcctaggg gccactagta 7380ggccatggtc tgtgaggtcc tggtcctctt tgacttcata attcctaggg gccactagta 7380

tctataagag gaagagggtg ctggctccca ggccacagcc cacaaaattc cacctgctca 7440tctataagag gaagagggtg ctggctccca ggccacagcc cacaaaattc cacctgctca 7440

caggttggct ggctcgaccc aggtggtgtc ccctgctctg agccagctcc cggccaagcc 7500caggttggct ggctcgaccc aggtggtgtc ccctgctctg agccagctcc cggccaagcc 7500

agcaccatgg gtacccccaa gaagaagagg aaggtgcgta ccgatttaaa ttccaattta 7560agcaccatgg gtacccccaa gaagaagagg aaggtgcgta ccgatttaaa ttccaattta 7560

ctgaccgtac accaaaattt gcctgcatta ccggtcgatg caacgagtga tgaggttcgc 7620ctgaccgtac accaaaattt gcctgcatta ccggtcgatg caacgagtga tgaggttcgc 7620

aagaacctga tggacatgtt cagggatcgc caggcgtttt ctgagcatac ctggaaaatg 7680aagaacctga tggacatgtt cagggatcgc caggcgtttt ctgagcatac ctggaaaatg 7680

cttctgtccg tttgccggtc gtgggcggca tggtgcaagt tgaataaccg gaaatggttt 7740cttctgtccg tttgccggtc gtgggcggca tggtgcaagt tgaataaccg gaaatggttt 7740

cccgcagaac ctgaagatgt tcgcgattat cttctatatc ttcaggcgcg cggtctggca 7800cccgcagaac ctgaagatgt tcgcgattat cttctatatc ttcaggcgcg cggtctggca 7800

gtaaaaacta tccagcaaca tttgggccag ctaaacatgc ttcatcgtcg gtccgggctg 7860gtaaaaacta tccagcaaca tttgggccag ctaaacatgc ttcatcgtcg gtccgggctg 7860

ccacgaccaa gtgacagcaa tgctgtttca ctggttatgc ggcggatccg aaaagaaaac 7920ccacgaccaa gtgacagcaa tgctgtttca ctggttatgc ggcggatccg aaaagaaaac 7920

gttgatgccg gtgaacgtgc aaaacaggct ctagcgttcg aacgcactga tttcgaccag 7980gttgatgccg gtgaacgtgc aaaacaggct ctagcgttcg aacgcactga tttcgaccag 7980

gttcgttcac tcatggaaaa tagtgatcgc tgccaggata tacgtaatct ggcatttctg 8040gttcgttcac tcatggaaaa tagtgatcgc tgccaggata tacgtaatct ggcatttctg 8040

gggattgctt ataacaccct gttacgtata gccgaaattg ccaggatcag ggttaaagat 8100gggattgctt ataacaccct gttacgtata gccgaaattg ccaggatcag ggttaaagat 8100

atctcacgta ctgacggtgg gagaatgtta atccatattg gcagaacgaa aacgctggtt 8160atctcacgta ctgacggtgg gagaatgtta atccatattg gcagaacgaa aacgctggtt 8160

agcaccgcag gtgtagagaa ggcacttagc ctgggggtaa ctaaactggt cgagcgatgg 8220agcaccgcag gtgtagagaa ggcacttagc ctgggggtaa ctaaactgggt cgagcgatgg 8220

atttccgtct ctggtgtagc tgatgatccg aataactacc tgttttgccg ggtcagaaaa 8280atttccgtct ctggtgtagc tgatgatccg aataactacc tgttttgccg ggtcagaaaa 8280

aatggtgttg ccgcgccatc tgccaccagc cagctatcaa ctcgcgccct ggaagggatt 8340aatggtgttg ccgcgccatc tgccaccagc cagctatcaa ctcgcgccct ggaagggatt 8340

tttgaagcaa ctcatcgatt gatttacggc gctaaggtaa atataaaatt tttaagtgta 8400tttgaagcaa ctcatcgatt gatttacggc gctaaggtaa atataaaatt tttaagtgta 8400

taatgtgtta aactactgat tctaattgtt tgtgtatttt aggatgactc tggtcagaga 8460taatgtgtta aactactgat tctaattgtt tgtgtatttt aggatgactc tggtcagaga 8460

tacctggcct ggtctggaca cagtgcccgt gtcggagccg cgcgagatat ggcccgcgct 8520tacctggcct ggtctggaca cagtgcccgt gtcggagccg cgcgagatat ggcccgcgct 8520

ggagtttcaa taccggagat catgcaagct ggtggctgga ccaatgtaaa tattgtcatg 8580ggagtttcaa taccggagat catgcaagct ggtggctgga ccaatgtaaa tattgtcatg 8580

aactatatcc gtaacctgga tagtgaaaca ggggcaatgg tgcgcctgct ggaagatggc 8640aactatatcc gtaacctgga tagtgaaaca ggggcaatgg tgcgcctgct ggaagatggc 8640

gattgatcta gataagtaat gatcataatc agccatatca catctgtaga ggttttactt 8700gattgatcta gataagtaat gatcataatc agccatatca catctgtaga ggttttactt 8700

gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt 8760gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt 8760

gttgttaaac ctgccctagt tgcggccaat tccagctgag cgtgcctccg caccattacc 8820gttgttaaac ctgccctagt tgcggccaat tccagctgag cgtgcctccg caccattacc 8820

agttggtctg gtgtcaaaaa taataataac cgggcagggg ggatctaagc tctagataag 8880agttggtctg gtgtcaaaaa taataataac cgggcagggg ggatctaagc tctagataag 8880

taatgatcat aatcagccat atcacatctg tagaggtttt acttgcttta aaaaacctcc 8940taatgatcat aatcagccat atcacatctg tagaggtttt acttgcttta aaaaacctcc 8940

cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 9000cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 9000

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 9060ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 9060

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 9120ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 9120

ggaataactt cgtataatgt atgctatacg aagttatgct agtaactata acggtcctaa 9180ggaataactt cgtataatgt atgctatacg aagttatgct agtaactata acggtcctaa 9180

ggtagcgagc tagccgtgga cagatacagc aacgtgagct agttattctg tcctaaagtc 9240ggtagcgagc tagccgtgga cagatacagc aacgtgagct agttattctg tcctaaagtc 9240

tcagttggaa gatgggagga tttttgacct ctgtctgctg ggggcaggac caaccaccag 9300tcagttggaa gatgggagga tttttgacct ctgtctgctg ggggcaggac caaccaccag 9300

ggaactgcag cccccctgtg ctgagtgcat cagagacttg gaatggaaca cactggcctg 9360ggaactgcag cccccctgtg ctgagtgcat cagagacttg gaatggaaca cactggcctg 9360

cgacactcat cacaacgaac agaaactgct ttgtacactg aataaacgca gtgaataccc 9420cgacactcat cacaacgaac agaaactgct ttgtacactg aataaacgca gtgaataccc 9420

agctcaggat cacagacaca tgaatgcaaa gttatattag tataaccaag ggtgggaatg 9480agctcaggat cacagacaca tgaatgcaaa gttatattag tataaccaag ggtgggaatg 9480

agggcaatta cagataactt atagacatga attactaaca aaacagggca aaatgtttgc 9540agggcaatta cagataactt atagacatga attactaaca aaacagggca aaatgtttgc 9540

tcataaataa catgaaaata caatatatag tcatatgtat atatacatgt atatatataa 9600tcataaataa catgaaaata caatatatag tcatatgtat atatacatgt atatatataa 9600

atgacataat atgtatatat ttttacaaat acactgcagg aaaataatat ttttcctcta 9660atgacataat atgtatatat ttttacaaat acactgcagg aaaataatat ttttcctcta 9660

cagaagagat tggcaaatct gacatctaaa at 9692cagaagagat tggcaaatct gacatctaaa at 9692

210 22210 22

211 160211 160

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 другая_характеристика221 other_characteristics

222 (1)..(90)222 (1)..(90)

223 Последовательность мыши223 Mouse sequence

220220

221 другая_характеристика221 other_characteristics

222 (91)..(160)222 (91)..(160)

223 Последовательность человека223 Human Sequence

400 22400 22

catgatgttt ctttcttagg aaagccaggg catttctcta ttctccaatc tcttggctca 60catgatgttt ctttcttagg aaagccaggg catttctcta ttctccaatc tcttggctca 60

atgcccttgg cctctctttt gttccactag tgaagcctct ccagccaggg gctgaggtcc 120atgcccttgg cctctctttt gttcctag tgaagcctct ccagccaggg gctgaggtcc 120

cggtggtgtg ggcccaggag ggggctcctg cccagctccc 160cggtggtgtg ggcccaggag ggggctcctg cccagctccc 160

210 23210 23

211 197211 197

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 другая_характеристика221 other_characteristics

222 (1)..(60)222 (1)..(60)

223 Последовательность человека223 Human Sequence

220220

221 другая_характеристика221 other_characteristics

222 (61)..(66)222 (61)..(66)

223 XhoI223 XhoI

220220

221 другая_характеристика221 other_characteristics

222 (67)..(100)222 (67)..(100)

223 loxP223 loxP

220220

221 другая_характеристика221 other_characteristics

222 (106)..(131)222 (106)..(131)

223 I-CeuI223 I-CeuI

220220

221 другая_характеристика221 other_characteristics

222 (132)..(137)222 (132)..(137)

223 NheI223 NheI

220220

221 другая_характеристика221 other_characteristics

222 (138)..(197)222 (138)..(197)

223 Последовательность мыши223 Mouse sequence

400 23400 23

tgttatttac agatacgtga gtttgggcaa attattgttc tctgtgtccc agctgtaaac 60tgttatttac agatacgtga gtttgggcaa attattgttc tctgtgtccc agctgtaaac 60

ctcgagataa cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc 120ctcgagataa cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc 120

taaggtagcg agctagccgt ggacagatac agcaacgtga gctagttatt ctgtcctaaa 180taaggtagcg agctagccgt ggacagatac agcaacgtga gctagtttatt ctgtcctaaa 180

gtctcagttg gaagatg 197gtctcagttg gaagatg 197

210 24210 24

211 4551211 4551

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

220220

221 другая_характеристика221 other_characteristics

222 (1)..(69)222 (1)..(69)

223 Последовательность мыши223 Mouse sequence

220220

221 другая_характеристика221 other_characteristics

222 (70)..(3976)222 (70)..(3976)

223 Последовательность человека223 Human Sequence

220220

221 другая_характеристика221 other_characteristics

222 (3977)..(3982)222 (3977)..(3982)

223 XhoI223 XhoI

220220

221 другая_характеристика221 other_characteristics

222 (3983)..(4016)222 (3983)..(4016)

223 LoxP223 LoxP

220220

221 другая_характеристика221 other_characteristics

222 (4022)..(4047)222 (4022)..(4047)

223 I-CeuI223 I-CeuI

220220

221 другая_характеристика221 other_characteristics

222 (4048)..(4053)222 (4048)..(4053)

223 NheI223 NheI

220220

221 другая_характеристика221 other_characteristics

222 (4054)..(4551)222 (4054)..(4551)

223 Последовательность мыши223 Mouse sequence

400 24400 24

gtgtgatcac atcccaaagt gggtggccag ggctgggcag agaaaggggg caacttcggg 60gtgtgatcac atcccaaagt gggtggccag ggctgggcag agaaagggggg caacttcggg 60

tgtgtgtgac aagggagtgg tgggtgcagt ggtggcggac acagcgatcc cgttttcttc 120tgtgtgtgac aagggagtgg tgggtgcagt ggtggcggac acagcgatcc cgttttcttc 120

tctctgcacg ctgtcctggc cagactccca gctgcaggag gagctgcggg gcctgagaga 180tctctgcacg ctgtcctggc cagactccca gctgcaggag gagctgcggg gcctgagaga 180

gacgttcagc aacttcacag cgagcacgga ggcccaggtc aagggcttga gcacccaggg 240gacgttcagc aacttcacag cgagcacggga ggcccaggtc aagggcttga gcacccaggg 240

tgagggcgct ggggcggggc tggggctggg gctggggctg gggggctgtc gggaacgctg 300tgagggcgct ggggcggggc tggggctggg gctggggctg gggggctgtc gggaacgctg 300

agcgagcctc tcccgcagga ggcaatgtgg gaagaaagat gaagtcgcta gagtcccagc 360agcgagcctc tcccgcagga ggcaatgtgg gaagaaagat gaagtcgcta gagtcccagc 360

tggagaaaca gcagaaggac ctgagtgaag gtcagagagg gagtgtgtgt gtgtgtgtgt 420tggagaaaca gcagaaggac ctgagtgaag gtcagagagg gagtgtgtgt gtgtgtgtgt 420

gtgtgtgaaa gagagtgaga atgtgtggat gtgtgtgaga aagtgtgagt gtgtgtggat 480gtgtgtgaaa gagagtgaga atgtgtggat gtgtgtgaga aagtgtgagt gtgtgtggat 480

gtgtgtgaga atgagaggga gtgtgtgtgt gtgtgagtct gtgtgtgaga atgaggggga 540gtgtgtgaga atgagaggga gtgtgtgtgt gtgtgagtct gtgtgtgaga atgaggggga 540

gtgtgttttg ggtgtgtgta tgagagcctt gtgtggatgt gagaatgaga gggagtgtgt 600600

atgtctgtga gtgtgagaat gagatggagt gtgtgtgagt ctgtgtgtga gaatgaggtg 660atgtctgtga gtgtgagaat gagatggagt gtgtgtgagt ctgtgtgtga gaatgaggtg 660

tgtgtgtgtg agaatgagat ggtgtgtgtg tgggaatgag agggggtgtg tgtctgagtg 720tgtgtgtgtg agaatgagat ggtgtgtgtg tgggaatgag agggggtgtg tgtctgagtg 720

tgagaatgag atagagtgtg tgtgagacag tctgtgggaa tgagagggag tgtgtgtgag 780tgagaatgag

agtgtgagaa tgacggagtg tgtctgtgag tgtgataatg aggtgtgtgt gagtctgagt 840agtgtgagaa tgacggagtg tgtctgtgag tgtgataatg aggtgtgtgt gagtctgagt 840

gtaagaatga gatggggtgt gtgtgtctgt gagtgtgaga gtgtgagaat gaggggtgtt 900gtaagaatga gatggggtgt gtgtgtctgt gagtgtgaga gtgtgagaat gaggggtgtt 900

tgtgtctgag tgtgagtctg tgagtgtgag aatgagatgg ggtgtgtgag tgagtgtgag 960tgtgtctgag tgtgagtctg tgagtgtgag aatgagatgg ggtgtgtgag tgagtgtgag 960

aatgagatgg ggtgtgtgtg tctgtgagtg tgtgtgtgtt tgtgagtgtg agaatgagat 10201020

ggggtgtgtg tgagtgtgag aatgagatgg ggtgtgtgtc tgtgtgtgag aatgagatgg 1080ggggtgtgtg tgagtgtgag aatgagatgg ggtgtgtgtc tgtgtgtgag aatgagatgg 1080

gtgtgtgtgt gacagagtct gagtgtgaga atgagaggga gtgtgtgtga gtgtgagaat 1140gtgtgtgtgt gacagagtct gagtgtgaga atgagaggga gtgtgtgtga gtgtgagaat 1140

gagaaggagt ggatgggtgt gtgagtctgt gtgaatgagg gagtgggtgt gtgtacgagt 12001200

gtgagtctgt gtttatgtgt gagaatgtgt cagtgtatgt gtgtgagaac gtgtgtatgt 12601260

gtgttagtgt gtgttgcgtg tgtgggggaa tgagagggat tgtgtctgtg agtgtgagaa 13201320

tgagatggag tgtctgtgag actgtgtgtg aggagtggga gtgtgtgtga gaatgagatg 1380tgagatggag tgtctgtgag actgtgtgtg aggagtggga gaatgagatg 1380

ggtgtgtgtg tctgagtgtg tgtctgtgag aatgagaggg agtgtgtgtg tgtgtgagag 1440ggtgtgtgtg tctgagtgtg tgtctgtgag aatgagaggg agtgtgtgtg tgtgtgagag 1440

cctgtgtgaa aatgagaagg agtgtggatg ggtgtttgtg agtgggagag tctgtgtgtt 1500cctgtgtgaa aatgagaagg agtgtggatg ggtgtttgtg agtgggagag tctgtgtgtt 1500

tatgtgtgtg agaatgaggg agtgtgggtg tgtgtgcgaa tgtgagtctg tgtttatgtg 15601560

tgtgagaatg tgtcagtgta tgtgagaacg tgtgtgttag tgtgttgcgt gtgtgagaat 16201620

gtaagtatat gtgtaagtgc atgtgagtgt gtgtatgtgc gtgttgtgtg aatgtgcatt 1680gtaagtatat gtgtaagtgc atgtgagtgt gtgtatgtgc gtgttgtgtg aatgtgcatt 1680

gtgtgtgcat gtgtgaaaga gtatatgtgt gttgtgggtg agtgtgtgtg gtgtgtgtag 1740gtgtgtgcat gtgtgaaaga gtatatgtgt gttgtgggtg agtgtgtgtg gtgtgtgtag 1740

tgggtgaggg tgtgttgtat gtgtgggtgt gcgttgtgtg aatgtgtgta tgtgggtgag 18001800

ggtgtgtgtg cctgtgtgag ggtgtgttgt ggtttttgtg tgtgtttggg tgagggtgtg 18601860

ttgtgtgtgt gtgtgggtga aggtgtgttg tgtgtgtcgt gggtgaaggt gtgttgtgtg 1920ttgtgtgtgt gtgtgggtga aggtgtgttg tgtgtgtcgt gggtgaaggt gtgttgtgtg 1920

tgtagtgact gtagattagg gtgtgttccg tgtgtgtgtg tgagggtgta tgttgtgggt 19801980 tgtagtgact gtagattagg gtgtgttccg tgtgtgtgtg

gttttgtgtg tgagtgggtg tgtaagggtg tgttgtgtgt atgtgggtta aggtgtgtta 2040gttttgtgtg tgagtgggtg tgtaagggtg tgttgtgtgt atgtgggtta aggtgtgtta 2040

tgcgtgaggg tgtattgtgt gtgtgttttg tgtgtgttgt gtgtatgtgg gttagggtgt 2100tgcgtgaggg tgtattgtgt gtgtgttttg tgtgtgttgt gtgtatgtgg gttagggtgt 2100

gttgtgtgtt tgtgtgtttt gtgtgttgtc tgtgtatgtg ggttacggtg tgttgtgcgt 21602160

gtgagggtgt gttgtgtatg gtgtgttgtg tgtgttgtgt gagtgtgtat gtgagttagg 22202220

gtgtgttgtg tctatgtatg tgtgtgtaag ggtgtgttgt gtgtctgtgg gtgtgttttg 2280gtgtgttgtg tctatgtatg tgtgtgtaag ggtgtgttgt gtgtctgtgg gtgtgttttg 2280

tgtatgtggg ttagggtgtg ttgtgtgttc tgtattgtgt gttttatgtg ttgtctgtat 23402340

gtgggttatg tgtgttgtgt gtgttgtgga tgtatgtggg ttagggtgtg ttgtgtgtct 2400gtgggttatg tgtgttgtgt gtgttgtgga tgtatgtggg ttagggtgtg ttgtgtgtct 2400

ctgtgtgttg tctgcgtttg tgtctgtggg ttagggtgtg ttgtatgtgt tgtgttttgt 24602460

gtgttgtccg tgtgtgtgta tgtgggttag gttgtgtgtg tgtgtgttgt atattgtctg 2520gtgttgtccg tgtgtgtgta tgtgggttag gttgtgtgtg tgtgtgttgt atattgtctg 2520

tgtgtgtgtg ttaggatgtg ttgtgtgtct gtgtgagtgt gtgtgtaagg gtgtgttgtg 25802580

tgtgtaggag tgtgtgtgtg tgtgtgtatg ggggtctctc aggccaactc cgctgctgtt 2640tgtgtaggag tgtgtgtgtg tgtgtgtatg ggggtctctc aggccaactc cgctgctgtt 2640

tgtggcaatg cgacgggtgt tcgggtccca gcaggaggat gtagggctga cctcgtttcc 2700tgtggcaatg cgacgggtgt tcgggtccca gcaggaggat gtagggctga cctcgtttcc 2700

cgtttccctc cccgtggttt ccgcatctcc tcccgctccc ctccgcccgg tctccccaga 2760cgtttccctc cccgtggttt ccgcatctcc tcccgctccc ctccgcccgg tctccccaga 2760

tcactccagc ctgctgctcc acgtgaagca gttcgtgtct gacctgcgga gcctgagctg 2820tcactccagc ctgctgctcc acgtgaagca gttcgtgtct gacctgcgga gcctgagctg 2820

tcagatggcg gcgctccagg gcaatggtaa ggaggccagc ccggcccgct ctctgcctcc 2880tcagatggcg gcgctccagg gcaatggtaa ggaggccagc ccggcccgct ctctgcctcc 2880

ccccttctct gggcagcgct tagcccctgc gccccgtttc tcccgctcag gctcagaaag 2940ccccttctct gggcagcgct tagcccctgc gccccgtttc tcccgctcag gctcagaaag 2940

gacctgctgc ccggtcaact gggtggagca cgagcgcagc tgctactggt tctctcgctc 3000gacctgctgc ccggtcaact gggtggagca cgagcgcagc tgctactggt tctctcgctc 3000

cgggaaggcc tgggctgacg ccgacaacta ctgccggctg gaggacgcgc acctggtggt 3060cgggaaggcc tgggctgacg ccgacaacta ctgccggctg gaggacgcgc acctggtggt 3060

ggtcacgtcc tgggaggagc aggtgaggac ccggagggtc tgggaggctg gctggcctcg 3120ggtcacgtcc tgggaggagc aggtgaggac ccggagggtc tgggaggctg gctggcctcg 3120

gagagatcac cacccgcctt ctctctcctc agaaatttgt ccagcaccac ataggccctg 31803180

tgaacacctg gatgggcctc cacgaccaaa acgggccctg gaagtgggtg gacgggacgg 3240tgaacacctg gatgggcctc cacgaccaaa acgggccctg gaagtgggtg gacgggacgg 3240

actacgagac gggcttcaag tgagtgcgcg ccctccctcg gcctgggtcc ggccgccttc 3300actacgagac gggcttcaag tgagtgcgcg ccctccctcg gcctgggtcc ggccgccttc 3300

gcgccctggg gccctgggct gaggagtctg gagcgacccg cctgcggatc cgacctcctg 3360gcgccctggg gccctgggct gaggagtctg gagcgacccg cctgcggatc cgacctcctg 3360

gggcccacag ctggctctgt ccccaggaac tggaggccgg agcagccgga cgactggtac 3420gggccccacag ctggctctgt ccccaggaac tggaggccgg agcagccgga cgactggtac 3420

ggccacgggc tcggaggagg cgaggactgt gcccacttca ccgacgacgg ccgctggaac 3480ggccacgggc tcggaggagg cgaggactgt gcccacttca ccgacgacgg ccgctggaac 3480

gacgacgtct gccagaggcc ctaccgctgg gtctgcgaga cagagctgga caaggccagc 3540gacgacgtct gccagaggcc ctaccgctgg gtctgcgaga cagagctgga caaggccagc 3540

caggagccac ctctccttta atttatttct tcaatgcctc gacctgccgc aggggtccgg 3600caggagccac ctctccttta atttatttct tcaatgcctc gacctgccgc aggggtccgg 3600

gattgggaat ccgcccatct gggggcctct tctgctttct cgggaatttt catctaggat 36603660

tttaagggaa ggggaaggat agggtgatgt tccgaaggtg aggagcttga aacccgtggc 3720tttaagggaa ggggaaggat agggtgatgt tccgaaggtg aggagcttga aacccgtggc 3720

gctttctgca gtttgcaggt tatcattgtg aacttttttt ttttaagagt aaaaagaaat 3780gctttctgca gtttgcaggt tatcattgtg aacttttttt ttttaagagt aaaaagaaat 3780

atacctaaac cttctgttag ttgtctggtt attggggatt cggaagcagg agtgggctgg 3840atacctaaac cttctgttag ttgtctggtt attggggatt cggaagcagg agtgggctgg 3840

ttggcattac gaagccttag cgggtgctgt ggcatcatga gaactgtgtg ggctttgggc 3900ttggcattac gaagccttag cgggtgctgt ggcatcatga gaactgtgtg ggctttgggc 3900

cagaatggcc agactttgtt atttacagat acgtgagttt gggcaaatta ttgttctctg 39603960

tgtcccagct gtaaacctcg agataacttc gtataatgta tgctatacga agttatgcta 4020tgtcccagct gtaaacctcg agataacttc gtataatgta tgctatacga agttatgcta 4020

gtaactataa cggtcctaag gtagcgagct agccgtggac agatacagca acgtgagcta 4080gtaactataa cggtcctaag gtagcgagct agccgtggac agatacagca acgtgagcta 4080

gttattctgt cctaaagtct cagttggaag atgggaggat ttttgacctc tgtctgctgg 4140gttattctgt cctaaagtct cagttggaag atgggaggat ttttgacctc tgtctgctgg 4140

gggcaggacc aaccaccagg gaactgcagc ccccctgtgc tgagtgcatc agagacttgg 4200gggcaggacc aaccaccagg gaactgcagc ccccctgtgc tgagtgcatc agagacttgg 4200

aatggaacac actggcctgc gacactcatc acaacgaaca gaaactgctt tgtacactga 4260aatggaacac actggcctgc gacactcatc acaacgaaca gaaactgctt tgtacactga 4260

ataaacgcag tgaataccca gctcaggatc acagacacat gaatgcaaag ttatattagt 4320ataaacgcag tgaataccca gctcaggatc acagacacat gaatgcaaag ttatattagt 4320

ataaccaagg gtgggaatga gggcaattac agataactta tagacatgaa ttactaacaa 4380ataaccaagg gtgggaatga gggcaattac agataactta tagacatgaa ttactaacaa 4380

aacagggcaa aatgtttgct cataaataac atgaaaatac aatatatagt catatgtata 4440aacagggcaa aatgtttgct cataaataac atgaaaatac aatatatagt catatgtata 4440

tatacatgta tatatataaa tgacataata tgtatatatt tttacaaata cactgcagga 4500tatacatgta tatatataaa tgacataata tgtatatatt tttacaaata cactgcagga 4500

aaataatatt tttcctctac agaagagatt ggcaaatctg acatctaaaa t 4551aaataatatt ttttcctctac agaagagatt ggcaaatctg acatctaaaa t 4551

210 25210 25

211 10211 10

212 БЕЛОК212 PROTEIN

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 25400 25

Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu

1 5 10 1 5 10

210 26210 26

211 30211 30

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 26400 26

gaacaaaaac tcatctcaga agaggatctg 30gaacaaaaac tcatctcaga agaggatctg 30

210 27210 27

211 63211 63

212 БЕЛОК212 PROTEIN

213 Homo sapiens213 Homo sapiens

400 27400 27

Ser Gln Asn Ser Gln Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Ser Gln Asn Ser Gln Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr

1 5 10 15 1 5 10 15

Phe Ser Asn Phe Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Phe Ser Asn Phe Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser

20 25 30 20 25 30

Thr Gln Gly Gly Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Thr Gln Gly Gly Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln

35 40 45 35 40 45

Leu Glu Lys Gln Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Glu Lys Gln Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu

50 55 60 50 55 60

210 28210 28

211 118211 118

212 БЕЛОК212 PROTEIN

213 Homo sapiens213 Homo sapiens

400 28400 28

His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala

1 5 10 15 1 5 10 15

Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val

20 25 30 20 25 30

Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val

35 40 45 35 40 45

Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val

50 55 60 50 55 60

Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln

65 70 75 80 65 70 75 80

Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala

85 90 95 85 90 95

His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro

100 105 110 100 105 110

Tyr Arg Trp Val Cys Glu Tyr Arg Trp Val Cys Glu

115 115

210 29210 29

211 39211 39

212 БЕЛОК212 PROTEIN

213 Mus musculus213 Mus muscle

400 29400 29

Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Asp Asn Asp Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Asp Asn Asp

1 5 10 15 1 5 10 15

His His Gln Leu Arg Arg Gly Pro Pro Pro Thr Pro Arg Leu Leu Gln His His Gln Leu Arg Arg Gly Pro Pro Thr Pro Arg Leu Leu Gln

20 25 30 20 25 30

Arg Leu Cys Ser Gly Ser Arg Arg Leu Cys Ser Gly Ser Arg

35 35

210 30210 30

211 21211 21

212 БЕЛОК212 PROTEIN

213 Mus musculus213 Mus muscle

400 30400 30

Leu Leu Leu Leu Ser Ser Ser Leu Ser Ile Leu Leu Leu Val Val Val Leu Leu Leu Leu Ser Ser Ser Leu Ser Ile Leu Leu Leu Val Val Val

1 5 10 15 1 5 10 15

Cys Val Ile Thr Ser Cys Val Ile Thr Ser

20 20

210 31210 31

211 229211 229

212 БЕЛОК212 PROTEIN

213 Homo sapiens213 Homo sapiens

400 31400 31

Asn Ser Gln Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Phe Ser Asn Ser Gln Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Phe Ser

1 5 10 15 1 5 10 15

Asn Phe Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Asn Phe Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln

20 25 30 20 25 30

Gly Gly Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Gly Gly Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu

35 40 45 35 40 45

Lys Gln Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Lys Gln Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His

50 55 60 50 55 60

Val Lys Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Val Lys Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala

65 70 75 80 65 70 75 80

Ala Leu Gln Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Val Asn Trp Ala Leu Gln Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Val Asn Trp

85 90 95 85 90 95

Val Glu His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Val Glu His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala

100 105 110 100 105 110

Trp Ala Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Trp Ala Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val

115 120 125 115 120 125

Val Val Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Val Val Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly

130 135 140 130 135 140

Pro Val Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Pro Val Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys

145 150 155 160 145 150 155 160

Trp Val Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Trp Val Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro

165 170 175 165 170 175

Glu Gln Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Glu Gln Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp

180 185 190 180 185 190

Cys Ala His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Cys Ala His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln

195 200 205 195 200 205

Arg Pro Tyr Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Arg Pro Tyr Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln

210 215 220 210 215 220

Glu Pro Pro Leu Leu Glu Pro Pro Leu Leu

225 225

210 32210 32

211 20211 20

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 32400 32

ggagtaccag ctcccgtacg 20ggagtaccag ctcccgtacg 20

210 33210 33

211 43211 43

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 33400 33

ctcttctgag atgagttttt gttcgttgcc tctctggagg ttg 43ctcttctgagg atgagttttt gttcgttgcc tctctgggagg ttg 43

210 34210 34

211 43211 43

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 34400 34

aaactcatct cagaagagga tctgagacaa gcagctaccg cag 43aaactcatct cagaagagga tctgagacaa gcagctaccg cag 43

210 35210 35

211 18211 18

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 35400 35

tccgcccgct gtttaaac 18tccgcccgct gtttaaac 18

210 36210 36

211 21211 21

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 36400 36

ggaaccccta gtgatggagt t 21ggaacccta gtgatggagt t 21

210 37210 37

211 16211 16

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 37400 37

cggcctcagt gagcga 16cggcctcagt gagcga 16

210 38210 38

211 21211 21

212 ДНК212 DNA

213 Искусственная последовательность213 Artificial sequence

220220

223 Синтетическая223 Synthetic

400 38400 38

cactccctct ctgcgcgctc g 21cactccctct ctgcgcgctc g 21

210 39210 39

211 291211 291

212 БЕЛОК212 PROTEIN

213 Macaca fascicularis213 Macaca fascicularis

400 39400 39

Met Thr Lys Glu Tyr Gln Asp Leu Gln His Leu Asp Asn Glu Glu Ser Met Thr Lys Glu Tyr Gln Asp Leu Gln His Leu Asp Asn Glu Glu Ser

1 5 10 15 1 5 10 15

Asp His His Gln Leu Gly Lys Gly Pro Pro Pro Pro Gln Ser Leu Leu Asp His His Gln Leu Gly Lys Gly Pro Pro Pro Pro Gln Ser Leu Leu

20 25 30 20 25 30

Arg Arg Leu Cys Ser Gly Pro Arg Leu Leu Leu Leu Ser Leu Gly Leu Arg Arg Leu Cys Ser Gly Pro Arg Leu Leu Leu Leu Ser Leu Gly Leu

35 40 45 35 40 45

Ser Leu Leu Leu Leu Val Val Val Cys Val Ile Gly Ser Gln Asn Ala Ser Leu Leu Leu Leu Val Val Val Cys Val Ile Gly Ser Gln Asn Ala

50 55 60 50 55 60

Gln Leu Gln Arg Glu Leu Arg Gly Leu Arg Glu Thr Leu Ser Asn Phe Gln Leu Gln Arg Glu Leu Arg Gly Leu Arg Glu Thr Leu Ser Asn Phe

65 70 75 80 65 70 75 80

Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Gly Gly Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Gly Gly

85 90 95 85 90 95

Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Lys Gln Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Lys Gln

100 105 110 100 105 110

Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Val Lys Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Val Lys

115 120 125 115 120 125

Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Ala Leu Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Ala Leu

130 135 140 130 135 140

Gln Gly Asn Gly Ser Glu Arg Ala Cys Cys Pro Val Asn Trp Val Glu Gln Gly Asn Gly Ser Glu Arg Ala Cys Cys Pro Val Asn Trp Val Glu

145 150 155 160 145 150 155 160

His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala

165 170 175 165 170 175

Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val

180 185 190 180 185 190

Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val

195 200 205 195 200 205

Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val

210 215 220 210 215 220

Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln

225 230 235 240 225 230 235 240

Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala

245 250 255 245 250 255

His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro

260 265 270 260 265 270

Tyr Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Glu Pro Tyr Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Glu Pro

275 280 285 275 280 285

Pro Leu Leu Pro Leu Leu

290 290

210 40210 40

211 876211 876

212 ДНК212 DNA

213 Macaca fascicularis213 Macaca fascicularis

400 40400 40

atgaccaagg agtatcagga cctgcagcat ctggacaatg aggagagtga ccaccatcag 60atgaccaagg agtatcagga cctgcagcat ctggacaatg aggagagtga ccaccatcag 60

ctcggaaaag ggccacctcc tccgcagtcc ctcctgcggc gtctctgctc cggccctcgc 120ctcggaaaag ggccacctcc tccgcagtcc ctcctgcggc gtctctgctc cggccctcgc 120

ctcctcctgc tctccctggg cctcagcctc ctgctgctgg tggttgtctg tgtgatcgga 180ctcctcctgc tctccctggg cctcagcctc ctgctgctgg tggttgtctg tgtgatcgga 180

tcccaaaacg cccagctgca gcgggagctg cggggcctga gagagacgct cagcaacttc 240tcccaaaacg cccagctgca gcgggagctg cggggcctga gagagacgct cagcaacttc 240

acagcgagca ccgaggccca ggtcaagggc ttgagcaccc agggaggcaa tgtgggaaga 300acagcgagca ccgaggccca ggtcaagggc ttgagcaccc agggaggcaa tgtgggaaga 300

aagatgaagt cgctggagtc ccagctggag aaacagcaga aggacttgag tgaagatcac 360aagatgaagt cgctggagtc ccagctggag aaacagcaga aggacttgag tgaagatcac 360

tccagcctgc tgctccacgt gaagcagttc gtgtctgacc tgcggagcct gagctgtcag 420tccagcctgc tgctccacgt gaagcagttc gtgtctgacc tgcggagcct gagctgtcag 420

atggcggcgc tccagggcaa tggctcggaa agggcctgct gcccagtcaa ctgggtggag 480atggcggcgc tccagggcaa tggctcggaa agggcctgct gcccagtcaa ctgggtggag 480

cacgagcgca gctgctactg gttctctcgc tccgggaagg cctgggccga cgccgacaac 540cacgagcgca gctgctactg gttctctcgc tccgggaagg cctgggccga cgccgacaac 540

tactgccggc tggaggacgc gcacctggtg gtggtcacgt cctgggagga gcagaaattt 600tactgccggc tggaggacgc gcacctggtg gtggtcacgt cctgggagga gcagaaattt 600

gtccagcacc acataggtcc tgtgaacacc tggatgggcc tccacgacca aaacgggccc 660gtccagcacc acataggtcc tgtgaacacc tggatgggcc tccacgacca aaacgggccc 660

tggaagtggg tggacgggac ggactacgag acgggcttca agaactggag accggagcag 720tggaagtggg tggacgggac ggactacgag acgggcttca agaactggag accggagcag 720

ccggacgact ggtacggcca cgggctcggg ggaggggagg actgtgccca cttcaccgac 780ccggacgact ggtacggcca cgggctcggg ggaggggagg actgtgccca cttcaccgac 780

gacggccgct ggaacgacga cgtctgccag aggccctacc gctgggtctg cgagacagag 840gacggccgct ggaacgacga cgtctgccag aggccctacc gctgggtctg cgagacagag 840

ctggacaagg ccagtcagga gccacctctc ctttaa 876ctggacaagg ccagtcagga gccacctctc ctttaa 876

210 41210 41

211 284211 284

212 БЕЛОК212 PROTEIN

213 Rattus norvegicus213 Rattus norvegicus

400 41400 41

Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Glu Asn Asp Met Thr Lys Asp Tyr Gln Asp Phe Gln His Leu Asp Asn Glu Asn Asp

1 5 10 15 1 5 10 15

His His Gln Leu Gln Arg Gly Pro Pro Pro Ala Pro Arg Leu Leu Gln His His Gln Leu Gln Arg Gly Pro Pro Pro Ala Pro Arg Leu Leu Gln

20 25 30 20 25 30

Arg Leu Cys Ser Gly Phe Arg Leu Phe Leu Leu Ser Leu Gly Leu Ser Arg Leu Cys Ser Gly Phe Arg Leu Phe Leu Leu Ser Leu Gly Leu Ser

35 40 45 35 40 45

Ile Leu Leu Leu Val Val Val Cys Val Ile Thr Ser Gln Asn Ser Gln Ile Leu Leu Leu Val Val Val Cys Val Ile Thr Ser Gln Asn Ser Gln

50 55 60 50 55 60

Leu Arg Glu Asp Leu Arg Val Leu Arg Gln Asn Phe Ser Asn Phe Thr Leu Arg Glu Asp Leu Arg Val Leu Arg Gln Asn Phe Ser Asn Phe Thr

65 70 75 80 65 70 75 80

Val Ser Thr Glu Asp Gln Val Lys Ala Leu Thr Thr Gln Gly Glu Arg Val Ser Thr Glu Asp Gln Val Lys Ala Leu Thr Thr Gln Gly Glu Arg

85 90 95 85 90 95

Val Gly Arg Lys Met Lys Leu Val Glu Ser Gln Leu Glu Lys His Gln Val Gly Arg Lys Met Lys Leu Val Glu Ser Gln Leu Glu Lys His Gln

100 105 110 100 105 110

Glu Asp Leu Arg Glu Asp His Ser Arg Leu Leu Leu His Val Lys Gln Glu Asp Leu Arg Glu Asp His Ser Arg Leu Leu Leu His Val Lys Gln

115 120 125 115 120 125

Leu Val Ser Asp Val Arg Ser Leu Ser Cys Gln Met Ala Ala Leu Arg Leu Val Ser Asp Val Arg Ser Leu Ser Cys Gln Met Ala Ala Leu Arg

130 135 140 130 135 140

Gly Asn Gly Ser Glu Arg Ile Cys Cys Pro Ile Asn Trp Val Glu Tyr Gly Asn Gly Ser Glu Arg Ile Cys Cys Pro Ile Asn Trp Val Glu Tyr

145 150 155 160 145 150 155 160

Glu Gly Ser Cys Tyr Trp Phe Ser Ser Ser Val Lys Pro Trp Thr Glu Glu Gly Ser Cys Tyr Trp Phe Ser Ser Ser Val Lys Pro Trp Thr Glu

165 170 175 165 170 175

Ala Asp Lys Tyr Cys Gln Leu Glu Asn Ala His Leu Val Val Val Thr Ala Asp Lys Tyr Cys Gln Leu Glu Asn Ala His Leu Val Val Val Thr

180 185 190 180 185 190

Ser Trp Glu Glu Gln Arg Phe Val Gln Gln His Met Gly Pro Leu Asn Ser Trp Glu Glu Gln Arg Phe Val Gln Gln His Met Gly Pro Leu Asn

195 200 205 195 200 205

Thr Trp Ile Gly Leu Thr Asp Gln Asn Gly Pro Trp Lys Trp Val Asp Thr Trp Ile Gly Leu Thr Asp Gln Asn Gly Pro Trp Lys Trp Val Asp

210 215 220 210 215 220

Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Gly Gln Pro Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Gly Gln Pro

225 230 235 240 225 230 235 240

Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala His Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala His

245 250 255 245 250 255

Phe Thr Thr Asp Gly His Trp Asn Asp Asp Val Cys Arg Arg Pro Tyr Phe Thr Thr Asp Gly His Trp Asn Asp Asp Val Cys Arg Arg Pro Tyr

260 265 270 260 265 270

Arg Trp Val Cys Glu Thr Glu Leu Gly Lys Ala Asn Arg Trp Val Cys Glu Thr Glu Leu Gly Lys Ala Asn

275 280 275 280

210 42210 42

211 855211 855

212 ДНК212 DNA

213 Rattus norvegicus213 Rattus norvegicus

400 42400 42

atgacaaagg attatcaaga tttccagcac ttggacaatg agaacgacca ccatcaactc 60atgacaaagg attatcaaga tttccagcac ttggacaatg agaacgacca ccatcaactc 60

cagagagggc cacctcccgc tccaaggctc ttgcagcgac tctgctctgg attccgtctc 120cagagagggc cacctcccgc tccaaggctc ttgcagcgac tctgctctgg attccgtctc 120

ttcctgcttt ccctgggcct cagcatcctg ctgctggtgg ttgtctgtgt gatcacatcc 180ttcctgcttt ccctggggcct cagcatcctg ctgctggtgg ttgtctgtgt gatcacatcc 180

caaaattccc aactccggga agatctgcgg gttctaaggc agaatttcag caactttacc 240caaaattccc aactccggga agatctgcgg gttctaaggc agaatttcag caactttacc 240

gtgagcactg aggaccaggt caaggccctg accacccagg gagagagagt gggaagaaag 300gtgagcactg aggaccaggt caaggccctg accacccagg gagagagagt gggaagaaag 300

atgaagttag tcgagtcaca gctggaaaaa catcaggagg atctgaggga agaccactct 360atgaagttag tcgagtcaca gctggaaaaa catcaggagg atctgaggga agaccactct 360

agattgctac tgcatgtaaa gcagttagtg tctgacgtgc gaagcttgag ctgccagatg 420agattgctac tgcatgtaaa gcagttagtg tctgacgtgc gaagcttgag ctgccagatg 420

gccgcacttc ggggcaatgg ctctgaaagg atctgctgcc ccatcaactg ggtggagtat 480gccgcacttc ggggcaatgg ctctgaaagg atctgctgcc ccatcaactg ggtggagtat 480

gaaggcagct gctactggtt ctccagctct gtgaagcctt ggacggaagc tgacaagtac 540gaaggcagct gctactggtt ctccagctct gtgaagcctt ggacggaagc tgacaagtac 540

tgccagctgg agaacgccca cctggtggtg gtgacttcct gggaggagca gagattcgtc 600tgccagctgg agaacgccca cctggtggtg gtgacttcct gggaggagca gagattcgtc 600

cagcaacaca tgggcccctt aaatacttgg attggcctaa ctgaccagaa cggaccctgg 660cagcaacaca tgggcccctt aaatacttgg attggcctaa ctgaccagaa cggaccctgg 660

aaatgggtgg atgggacaga ctatgagaca ggcttcaaga actggagacc agggcagcca 720aaatgggtgg atgggacaga ctatgagaca ggcttcaaga actggagacc agggcagcca 720

gatgactggt acggacatgg gcttggaggg ggtgaagact gtgcccactt caccaccgat 780gatgactggt acggacatgg gcttggaggg ggtgaagact gtgcccactt caccaccgat 780

ggccactgga atgatgacgt ctgcaggagg ccctaccgct gggtctgtga gacagagttg 840ggccactgga atgatgacgt ctgcaggagg ccctaccgct gggtctgtga gacagagttg 840

ggcaaggcca attag 855ggcaaggcca attag 855

<---<---

Claims (39)

1. Животное, отличное от человека, содержащее генетически модифицированный эндогенный локус Asgr1, который содержит эндогенный промотор Asgr1, где животное, отличное от человека представляет собой грызуна, где эндогенный промотор Asgr1 функционально связан с нуклеиновой кислотой, кодирующий модифицированный белок Asgr1, где модифицированный белок Asgr1 содержит цитоплазматический домен, трансмембранный домен и внеклеточный домен, где внеклеточный домен содержит суперспиральный домен,1. A non-human animal comprising a genetically modified endogenous Asgr1 locus that contains an endogenous Asgr1 promoter, wherein the non-human animal is a rodent, wherein the endogenous Asgr1 promoter is operably linked to a nucleic acid encoding a modified Asgr1 protein, wherein the modified Asgr1 protein contains a cytoplasmic domain, a transmembrane domain and an extracellular domain, where the extracellular domain contains a supercoiled domain, где:Where: (i) весь внеклеточный домен кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека, или(i) the entire extracellular domain is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced with an orthologous human ASGR1 sequence, or (ii) весь суперспиральный домен кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека, и(ii) the entire supercoil domain is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced with an orthologous human ASGR1 sequence, and где животное, отличное от человека, экспрессирует модифицированный белок Asgr1.wherein the non-human animal expresses the modified Asgr1 protein. 2. Животное, отличное от человека, по п. 1, где внеклеточный домен содержит суперспиральный домен и лектиновый домен С-типа и весь лектиновый домен С-типа или его часть кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека.2. A non-human animal according to claim 1, wherein the extracellular domain comprises a supercoiled domain and a C-type lectin domain, and all or part of the C-type lectin domain is encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced by an orthologous human ASGR1 sequence . 3. Животное, отличное от человека, по п. 2, где лектиновый домен С-типа представляет собой лектиновый домен С-типа ASGR1 человека.3. The non-human animal of claim 2, wherein the C-type lectin domain is the C-type lectin domain of human ASGR1. 4. Животное, отличное от человека, по п. 2 или 3, где лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28.4. A non-human animal according to claim 2 or 3, wherein the C-type lectin domain contains the sequence set forth under SEQ ID NO: 28. 5. Животное, отличное от человека, по любому из пп. 1-4, где суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27.5. An animal other than a human, according to any one of paragraphs. 1-4, where the supercoiled domain contains the sequence set forth under SEQ ID NO: 27. 6. Животное, отличное от человека, по любому из пп. 2-5, где лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28, и суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27.6. An animal other than a human, according to any one of paragraphs. 2-5, wherein the C-type lectin domain contains the sequence set forth in SEQ ID NO: 28 and the supercoiled domain contains the sequence set forth in SEQ ID NO: 27. 7. Животное, отличное от человека, по любому из предыдущих пунктов, где ортологичная последовательность ASGR1 человека содержит экзоны 3-8 гена ASGR1 человека.7. A non-human animal according to any one of the preceding claims, wherein the orthologous human ASGR1 sequence comprises exons 3-8 of the human ASGR1 gene. 8. Животное, отличное от человека, по п. 7, где ортологичная последовательность ASGR1 человека кодирует сегмент белка ASGR1, содержащий последовательность, изложенную под SEQ ID NO: 31.8. The non-human animal of claim 7, wherein the orthologous human ASGR1 sequence encodes an ASGR1 protein segment containing the sequence set forth under SEQ ID NO: 31. 9. Животное, отличное от человека, по любому из предыдущих пунктов, где весь цитоплазматический домен или его часть кодируется эндогенной последовательностью Asgr1 животного, отличного от человека.9. A non-human animal according to any one of the preceding claims, wherein all or part of the cytoplasmic domain is encoded by the endogenous Asgr1 sequence of the non-human animal. 10. Животное, отличное от человека, по любому из предыдущих пунктов, где весь трансмембранный домен или его часть кодируется эндогенной последовательностью Asgr1 животного, отличного от человека.10. A non-human animal according to any one of the preceding claims, wherein all or part of the transmembrane domain is encoded by the endogenous Asgr1 sequence of the non-human animal. 11. Животное, отличное от человека, по п. 9 или 10, где как весь цитоплазматический домен, так и весь трансмембранный домен или часть и того и другого кодируются эндогенной последовательностью Asgr1 животного, отличного от человека.11. A non-human animal according to claim 9 or 10, wherein both the entire cytoplasmic domain and the entire transmembrane domain, or part of both, are encoded by the endogenous Asgr1 sequence of the non-human animal. 12. Животное, отличное от человека, по любому из предыдущих пунктов, где животное, отличное от человека, является гетерозиготным по генетически модифицированному эндогенному локусу Asgr1.12. The non-human animal according to any one of the preceding claims, wherein the non-human animal is heterozygous for the genetically modified endogenous Asgr1 locus. 13. Животное, отличное от человека, по любому из пп. 1-11, где животное, отличное от человека, является гомозиготным по генетически модифицированному эндогенному локусу Asgr1.13. An animal other than a human, according to any one of paragraphs. 1-11, wherein the non-human animal is homozygous for the genetically modified endogenous Asgr1 locus. 14. Животное, отличное от человека, по любому из пп. 1-13, где животное, отличное от человека, представляет собой крысу или мышь.14. An animal other than a human, according to any one of paragraphs. 1-13, where the non-human animal is a rat or mouse. 15. Животное, отличное от человека, по любому из пп. 1-4, где животное, отличное от человека, представляет собой мышь.15. An animal other than a human, according to any one of paragraphs. 1-4, where the non-human animal is a mouse. 16. Животное, отличное от человека, по п. 15, где весь цитоплазматический домен или его часть кодируется эндогенной последовательностью Asgr1 мыши.16. The non-human animal of claim 15, wherein all or part of the cytoplasmic domain is encoded by the endogenous murine Asgr1 sequence. 17. Животное, отличное от человека, по п. 16, где цитоплазматический домен содержит последовательность, изложенную под SEQ ID NO: 29.17. A non-human animal according to claim 16, wherein the cytoplasmic domain contains the sequence set forth under SEQ ID NO: 29. 18. Животное, отличное от человека, по п. 15, где весь трансмембранный домен или его часть кодируется эндогенной последовательностью Asgr1 мыши.18. The non-human animal of claim 15, wherein all or part of the transmembrane domain is encoded by the endogenous mouse Asgr1 sequence. 19. Животное, отличное от человека, по п. 18, где трансмембранный домен содержит последовательность, изложенную под SEQ ID NO: 30.19. A non-human animal according to claim 18, wherein the transmembrane domain contains the sequence set forth under SEQ ID NO: 30. 20. Животное, отличное от человека, по любому из пп. 16-19, где как весь цитоплазматический домен, так и весь трансмембранный домен или часть и того и другого кодируется эндогенной последовательностью Asgr1 мыши.20. An animal other than a human, according to any one of paragraphs. 16-19, where either all of the cytoplasmic domain or all of the transmembrane domain, or part of both, is encoded by the endogenous mouse Asgr1 sequence. 21. Животное, отличное от человека, по п. 20, где цитоплазматический домен содержит последовательность, изложенную под SEQ ID NO: 29, и трансмембранный домен содержит последовательность, изложенную под SEQ ID NO: 30.21. A non-human animal according to claim 20, wherein the cytoplasmic domain contains the sequence set forth in SEQ ID NO: 29 and the transmembrane domain contains the sequence set forth in SEQ ID NO: 30. 22. Животное, отличное от человека, по любому из пп. 14-21, где внеклеточный домен содержит суперспиральный домен и лектиновый домен С-типа и где как весь суперспиральный домен, так и весь лектиновый домен С-типа или часть и того и другого кодируется сегментом эндогенного локуса Asgr1, который был удален и заменен ортологичной последовательностью ASGR1 человека, и при этом как весь цитоплазматический домен, так и весь трансмембранный домен или часть и того и другого кодируется эндогенной последовательностью Asgr1 мыши.22. An animal other than a human, according to any one of paragraphs. 14-21, where the extracellular domain contains a supercoiled domain and a C-type lectin domain, and where both the entire supercoil domain and the entire C-type lectin domain, or part of both, are encoded by a segment of the endogenous Asgr1 locus that has been deleted and replaced by an orthologous sequence Human ASGR1, and both the entire cytoplasmic domain and the entire transmembrane domain, or part of both, are encoded by the endogenous mouse Asgr1 sequence. 23. Животное, отличное от человека, по любому из пп. 14-22, где лектиновый домен С-типа представляет собой лектиновый домен С-типа ASGR1 человека и суперспиральный домен представляет собой суперспиральный домен ASGR1 человека, цитоплазматический домен представляет собой цитоплазматический домен Asgr1 мыши, а трансмембранный домен представляет собой трансмембранный домен Asgr1 мыши.23. An animal other than a human, according to any one of paragraphs. 14-22, wherein the C-type lectin domain is the C-type lectin domain of human ASGR1 and the supercoil domain is the human ASGR1 supercoil domain, the cytoplasmic domain is the mouse Asgr1 cytoplasmic domain, and the transmembrane domain is the mouse Asgr1 transmembrane domain. 24. Животное, отличное от человека, по п. 22 или 23, где лектиновый домен С-типа содержит последовательность, изложенную под SEQ ID NO: 28, суперспиральный домен содержит последовательность, изложенную под SEQ ID NO: 27, цитоплазматический домен содержит последовательность, изложенную под SEQ ID NO: 29, и трансмембранный домен содержит последовательность, изложенную под SEQ ID NO: 30.24. A non-human animal according to claim 22 or 23, wherein the C-type lectin domain contains the sequence set forth in SEQ ID NO: 28, the supercoiled domain contains the sequence set forth in SEQ ID NO: 27, the cytoplasmic domain contains the sequence set forth under SEQ ID NO: 29, and the transmembrane domain contains the sequence set forth under SEQ ID NO: 30. 25. Животное, отличное от человека, по п. 24, где модифицированный белок Asgr1 содержит последовательность, изложенную под SEQ ID NO: 3.25. A non-human animal according to claim 24, wherein the modified Asgr1 protein contains the sequence set forth under SEQ ID NO: 3. 26. Способ оценки доставки терапевтического комплекса в печень посредством интернализации, опосредованной ASGR1 человека, in vivo, предусматривающий:26. A method for assessing the delivery of a therapeutic complex to the liver through human ASGR1-mediated internalization in vivo, comprising: (a) введение терапевтического комплекса животному, отличному от человека, по любому из пп. 1-25, где терапевтический комплекс содержит терапевтическую молекулу и антигенсвязывающий белок или лиганд, которые специфически связывают ASGR1 человека; и(a) administering a therapeutic complex to a non-human animal according to any one of paragraphs. 1-25, wherein the therapeutic complex comprises a therapeutic molecule and an antigen-binding protein or ligand that specifically binds human ASGR1; And (b) оценку доставки терапевтической молекулы в печень животного, отличного от человека.(b) evaluating delivery of the therapeutic molecule to the liver of a non-human animal. 27. Способ по п. 26, где терапевтическая молекула представляет собой лизосомальный заместительный белок, или фермент, или нуклеиновую кислоту, кодирующую лизосомальный заместительный белок или фермент, и стадия (b) предусматривает оценку присутствия или активности лизосомального заместительного белка или фермента в печени животного, отличного от человека.27. The method of claim 26, wherein the therapeutic molecule is a lysosomal replacement protein or enzyme or nucleic acid encoding a lysosomal replacement protein or enzyme, and step (b) involves assessing the presence or activity of the lysosomal replacement protein or enzyme in the animal's liver, different from man. 28. Способ по п. 26, где терапевтическая молекула представляет собой нуклеиновую кислоту, кодирующую терапевтический секретируемый белок, и стадия (b) предусматривает оценку уровней в сыворотке крови или активности терапевтического секретируемого белка у животного, отличного от человека.28. The method of claim 26, wherein the therapeutic molecule is a nucleic acid encoding a therapeutic secreted protein, and step (b) involves assessing serum levels or activity of the therapeutic secreted protein in a non-human animal. 29. Способ оценки эффективности терапевтической молекулы для целенаправленного воздействия на белок в отношении интернализации в печени посредством ASGR1 человека in vivo, предусматривающий:29. A method for evaluating the effectiveness of a therapeutic molecule for targeting a protein with respect to internalization in the liver by human ASGR1 in vivo, comprising: (a) введение терапевтической молекулы животному, отличному от человека, по любому из пп. 1-25, где терапевтическая молекула содержит биспецифический антигенсвязывающий белок, который специфически связывает белок и специфически связывает ASGR1 человека; и(a) administering a therapeutic molecule to a non-human animal according to any one of paragraphs. 1-25, wherein the therapeutic molecule comprises a bispecific antigen-binding protein that specifically binds the protein and specifically binds human ASGR1; And (b) оценку уровней на клеточной поверхности, активности или экспрессии белка в печени животного, отличного от человека.(b) assessing cell surface levels, activity, or expression of a protein in the liver of a non-human animal. 30. Способ по п. 29, где белок представляет собой поверхностный белок клеток печени и стадия (b) предусматривает оценку уровней на клеточной поверхности или активности поверхностного белка клеток в печени животного, отличного от человека.30. The method of claim 29, wherein the protein is a liver cell surface protein and step (b) is to assess cell surface protein levels or activity in the liver of a non-human animal. 31. Способ по п. 29, где белок представляет собой растворимый белок и стадия (b) предусматривает оценку экспрессии или активности растворимого белка в печени животного, отличного от человека.31. The method of claim 29, wherein the protein is a soluble protein and step (b) involves assessing the expression or activity of the soluble protein in the liver of a non-human animal.
RU2020101936A 2017-06-27 2018-06-27 Non-human animals containing the humanized asgr1 locus RU2796949C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762525524P 2017-06-27 2017-06-27
US62/525,524 2017-06-27
PCT/US2018/039864 WO2019006034A1 (en) 2017-06-27 2018-06-27 Non-human animals comprising a humanized asgr1 locus

Publications (3)

Publication Number Publication Date
RU2020101936A RU2020101936A (en) 2021-07-27
RU2020101936A3 RU2020101936A3 (en) 2022-03-01
RU2796949C2 true RU2796949C2 (en) 2023-05-29

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009019312A2 (en) * 2007-08-09 2009-02-12 Boehringer Ingelheim International Gmbh Anti cd37 antibodies
RU2425880C2 (en) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Method of producing transgene mice
WO2014023709A1 (en) * 2012-08-09 2014-02-13 Roche Glycart Ag Asgpr antibodies and uses thereof
WO2017087780A1 (en) * 2015-11-20 2017-05-26 Regeneron Pharmaceuticals, Inc. Non-human animals having a humanized lymphocyte-activation gene 3

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009019312A2 (en) * 2007-08-09 2009-02-12 Boehringer Ingelheim International Gmbh Anti cd37 antibodies
RU2425880C2 (en) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Method of producing transgene mice
WO2014023709A1 (en) * 2012-08-09 2014-02-13 Roche Glycart Ag Asgpr antibodies and uses thereof
WO2017087780A1 (en) * 2015-11-20 2017-05-26 Regeneron Pharmaceuticals, Inc. Non-human animals having a humanized lymphocyte-activation gene 3

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SIBYLLE SABRAUTZKI et al. New mouse models for metabolic bone diseases generated by genome-wide ENU mutagenesis, Mamm Genome, 2012, 23, pp.416-430. *

Similar Documents

Publication Publication Date Title
US20230345919A1 (en) Non-human animals comprising a humanized asgr1 locus
JP2022527809A (en) Methods and compositions for inserting antibody coding sequences into safe harbor loci
KR20110020860A (en) Method of generating single vl domain antibodies in transgenic animals
JP2021500867A (en) Non-human animals containing the humanized TTR locus and how to use
JP2020533957A (en) CRISPR Reporter Non-Human Animals and Their Use
CN111655031B (en) Non-human animals comprising humanized TRKB loci
KR20220016869A (en) Non-Human Animals Comprising a Humanized TTR Locus with Beta-Slip Mutations and Methods of Use
US20230232796A1 (en) Non-human animals comprising a humanized ace2 locus
RU2796949C2 (en) Non-human animals containing the humanized asgr1 locus
RU2800428C2 (en) NON-HUMAN ANIMALS CONTAINING THE HUMANIZED TrkB LOCUS
US20230257432A1 (en) Compositions and methods for screening 4r tau targeting agents
RU2782358C2 (en) Cas-expressing mouse embryonic stem cells, and mice and their use
US20230081547A1 (en) Non-human animals comprising a humanized klkb1 locus and methods of use
WO2023081847A1 (en) Non-human animals comprising a modified cacng1 locus
WO2024026488A2 (en) Non-human animals comprising a modified transferrin receptor locus